ทวีตที่ปักหมุด
Iaiso
8.4K posts

Iaiso
@laiso
Software Engineer Blog: https://t.co/TM0JhN2kmm GitHub: https://t.co/oGEb7wF1lc
Bangkok เข้าร่วม Mayıs 2008
657 กำลังติดตาม6.6K ผู้ติดตาม

1個20分もかかる
github.com/laiso/ts-bench…
SWE Lanscer のタスクは200弱あるからつまり述べ数時間かかるのか(あとAPI代金も)
CIの達人みたいな人が早くしてくれないものか
日本語

cognition.ai/blog/devin-can…
Devin版のAgent Teams、プロセスじゃなくてマシンのインスタンスが複数動くみたいですごそうだ
日本語

github.com/openai/codex-p…
プラグインのパーミッションの設計悩んでたので参考になる。このプラグインの例だとmjs突っ込んでnodeコマンド全許可してるなぁ。スキルは内部呼び出し用に設置していた
日本語

Javaのエコシステムでエージェントレイヤーのソフトウェアをどう作るかという本
learning.oreilly.com/library/view/a…
執筆中の章を見るとLangChain4jでパターンカタログを解説していた
日本語

ついにSWE-Lancerの巨大テストハーネスを任意のエージェントでGitHub Actionsの上で動かせるようになっていた
github.com/laiso/ts-bench…
すごいぞCursor Cloud Agent
(私は丸投げしただけです)
日本語

セッションだけ生きてたのでgithubの認証を新規で通してコードだけ無理やり救出した。20GBのイメージをdocker-in-dockerで起動してChome入れてXvfbでReact NativeアプリのE2Eテストをする環境を作っていた
github.com/laiso/ts-bench…
日本語

zenn.dev/shio_shoppaize…
自分もPrompt/Context/Harness Engineeringの時流を汲みバスワードとして過剰に広がっている印象でした。元々モデル開発の評価の文脈でハーネスという用語が使われていてそれをエージェントを動かすための仕組み全般に当てはめている。MinionsやOpen SWEのようなインフラに...
日本語

Cloud Agentsはモデル呼び出しフィーだけで、VM自体の稼働時間やリソースに対する別料金はかからない?としたら凄すぎる
cursor.com/ja/docs/cloud-…
日本語

@asahiXXXXXXXXX 「セルフサービスでのカスタムリソース構成は近日提供予定です。 cursor.com/ja/docs/cloud-… 」とも書いてあるしそのうちこのレギュレーションも整備されるのかもしれないですね
日本語


