ottaka
1.4K posts


結局、macのほうはキャンセルして、rtx 6000 pro max q を買って自作PCを3月末に組んだ。
x.com/ottaka828/stat…
ottaka@ottaka828
なんか、色々見てたらmac studioが欲しくなって、注文した😅。 出荷日:5〜6週間😅。まぁ、ここから短縮されるかもしれんけど。ローカルLLMで高性能のやつをやってみたい。。。
日本語
ottaka retweetledi
ottaka retweetledi
ottaka retweetledi
ottaka retweetledi
ottaka retweetledi
ottaka retweetledi

Karpathy氏のAutoresearchに関する優れた解説。個人的には機械学習にあたってはGPT-5.4 pro の知見を使いたいからAutoreaerchは使っていないがこの仕組みから学ぶ事は多い。AIエージェント構築に興味のある人にもおすすめの記事です。
以下、日本語訳の抜粋
Autoresearchが重要なのは、エージェントについてのより大きな真実を示しているからです。自律性が有用になるのは、ハーネスがきつく締まっているときです。
1つ目の教訓は、制約がエージェントを良くするということです。エージェントは1つのファイルを編集し、1つの指標を追い、1つの固定ハーネスの中で動き、スコアが改善したときだけ前進します。これはシステムの欠点ではなく、何時間もノイズに溶けずに動き続けられる理由です。多くのエージェントシステムが失敗するのは、自由を与えるのが早すぎるからです。自由が増えるほど、普通はエラーが起きうる面も広がります。
2つ目の教訓は、プロンプトはアーキテクチャの一部だということです。Autoresearchにおいて program.md はコードの周りの飾りではありません。そこにはワークフロー、境界、永続性、ログ、復旧、選択基準が定義されています。これは単なるプロンプトではなく、システム設計です。エージェント製品が成熟するにつれて、本当のアーキテクチャの多くはこの層に宿るようになるでしょう。つまり、アプリケーションコードだけでなく、自律的な作業者への運用指示にもです。
3つ目の教訓は、モデルではなくハーネスを最適化すべきだということです。多くの開発者は、モデルの知能だけに注目します。しかしAutoresearchは、周囲の仕組みが同じくらい重要だと示しています。仕事をどう起動するか、失敗をどう扱うか、進捗をどう測るか、悪い経路をどう巻き戻すか、状態をどう記録するか。強いハーネスの中の平凡なエージェントは、雑なハーネスの中のより賢いエージェントより良い結果を出せることがあります。
4つ目の教訓は、時間制約付き評価は過小評価されているということです。5分の壁時計時間予算は、このリポジトリの最良の発想の1つです。実世界のシステムでは、真の制約はしばしば時間です。レイテンシ、計算資源、反復速度、あるいはユーザーの待てる時間です。時間制約付きループは、理想化された性能ではなく、現実の有用性に向けてシステムを最適化させます。
5つ目の教訓は、可逆性と可観測性は必須だということです。Autoresearchは、失敗した実験を安く捨てられるようにし、すべての実験をログ、コミット履歴、results.tsv を通して検査可能にしています。まさにエージェントシステムはこう設計されるべきです。悪い実験が回復不能な混乱を残すなら、エージェントは大胆に探索できません。何が起きたかの痕跡を残さないなら、そのシステムを信頼することも改善することもできません。
これらをまとめると、より大きな原則が見えてきます。最良の自律システムとは、最も自由なものではありません。最も明確な目的、最も強いハーネス、そして最も安い失敗コストを持つものです。
chatgpt.com/share/69b48c06…
Manthan Gupta@manthanguptaa
日本語
ottaka retweetledi

我が名はドルダカ、いい調子で円安が加速してきてて最高だ、バーキンの在庫はあるか?

毛根女子@moukon_genius
我が名はドルダカ、自民党圧勝で円安はもう止まらないという話はなんだったのか。円安はまだか
日本語
ottaka retweetledi

3Dプリンターで作る太陽系の機械式模型、ギアの組み合わせで惑星の公転周期を99.9%再現——データは無料公開 fabscene.com/new/make/3d-pr…
日本語
ottaka retweetledi
ottaka retweetledi
ottaka retweetledi
ottaka retweetledi









