Sabitlenmiş Tweet
AIDB
9.3K posts

AIDB
@ai_database
日々大量に公開されるAI分野の論文の中から、重要かつ興味深い論文のみを厳選して取り上げています。ウェブサイトでは深掘り調査記事、論文DB、エージェントスキルライブラリなどを提供しています。記事は人の手で書いています。2019年から運営しています。
日本 東京 Katılım Nisan 2019
117 Takip Edilen46K Takipçiler

LLMの幻覚は「単純に直せる」ものではなく、ある種の幻覚を潰すと別のタイプの幻覚が顔を出す、そんなモグラ叩き構造になっています。たとえば指示にきっちり従わせるようにすると推論力が落ち、知識を注ぎ込めば既存知識を忘れてしまう、そんなトレードオフが存在するのです。
ai-data-base.com/archives/107475
日本語

関連記事
LLMの設計仕様と挙動にはギャップがある モデルが自然に大事にしている価値観を探る
ai-data-base.com/archives/96632
日本語

人類が数千年かけて試してきた組織のかたちが、いままさにAIエージェント設計のライブラリとして使える時代に。
研究者らが秦漢の郡県制など歴史上の政治体制をAIエージェントチーム用に実装したところ、同じモデル・同じタスクでも、制度を変えるだけで成績が57ポイント以上変わったそうです。
試されたのは秦漢の郡県制のほか、唐の三省六部、江戸の幕藩体制、アテネの直接民主制など。
実験の結果、どんな状況でも勝つ「最強の制度」は存在せず、モデルやタスクが変われば最適な制度も入れ替わったとのことです。
AIの集合知を伸ばす鍵は単一の理想形を作り込むことではなく、状況に応じて統治の形そのものを組み替えられる柔軟さにあるという結論。

日本語
AIDB retweetledi

オープンソースLLMの世界は一見すると新しいモデルが大量に出ているように見えて、ほとんどのモデルはLlamaやQwenといった有名な土台モデルの「派生品」にすぎず、流れを塗り替えるような存在にはなっていません。例外的に流れを変えられるのは、パラメータ数が大きいモデルや、ファインチューニングで作られたモデルが中心です。
ai-data-base.com/archives/106967
日本語

関連記事
マルチエージェントは万能薬ではない 180パターンの実験が明かすマルチエージェントの適材適所
ai-data-base.com/archives/98974
日本語

