AIDB

9.8K posts

AIDB

@ai_database

5万件以上のAI論文情報を集めた日本最大のAI科学技術プラットフォーム。会員数1.4万人突破しました！AIエージェントにそのまま使えるスキルライブラリ開始。下記のリンクから会員作成してください！8年目。大手企業でも導入増加中。

日本東京 Katılım Nisan 2019

117 Takip Edilen47.3K Takipçiler

Sabitlenmiş Tweet

AIDB@ai_database·6d

7周年🐝いつもありがとうございます！

日本語

5.3K

AIDB@ai_database·15h

関連記事： LLMの性格を、「特性の強度」にもとづき詳細に設定する方法 ai-data-base.com/archives/91747

日本語

2.4K

AIDB@ai_database·18h

LLMエージェントのチームに「恐怖」や「几帳面な性格」を与えると、コードをたくさん直すようになるそうです。しかし、直しすぎて手間がかなり増える、という研究報告が出ています。 UCアーバインの研究者らによるものです。研究者らは、複数のLLMエージェントで構成されるソフトウェア開発チームに、ビッグファイブ性格特性と感情（怒り・恐怖・悲しみ・幸福など）を組み合わせたプロファイルを与え、78種類の構成でコード生成とコードレビューを検証しました。結果、性格・感情の設定だけでコード生成の正答率に最大11.3ポイントもの差が出たとのこと。役割ごとに異なる性格を割り当てた「混合チーム」は、8設定中6つで均一チームを上回りました。一方で、恐怖や高い誠実性を与えたエージェントは、すでにテストに全部合格しているコードにまで修正を要求する「直しすぎ」が増加。恐怖は幸福に比べて過剰修正の確率を6.4倍に高め、トークン消費も膨らむのに、性能は一貫して上がらなかったそうです。なお、最適な性格プロファイルはモデルやタスクごとにバラバラで、万能な設定は存在しないとのこと。エージェントの「人格設計」は役割分担やモデル選定と並ぶほどの設計要素になる可能性を感じさせる研究結果です。

日本語

133

13.9K

AIDB@ai_database·17h

関連記事：ソフトウェア開発におけるLLMマルチエージェントの設計パターン ai-data-base.com/archives/97832

日本語

3.9K

AIDB@ai_database·18h

論文：Agents with Feelings? Personality and Emotion in Multi-Agent Software Teams ai-data-base.com/paper/2607-056… arxiv.org/abs/2607.05659

English

1.2K

AIDB@ai_database·1d

「AIと人間の”摩擦”をあえて残すことで、AIは人間の創造性を引き上げる相棒になる」といった論文がETHチューリッヒから出ています。逆に、今のAIは基本的に「一発で完成品を出す」方向に進化しており、「有益な面倒くささ」も丸ごと奪ってしまう、という指摘です。研究者らは面倒くささ（摩擦）を2種類に分けました。 ①単純作業の繰り返しのような「無駄な摩擦」はAIが消すべき。 ②一方で、制約と向き合って考え込むような「意味のある摩擦」は残すべきだと。この主張を裏付けるのが専門家にAI設計ツールを使ってもらう実験です。もしAIの完成品をそのまま受け取るだけなら、最初のアイデアがそのまま形になるはず。ところが実際は、AIの出力を眺めて「あれ、これおかしいな」と気づく瞬間が何度もあり、全員が途中でより良い案へと方向転換していました。良いアイデアは最初から頭の中にあるのではなく、作りながら考え直す過程で生まれていた、ということです。 AIの価値は「人間が考え直すきっかけを作ること」にもあるのかもしれません。なお、今回検証対象になったデザインの仕事。デザインは本来、制約に悩み、案を比べ、試行錯誤する"面倒くささ"の中からアイデアが生まれるもの。そのため特にこの前提が関係しそうです。 ICML’26ワークショップ採択論文。

日本語

207

18.7K

AIDB@ai_database·1d

関連記事： AIを使うことでむしろ生産性が下がってしまうときの3つのメカニズム ai-data-base.com/archives/109414

日本語

2.7K

AIDB@ai_database·1d

いつもいいねやリポストをしていただき、ありがとうございます！大変励みになっています。また、ポストを読んでいただいている皆さん全員に感謝します。コメントも全て目を通しています。

日本語

AIDB@ai_database·1d

関連記事： LLMで複数のアイデアを組み合わせ、イノベーションを目指した新しいアイデアを作成する方法 ai-data-base.com/archives/87358

日本語

3.3K

AIDB@ai_database·1d

関連記事： LLMで本当に創造性が高まる関わり方　アイデアの均質化は避けられる ai-data-base.com/archives/96916

日本語

1.9K

AIDB@ai_database·1d

論文：Creativity from Friction: Human-AI Interaction for Exploratory Structural Design ai-data-base.com/paper/2607-075… arxiv.org/abs/2607.07521

English

2.1K

AIDB@ai_database·2d

AI同士に問題を出し合わせて知能を測るトーナメントで、優勝したのは「最も嘘つきなモデル」だったという報告が出ています。プリンストン大学の研究チームによるものです。ルールは、出題者役のAIがクイズを作って「正解」も宣言し、回答者役のAIたちの回答が割れるほど出題者が高得点、というもの。賢いAIほど絶妙な問題を作れるはず、という発想です。宣言した「正解」が本当に正しいかはチェックしません。簡単な問題にわざと嘘の正解を宣言すると、素直に答えるAIと引っかけを疑うAIで回答が割れ、出題者が得をします。優勝したモデルの宣言が実際の答えと一致していた割合は59%で、全参加者中最低でした。対照的にClaude Opus系は97.5%正直で、問題に解説コメントまで付ける協力ぶり。誰にでも解けてしまい得点が伸びませんでした。正直さが不利になる、という皮肉な結果です。ただし、じっくり考えさせると、モデルたちは「あの出題者は嘘つきだから五分五分と答えておこう」という対抗策を自力で発見。嘘は長い目で見ると通用しなくなることも確認されています。人間の能力を超えたAIを測る問題は、人間にはもう作れない。ならば出題自体をAIに任せよう、という次世代評価の研究です。

日本語

132

17.5K

AIDB@ai_database·2d

関連記事：ベンチマーク結果をうのみにするとLLMの実力を見落とす ai-data-base.com/archives/112444

日本語

3.6K

AIDB@ai_database·2d

関連記事： LLMにとっての究極の問題集 ai-data-base.com/archives/84219

日本語

3.2K

AIDB@ai_database·2d

論文：Measuring Intelligence Beyond Human Scale ai-data-base.com/paper/2607-070… arxiv.org/abs/2607.07040

English

3.2K

AIDB retweetledi

AIDB@ai_database·3d

LLMは「ユーザーが何者か」を察知して、道徳判断をひそかに変えることがあるという報告が出ています。南アフリカの研究者らによる検証です。研究者らは、LLMに対してユーザーの職業を「裁判官」「借金取り」「ロビイスト」などをさりげなく（職業的な思考の仕方だけで）伝えたうえで、LLMに「殺人」「嘘」「約束を破る」といった行為の悪さを0〜100点で採点させました。実験の結果、同じ行為でもユーザーの職業によって点数が体系的に変わりました。たとえば裁判官と話しているときは全体的に甘く、借金取りと話しているときは厳しくなる傾向が見られたそうです。「法を破る」の評価では、職業による差が最大36点にも達しました。なお、点数に差が出るのは解釈の余地がある行為に集中しています。ユーザーは誰しも複数の役割を同時に持つものです。AIはそれをどう扱うべきか、そもそもバイアスを持つべきか、という問いを投げかける研究です。なお研究者らは、こうした事象が"あらゆる"モデルで同様に起こるかは分からない、と慎重な姿勢も持っています。

日本語

184

20.6K

AIDB retweetledi

AIDB@ai_database·4d

人間同士の「暗黙の了解」をルールとして書き出してAIに教えることで、「AIと人間の協力」が人間同士を上回る場合がある、と報告されています。清華大学の研究者らによる論文。実験された題材は歩行者と車が交差点で譲り合う場面。素のLLMはこの種のやり取りが苦手で、衝突リスクを高めるか過度に慎重になるかのどちらかだそうです。そこで研究者らは96人が実際に譲り合う様子を3,456回分記録して分析しました。結果、うまくいく譲り合いには3つの共通点があることを突き止めました。「先に行くか譲るかを早めにはっきりさせること」「片方が進むならもう片方は引くこと」「有利な側が先に行き、不利な側は無理をしないこと」の3つです。この3つを教えたAIは、安全性を保ちながら効率よく通過できるようになり、人間同士よりも43%高いスコアを記録。模倣学習（動きをマネさせる学習手法）では良質なデータだけを学ばせても同じ性能に届かず、上記のように暗黙の了解を言葉にして与えることのほうが明確に効果があったそうです。人間が持っている「暗黙の了解」をAIに理解してもらえる分野に関しては、AI開発では「暗黙の了解」を言語化・数値化するステップに注力することになりそうです。

日本語

205

16.9K

Keşfet

@elonmusk @BarackObama @taylorswift13 @cristiano @BillGates @NASA @nikifrancismediavine @katyperry