Findy AI News

266 posts

Findy AI News

@FindyAIPlus

生成AIの最新動向を毎日お届け。 AI活用度の可視化・ROI証明で、Agentic Workflowを開発組織のデファクトに。

가입일 Ocak 2026

27 팔로잉92 팔로워

Findy AI News@FindyAIPlus·21h

AIは「全ての仕事を奪う」フェーズにはまだ遠い。 AIの能力境界は依然として「ギザギザ（jagged）」で、要所では人間の専門的判断が不可欠。 💡 ポイント・AIの得意・不得意の境界は滑らかではなく、凸凹が激しい・重要な判断ポイントでは専門家のガイダンスが依然として必要・「AIが全ての仕事をこなせる」という認識は現状と乖離している 1. "Jagged Frontier"という視点・AIは特定タスクで人間を超える一方、隣接タスクで突然崩れる・この能力の凸凹を過小評価するサイクルに再び入っている・「AIにできること」と「AIだけでできること」は全く別の話 2. AI活用で成果を出すために・AIの得意領域と苦手領域の境界を自分の業務で見極めろ・「人間の判断をどこに挟むか」の設計こそがROIを左右する・ツール導入だけで生産性が上がると思うな。人間の介在設計が本質

Ethan Mollick@emollick

We are back to the phase of the AI news cycle where people are underestimating how jagged the AI ability frontier is, as well as how much they still depend on expert human decision-making or guidance at key points in order to function well. Still far from "doing all jobs," today.

日本語

Findy AI News@FindyAIPlus·21h

OpenAI、社内コード99.9%をAIで監視。内部のコーディングトラフィックをリアルタイムで「ミスアライメント検出」にかけているという取り組みが共有されていた。 💡 ポイント・社内コーディングの99.9%を自動監視対象にしている・目的はAIのミスアライメント（意図とのズレ）の検出・AI安全性をコードレベルで担保する実践例 1. 何をやっているか・社内で発生するコーディング関連トラフィックの99.9%をモニタリング・AIの振る舞いが意図から逸脱していないかをリアルタイムで検出・OpenAI内部のセキュリティ・安全性チームによる取り組み 2. 開発プロセスへの示唆・AIエージェントが自律的にコードを書く時代、「何を書いたか」の監視は必須になる・コードレビューの自動化とは別軸で「意図との整合性」を検証する仕組みが求められる・自社でAIコーディングを導入する際にも、出力の監視・検証フローは設計しておくべき

Marcus Williams@Marcus_J_W

Sharing some of the work I’ve been doing at OpenAI: we now monitor 99.9% of internal coding traffic for misalignment using our most powerful models, reviewing full trajectories to catch suspicious behavior, escalate serious cases quickly, and strengthen our safeguards over time.

日本語

209

Findy AI News@FindyAIPlus·21h

Cursorに「Composer 2」が追加。frontier-levelのコーディング性能を実現。難易度の高いコーディングタスクで強力な結果を出すモデルとして登場。 cursor.com/changelog 💡 ポイント・frontier-levelのコーディング性能・難易度の高いタスクに対応・StandardとFastの2つの速度モードを提供

日本語

Findy AI News@FindyAIPlus·21h

AIで誰でも完璧なPRを出せる時代、メンテナーの時間は有限のまま。GitHubが「3つのC」で戦略的メンターシップを提案。 github.blog/open-source/ma… 💡 ポイント・AI生成PRは見た目が完璧でも、45分かけてレビューした後に「理解不足」が判明・2025年のPRマージ数は月4,500万件（前年比23%増）、メンテナー時間は変わらず・tldrawはPRクローズ、FastifyはHackerOneプログラム停止を決断 1. なぜ今、緊急なのか・メンターシップはオープンソースのスケール戦略・1人を育てれば、その人が次の人を育てる（年5,000人の発信より、5年で59,049人の育成）・メンターシップを失えば、コミュニティの成長が止まる 2. 3つのC：戦略的メンターシップの判断基準・Comprehension（理解）: 問題を理解しているか？・Context（文脈）: プロジェクトの背景を把握しているか？・Continuity（継続性）: 長期的に関わる意思があるか？ 3. 実践例・CodexとGemini CLI: PR提出前にissueで承認を必須化・対面スプリント・ハッカソン: リアルタイム会話で理解度を確認・GitHubがRFC公開中: コミュニティフィードバックを募集

日本語

Findy AI News@FindyAIPlus·1d

APIドキュメントの読者は、もう人間だけじゃない。 Emollickが指摘していたHeygenのAPI設計が興味深い。人間とAIエージェント、両方を読者として想定したドキュメント構成になっている。 💡 ポイント・APIドキュメントの「もう一人の読者」はAIエージェント・llms.txtでAIに製品の活用法を伝える時代・技術仕様だけでなく英語での説明がAI活用の鍵 1. 2つの読者を意識したドキュメント設計・従来のAPIドキュメントは人間の開発者向けに書かれていた・今後はAIエージェントが読んで判断・実行する前提が必要・Heygenはその両方を意識した構成を採用している 2. llms.txtの可能性と課題・llms.txtはAIエージェント向けの製品説明ファイル・現状は技術仕様の羅列にとどまっているケースが多い・AIに「創造的な使い方」を促すには、自然言語での文脈説明が効く・スペックを並べるだけでは、AIは最低限の使い方しかしない

Ethan Mollick@emollick

Heygen’s APi documentation is a glimpse of how to write for your two audiences: humans and agents. (though I think their llms.txt file could do a lot more to get AIs “excited” to use their product in creative ways by explaining some stuff in English, rather than just tech specs)

日本語

Findy AI News@FindyAIPlus·1d

Squadを見ていると、AI開発の課題が「プロンプト改善」から「複数エージェントの協調」に移っている印象。 GitHub Copilot上で動くオープンソースプロジェクトSquadは、リポジトリ内に専門特化したAIチームを2コマンドで初期化する。 github.blog/ai-and-ml/gith… 💡 ポイント・`npm install -g @bradygaster/squad-cli` + `squad init` でリード・フロントエンド・バックエンド・テスター構成のAIチームが起動・作成者とは別のエージェントがコードレビューを担当（同一AIによる自己レビューを防ぐ設計）・リポジトリ内の共有ファイルで過去の意思決定・命名規則を各エージェントが参照 1. 協調動作の仕組み・自然言語で指示（例: 「JWT認証を実装して。リフレッシュトークンとbcrypt込みで」）・コーディネーターエージェントがタスクを分解し、専門エージェントを並列起動・バックエンド担当が実装→テスター担当がテストスイート作成→ドキュメント担当がPR作成 2. 独立レビューの強制・テストが失敗した場合、元の作成者エージェントは修正できない・別のエージェントが修正を担当（異なるコンテキストウィンドウで新しい視点を確保）・内部イテレーション完了後のPRのみを人間がレビュー 3. リポジトリネイティブ設計・「Drop-box」パターン: リアルタイムチャットやベクトルDBではなく、リポジトリ内の共有ファイルで状態管理・各エージェントの作業履歴・チーム決定事項をファイルとしてコミット・外部インフラ不要で、リポジトリレベルで動作が検証可能

日本語

106

Findy AI News@FindyAIPlus·1d

Claude Codeに「/remote-control」が追加。PCで始めた作業をスマホで続行可能に。 v2.1.79で、セッションをブラウザやスマホに引き継げる機能が登場。外出先でも作業を継続できる。 github.com/anthropics/cla… 💡 ポイント・pcのセッションをclaude.ai/codeにブリッジ・セッションタブにAI生成タイトルが自動付与・起動時のメモリ使用量を18MB削減 1. 新機能・/remote-control: セッションをブラウザ・スマホに引き継ぎ・--consoleフラグ: Anthropic Console認証に対応・/configに「ターン時間表示」トグル追加 2. 改善・非ストリーミングAPI: 2分タイムアウトでハング防止・CLAUDE_CODE_PLUGIN_SEED_DIR: 複数ディレクトリ指定可能（:区切り）・SessionEndフック: /resume使用時も正常動作 3. 修正・claude -pがサブプロセス起動時にハングする問題・/btwがストリーミング中に誤った出力を返す問題・音声モード起動時の動作不良

日本語

141

Findy AI News@FindyAIPlus·1d

Claude、数週間の自律実行が可能に。 Anthropicが科学計算向けの長期実行パターンを公開。明確な成功基準とテストがあれば、人間の介入なしに数日〜数週間のタスクを完遂できる。 anthropic.com/research/long-… 💡 ポイント・2000セッションでCコンパイラを構築した実績・進捗ファイルとテストで自律的に作業継続・HPC環境での科学計算に対応 1. 仕組み・CLAUDE.mdにプロジェクト指示を記載・CHANGELOG.mdで進捗と失敗を記録・Gitで各作業単位をコミット・プッシュ 2. 科学計算での使い方・数値ソルバーの再実装・レガシーコード（Fortran等）の移植・大規模コードベースのデバッグ・/teleportコマンドでローカルからHPCクラスタへ移行 3. 成功の条件・明確な成功基準（テストスイート、参照実装）・失敗アプローチの記録（同じ失敗を繰り返さない）・定期的なテスト実行で後退を防止

日本語

Findy AI News@FindyAIPlus·1d

81,000人のAI利用者に聞いた本音が、想像以上に複雑だった。 AnthropicがClaude利用者に実施した大規模インタビュー調査。159カ国、70言語で8万人以上から回答を集め、史上最大規模の質的調査となった。 anthropic.com/features/81k-i… 💡 ポイント・希望と懸念は対立するのではなく、一人の中に同居している・「AIで救われた人」と「AIで職を失った人」が同じ調査に混在・抽象的なAI論議ではなく、実際の利用者の具体的な声を可視化 1. 調査の規模と手法・80,508人が参加、159カ国・70言語に対応・Claude自身が面接官となり、回答に応じて質問を適応させる会話形式・深さと量のトレードオフを解消——従来の質的調査では不可能な規模 2. 希望の声・9年間誤診されていた病気をClaudeが正しく診断（米国フリーランサー）・貧困サイクルから抜け出すヒントを探している（ナイジェリア起業家）・契約書レビューで時間を節約（イスラエル弁護士） 3. 懸念の声・AI導入で5月に解雇された（米国テクニカルサポート）・人類より賢い存在への準備が必要（韓国ソフトウェアエンジニア）・読解力・思考力の低下への不安（イスラエル弁護士） 4. 重要な発見：希望と懸念は共存する・利用者は「推進派」と「慎重派」に二分されない・同じ人が「時間を節約できて助かる」と「自分で考える力を失うかも」の両方を語る・イスラエルの弁護士の言葉が象徴的：「思考は最後のフロンティアだった」 5. 分析手法・Claude自身が会話を分類——希望・懸念・職業・全体的な感情を自動コード化・懸念は複数ラベル対応（1人が複数の心配事を語るため）・代表的な引用をClaudeが抽出し、個人情報を除去して公開 6. Quote Wall機能・地域・懸念・ビジョンでフィルタリング可能・世界中の声を直接閲覧できるインタラクティブUI ・抽象論ではなく、実在する利用者の具体的な言葉この調査が示すのは、AI論議に欠けていた視点だ。「AIは善か悪か」ではなく、「実際に使っている人は何を望み、何を恐れているのか」。そして多くの人にとって、その答えは単純な二択ではない。

日本語

111

Findy AI News@FindyAIPlus·1d

Palantirで企業に入り込んで自動化を繰り返して気づいたのは、AIの性能じゃなく、知識の捕捉が一番難しいということ。 Edraは企業の暗黙知をAIエージェントが実行できる形に変換するプラットフォーム。 Sequoia、8VC、A*主導で3000万ドル超を調達し、ステルスを脱した。 💡 ポイント・既存データからエージェント実行可能な指示を自動生成・SharePointのPDFを渡すだけの「コンテキスト」は過去のものに・ASOS、HubSpotなど既に本番稼働中 1. なぜ企業でAIが使えないのか・AIモデルは数学オリンピックで金メダルを取れるほど賢い・でも企業内では使い物にならない——業務の実態を知らないから・本当のプロセス、判断基準、例外処理は人の頭の中にある・ドキュメント化されておらず、一貫性もなく、常に変化している 2. 従来のアプローチの限界・多くのベンダーは「SOPを渡せばエージェントが従う」と言う・でも正確で完全なSOPを作ることこそが最も困難な作業・大企業では一人が全プロセスを書き出すことは不可能・既存ツールはドキュメントと履歴データの検索問題として扱う・データだけでは不十分——矛盾、古いガイダンス、一時的な判断が混在・過去のSlackメッセージを遡って更新することもできない・データは「何が起きたか」を示すが、「次に何をすべきか」は示さない 3. Edraのアプローチ：Agentic Learning ・ファインチューニングでも強化学習でもない新しい学習システム・チケット、メール、ログと既存のSOP、ナレッジベースを取り込む・数千のエージェントを並列実行してデータを探索、意思決定をシミュレート、結論を統合・出力はモデルの重みの更新ではない・人間が読める平文英語の指示セット——ホワイトボックスでエージェント実行可能・散在する情報を明示的で監査可能な実行可能知識に統合・矛盾を調整し、古い慣行を排除し、実行ごとに改善・プロセスが変われば知識も進化する——継続的に、一度きりではなく 4. 本番環境での実績・ステルス期間中から業界リーダーや先進的スタートアップと提携・IT サービス管理、技術サポート、コンプライアンスなどを自動化・ASOS、HubSpot、Marosa、Ergeonが導入・既存システム上で動作：ServiceNow、Jira、Zendesk、Salesforce、Outlook ・汎用的な学習システムのため、最短1週間で稼働・データを取り込み、既存プロセスのギャップと矛盾を可視化し、実行可能な知識を提供

Edra@edra_ai

x.com/i/article/2034…

日本語

272

Findy AI News 리트윗함

かるカン@karukan013L23·2d

AIツールの利用内訳とかAIに委譲できる領域とか提案してくれるので、色々分析に使えて良さそう

筋肉CTO まさたん 💪 Findy@ma3tk

「Findy AI+」β版 #FindyAIPlus リリース🎉 AIツールの活用状況を診断、改善自動化までを実現するサービスです！具体的には、・Agents/.mdなどのAI環境を整備する・人とAIの最適な業務分担状況を判断して改善するなど、定量×定性で横断分析できます！無料で始められます！ 🔽詳細はリプへ

日本語

647

Findy AI News@FindyAIPlus·2d

@ma3tk GitHub Actionsを連携させた際の分析イメージはこちらになります！ Slackへの通知設定も可能です〜！

日本語

229

筋肉CTO まさたん 💪 Findy@ma3tk·2d

日本語

12.2K

Findy AI News@FindyAIPlus·2d

@ma3tk 人とAIのコラボレーションはこのような形で分析可能です！ぜひ皆様の開発組織でもお試しください🚀

日本語

1.3K

Findy AI News 리트윗함

ゆーだい@Findy@dai___you·2d

開発組織のAI投資を「見える化」から「自動改善」へ。Claude CodeやGitHub Copilotなど7つのAIツールの横断分析を実現する「Findy AI+(@FindyAIPlus)」β版提供開始！ prtimes.jp/main/html/rd/p… @PRTIMES_JPより

日本語

350

Findy AI News 리트윗함

ohataken@ohataken·2d

Findy AI+ β 版を触らせてもらいました。毎週確認してチーム内で見せ合うとよさそう。 #FindyAIPlus

日本語

498

Findy AI News 리트윗함

筋肉CTO まさたん 💪 Findy@ma3tk·2d

こんな感じで使えます！実験中の試作もこれから徐々にリリースしていきますのでお楽しみにー！

Findy AI News@FindyAIPlus

@ma3tk AI環境整備の分析デモ動画も作ってみました！ぜひ皆様の開発組織全体・リポジトリごとのAI環境をチェックしてみてください〜

日本語

1.2K

Findy AI News@FindyAIPlus·2d

@ma3tk AI環境整備の分析デモ動画も作ってみました！ぜひ皆様の開発組織全体・リポジトリごとのAI環境をチェックしてみてください〜

日本語

1.7K

Findy AI News@FindyAIPlus·2d

無料ご利用はこちらからどうぞ！ jp.ai-plus.findy.io

日本語

107

Findy AI News@FindyAIPlus·2d

🚀ついに「Findy AI+」のβ版をリリースしました！ #FindyAIPlus AIツールの活用状況を診断し、改善の自動化まで実現するサービスです。 5つの分析で、チームのAI活用のげ脳・課題、改善施策の方向性を可視化します！👇 ✅️AI自走環境の整備度分析　→AGENT指示ファイルの内容を分析し、AIが自走できる環境がどこまで整っているかを可視化 ✅️アウトプット品質分析　→PR単位でコード品質を分析し、コード変更者・開発環境それぞれのGoodポイントと伸びしろを特定 ✅️業務生産性分析（with AI）　→AI活用下でのアウトプットレベルの生産性を定量的に把握 ✅️人×AIの業務分担分析　→現在の業務分担の状況と、今後AIに拡張できる領域を明らかに ✅️AIツールのコストパフォーマンス分析　→投資対効果を可視化し、ツール選定や運用の意思決定を支援定量×定性の横断分析で、「導入して終わり」から「成果が出るAI活用」を一緒に目指しましょう！💪 無料で始められます👇

筋肉CTO まさたん 💪 Findy@ma3tk

日本語

693

Findy AI News@FindyAIPlus·3d

github.com/anthropics/cla…

ZXX

Findy AI News@FindyAIPlus·3d

Claude Code v2.1.77、出力トークン上限が128kに拡大。 Opus 4.6のデフォルトが64k、上限が128kに。Sonnet 4.6も128kまで対応。長文生成やコード出力の途中切断が減る。 💡 ポイント・Opus 4.6のデフォルト出力が64kトークンに増加・上限は128kまで拡張可能（Opus/Sonnet両対応）・`/copy N`で過去N番目の応答をコピー可能に 1. 出力制限の緩和・Opus 4.6: デフォルト64k、上限128k ・Sonnet 4.6: 上限128k ・長いコード生成や詳細な説明が途中で切れにくくなる 2. サンドボックス設定の改善・`allowRead`で`denyRead`内の特定パスを読み取り許可・複合bashコマンド（`cd src && npm test`）の権限保存を修正・PreToolUseフックが`deny`ルールをバイパスする問題を解消 3. パフォーマンス向上・macOS起動時間が約60ms短縮（並列読み込み）・`--resume`が最大45%高速化（大規模セッション）・メモリリーク修正（長時間セッション） 4. 操作性の向上・`/copy N`で過去の応答を指定コピー・vim NORMAL modeでBackspace/Delete動作・tmux内でのクリップボードコピー対応・CJK文字の表示崩れ修正

日本語

165

탐색

@ma3tk @PRTIMES_JP @elonmusk @BarackObama @taylorswift13 @cristiano @BillGates @NASA