シバタアキラ
1.4K posts

シバタアキラ
@madyagi
Weights & Biases カントリーマネージャー - 人工知能を使ったデータ・AI活用によるビジネス価値の創出を専門とし、数百に及ぶ国内外企業におけるデータ・AI活用に関わった。 DataRobot, Inc.にて、チーフデータサイエンティスト、日本CEOを歴任。講演等はakira.shibata@gmailへ
東京 Katılım Mart 2009
336 Takip Edilen3.1K Takipçiler
シバタアキラ retweetledi

そんなにアプリのUIを排除することに意味があると思えない。全てがチャットを介してテキストベースでやり取りされるなら、むしろ時間がかかる。いちいち「今日の最新ビジネスニュースを教えて、特にテック関連の」とか書くくらいなら、ニュースピックスのアプリ… #NewsPicks npx.me/mCRz/8P3p?from…
日本語

Ex-DataRobot JapanのメンバーがAIアプリケーション領域で起業。私も出資させていただくことになりました。こんなに嬉しいことはないですね。Let's go @Kento__Sato
prtimes.jp/main/html/rd/p…
日本語
シバタアキラ retweetledi

うーん、Cursor厳しい😥
「Claude Codeは200ドルで5000ドル分に相当するAPIを利用できるくらいAnthropicが料金を割り引いている。」
つまりCursorのような外部の製品は割高な料金でAPIを利用することを強いられているという指摘。
「Cursorの現在のハイエストプライオリティーは自社製モデルを作ること。」
しかしAIの出力の質が上がって、そもそもIDEがあまり必要とされなくなってくると、Cursorの製品優位性は市場ニーズに合わなくなってくる。
forbes.com/sites/annatong…
日本語

新記事公開:生成AIはソフトウェア開発においては、文字通り革命を起こしています。一方で、他の業界、業務に目を移すと変化は限定的です。本稿では、実務者のインサイトも交えながら、ボトルネックを整理し、日本企業がとりうる現実解を検討しました。
ashibata.substack.com/p/ai-5f8
日本語
シバタアキラ retweetledi
シバタアキラ retweetledi


ハーネスエンジニアリングという言葉も出てきています。〇〇エンジニアリングって言葉は増殖しててややこしいですが、雑に書くなら
ハーネス ⊇ コンテキスト ⊇ プロンプト
って関係と考えて良いと思います。(まだ市場の定義が緩いので異論もありそうですが)
プロンプト:人間がLLMの挙動をコントロールするために作るテキスト
コンテキスト:LLMに動的・静的に入力される全てのテキスト(プロンプト、ツール定義、ツール取得結果、タスク手順、リファレンス、出力スキーマ…)
ハーネス:コンテキスト含むエージェント/ワークフローの挙動や改善サイクルを含むシステム設計
みたいな感じです。
どんどん新しい言葉が生まれるな…と辟易する方もいらっしゃるでしょうけど、確かにコンテキストエンジニアリングの書籍を書いてるときに、何となく「あれ、これコンテキスト範囲に入るのか?」と迷った要素がいくつかあったんですよね。
分かりやすいとこで言えば、RAGの検索手段やエージェントのワークフロー化。もっと単純なとこで言えば、LLMのAPIパラメータ設定など。これらによって確かにコンテキスト設計は影響を受けますが、LLMの外側で設計・構築する項目なのでコンテキストエンジニアリングよりやや広い範囲な気がしていました。
他にもLLMシステムの評価・改善も実は目次に入ってて書きかけてたんですけど、コンテキストって意味合いだと逸脱するなあと思って最小限に留めた経緯もあります。今から思えばハーネスエンジニアリング本として出して入れておけば目次に入れて良かったんだなと。
実際今回のコンテキストエンジニアリング本はだいぶハーネスの内容まで踏み込んでる気がしてます。
このハーネス設計、多くはLLMアプリケーション開発者側の概念な気はしててユーザサイドには通常意識させないものですが、例外的にCoding AgentやローコードLLMワークフローツール(DifyとかCopilot Studioとか)のユーザはハーネスの自作がかなり自由度高く許されているので、例えばClaude Codeなどを使いこなす場合にはそれ用のハーネスづくりのテクニックを学ぶユーザも増えてきそうですね。
技術評論社販売促進部@gihyo_hansoku
「コンテキストエンジニアリングを制す者が、LLM時代を制す」 LLMを扱ううえでの最も重要でベーシックな存在であるコンテキスト。 本質的で応用の効く知識体系を獲得できる解説書を紹介します💡🧠 #電脳会議 #LLM #コンテキストエンジニアリング gihyo.jp/book/pickup/20…
日本語

@kubotamas アプリケーションレベルだとこれが究極のKPIですね。ベンチマークの精度ばかり追い求めるだけで、ハーネス部分が進化していないDeepSeekとかはコンピテンシー弱い。
日本語

これはちょっとした勘違いですね。APIでモデルを使うことを禁じてるのではなく、ユーザーが自分のサブスクリプションをサードパーティツールに持ち込むことを禁じる(これまでも禁じられてたけどエンフォースしてこなかった)というもの。
免税店で消費者向けに売ってるタバコを小売店で売ってはいけないですよ、というような感じ。
CryptoLand🌏ビットコイン|仮想通貨|@yonkuro_awesome
Cursorも死んだ🫠 SaaSやサイバーセキュリティだけでなく、他のAIラッパーツールまで殺しにきた😨 経営判断としては、上手いのかもしれんな
日本語

ドナルドトランプのお墨付きでOpenAI, SoftBank, Oracleが鳴り物入りで始めたStargateプログラムは、誰が何を所有し何をコントロールするのか折り合いがつかず、発表から1年経ってもJVに人はアサインされず、データセンターの開発は進んでいない。
OpenAIは自社単体でのデータセンター建設を検討するも、資金調達が頓挫。結局オラクルとソフトバンクがそれぞれにOpenAIの「お財布」になる事で合意。
とはいえ、GPUデータセンター建設に経験の浅い両社がタイムリーにデリバリーできるのかは疑問。結局ハイパースケーラーかネオクラウドに丸投げになるのでは?
theinformation.com/articles/insid…
日本語









