

Osamu MATSUMOTO
3.4K posts

@osm
Quando, ex-trabox/ex-mixi/ex-aws/ex-sgi. Speciality for backend architecture, Tech builder for rapid biz-dev. Love 🏍





生成AI を前提にした既存サービスの新しい UI とか UX がどうなるか、なんかだいたいみんな間違えてるんじゃないかって思ってもどかしい AI にお願いすればなんでもやってくれる体験みたいなのをみんなすぐ考えるんだけど、人間、いきなり自由度の高いツール与えられても案外何していいかわからない


山岡家はAWS 活用してて好き。 流石、日本のNVIDIA aws.amazon.com/jp/blogs/news/…

AGENTS.md 作業ステップや規約を書くよりもエージェントの行動規範を書く方がいいような気がしてるけど気のせいかな そういった規範はLLMが学習する過程で内在するのかもしれないけど


ぶっちゃけ、RAGをやる9割の人が間違っていると思う。そもそも、なぜベクトル検索をする必要があったのかを考えて欲しい。 背景はコンテキストウィンドウに入りきらない大量の独自ドキュメントを、安価にLLMの検索対象にしたいから。 RAG(ベクトル検索)が流行った当時は、今みたいにエージェントもなければ、ディープリサーチみたいなツールもないし、コンテキストウィンドウも主要モデルは小さかったから、ベクトル検索せざるを得なかった。 つまり、別に精度が高いからRAG(ベクトル検索)をしている訳じゃない。 むしろ、ベクトル検索をし続ける限り、コサイン類似度に近いチャンクを拾ってくるという宿命から逃れられなくなる。運用コストもバカ高い。 何より、せっかくLLMの精度がとてつもないスピードで向上して、MCPもあればSkillsも出てきたのに、ベクトル検索に依存するフローは、これらの恩恵を受けられず、あまりに勿体なさすぎる。 Claude Sonnet 4.6 が安価に100万トークンのコンテキストウィンドウを持つようになったことで、大量のSonnetサブエージェントに普通に検索をさせた方が遥かによくなる。 全てサブエージェントによる大量検索が最適解だとは思わないが、基本的にはこの未来は確定路線だと思う。 10年後を見据えたコンテキストエンジニアリングが必要で、その中にベクトルDBが本当に入っているのか、想像してみた方がいい。

日系でSREやプラットフォームエンジニアをやっているチームで、ちゃんとオンコール制度が回っているところがあれば、ぜひ話を聞いてみたい オンコールって、本来はサービスを24時間守るための仕組み。誰かが常に責任を持って見るからこそ、プロダクトに本気で向き合える。グローバルサービスだとわりと当たり前にある文化だけど、日系だとまだ少数派な印象 これまで聞いた範囲だと、制度として明確に回している(有償化など)のはPayPayとメルカリくらい 前職はオンコールなしでサービス回ってたけどいつも同じ人が対応してしまいますよね


