Osamu MATSUMOTO
3.4K posts

Osamu MATSUMOTO
@osm
Quando, ex-trabox/ex-mixi/ex-aws/ex-sgi. Speciality for backend architecture, Tech builder for rapid biz-dev. Love 🏍


ぶっちゃけ、RAGをやる9割の人が間違っていると思う。そもそも、なぜベクトル検索をする必要があったのかを考えて欲しい。 背景はコンテキストウィンドウに入りきらない大量の独自ドキュメントを、安価にLLMの検索対象にしたいから。 RAG(ベクトル検索)が流行った当時は、今みたいにエージェントもなければ、ディープリサーチみたいなツールもないし、コンテキストウィンドウも主要モデルは小さかったから、ベクトル検索せざるを得なかった。 つまり、別に精度が高いからRAG(ベクトル検索)をしている訳じゃない。 むしろ、ベクトル検索をし続ける限り、コサイン類似度に近いチャンクを拾ってくるという宿命から逃れられなくなる。運用コストもバカ高い。 何より、せっかくLLMの精度がとてつもないスピードで向上して、MCPもあればSkillsも出てきたのに、ベクトル検索に依存するフローは、これらの恩恵を受けられず、あまりに勿体なさすぎる。 Claude Sonnet 4.6 が安価に100万トークンのコンテキストウィンドウを持つようになったことで、大量のSonnetサブエージェントに普通に検索をさせた方が遥かによくなる。 全てサブエージェントによる大量検索が最適解だとは思わないが、基本的にはこの未来は確定路線だと思う。 10年後を見据えたコンテキストエンジニアリングが必要で、その中にベクトルDBが本当に入っているのか、想像してみた方がいい。

日系でSREやプラットフォームエンジニアをやっているチームで、ちゃんとオンコール制度が回っているところがあれば、ぜひ話を聞いてみたい オンコールって、本来はサービスを24時間守るための仕組み。誰かが常に責任を持って見るからこそ、プロダクトに本気で向き合える。グローバルサービスだとわりと当たり前にある文化だけど、日系だとまだ少数派な印象 これまで聞いた範囲だと、制度として明確に回している(有償化など)のはPayPayとメルカリくらい 前職はオンコールなしでサービス回ってたけどいつも同じ人が対応してしまいますよね




\🚀CES 2026出展レポート公開/ 世界最大級のテック展示会CES 現地で見えた技術トレンドだけでなく、日本企業・スタートアップが世界で戦うために必要な視点をまとめました。 noteでぜひご覧ください✨ CESは未来の“当たり前”を測る場所だった【CES 2026出展レポート】 @Tsubaki_quando @SynQRemote #CES2026 #CES #スタートアップ #AI #DX #クアンド #出展レポート #ラスベガス note.quando.jp/n/n5adecd194c7a










