𝕄𝕚𝕟𝕠𝕣𝕚🏍️
450 posts

𝕄𝕚𝕟𝕠𝕣𝕚🏍️
@helmetti
Executive Specialist (AI/ML) & Senior Director. MBA. @GoogleDevExpert. Raised in 🇲🇾 (Opinions are mine)


RTX PRO 6000 for AI Research: When Is It Enough? I wrote a short blog post based on experiments conducted on @jarvislabsai platform. parkchansung.medium.com/rtx-pro-6000-f…

国産LLMの意義として日本固有の知識を問う文化依存なタスクに強いというのはよく言われるわけだけど、実ビジネス/プロダクトでそれがクリティカルになるユースケースとかって実際どのくらいあるのだろうか(普通に知りたい)

ベクトル検索の界隈をLLM以前から見ていると、起きてることはすごく単純。これまでの流れ:LLMすげえ→これからはベクトル検索だ!(根拠なし)→単純な類似検索やってみた→精度でねえ!面倒だからエージェントの推論任せでgrepしよう(←いまここ)。 俺が2年前に書いたような議論(単純な類似検索では検索品質低いし、IRのプロはみんな自前の推薦モデルを使う)は、RAG界隈では今だにほとんど見かけない。推薦モデル作る方法を今から学ぶより、"agentic"に済ませたほうが速いし結果がすぐ出るから。もちろんそれで済むデータ規模とレイテンシとコスト要件なら、最初からベクトル検索はいらない。 こういうLLM界隈の右往左往とは関係なく、大手各社は10年前も現在も何も惑わされずにベクトル検索でコンテンツ検索と推薦を数十億人規模に提供し、高い検索品質と大きな収益を上げている。 cloud.google.com/blog/products/…


Grokファクトチェックした。そんな的外れではなさそう: 本投稿(@kazunori_279要するに、「LLMの高次元埋め込み空間をそのままグラフ(Knowledge Graph)に完全に移し替えて維持するのは現実的に難しい」という指摘です。 ファクトチェックのポイント「king - man + woman = queen」例→ 完全に事実。2013年のWord2Vec論文(Mikolov et al.)で示された有名なアナロジー計算です。以降、GloVeや現代のLLM埋め込みでも同様の幾何構造(高次元空間での意味的関係)が確認されています。投稿の例は正確です。 Google Knowledge Graph(KG)は「低次元な関係性」 → 正しい。Google KG(および一般的なKG)は、主に「entity1 — relation — entity2」という**三元組(triple)**で構成され、関係性が比較的低次元・シンボリックです。クエリが高速で正確なのはこの構造のおかげです。 LLMが捉える「高次元のセマンティクス」 → 正しい。現代の言語モデル(BERT以降)の埋め込みベクトルは通常512〜4096次元以上で、無数の幾何構造(アナロジー、類似度、ニュアンス)を保持しています。これを「漏らさず」グラフに射影するのは、情報損失の観点で極めて困難です。 「高次元グラフに射影して保守するのは大変」「次元削減し過ぎると昔のグラフDBと大差ない」 → 技術的に妥当な指摘。現在、GraphRAG(Microsoft)や知識グラフ+RAGのハイブリッド手法が海外で注目されていますが、多くの実装ではノードに高次元ベクトルをそのまま保持するか、ベクターDBと併用しています。 純粋にグラフDB(Neo4jなど)だけで高次元構造を「完全に」保守しようとすると、ストレージ・クエリコストが爆発的に増えたり、次元削減(PCAなど)せざるを得なくなります。結果として「昔のシンボリックKGに戻る」リスクは実際に議論されています。


Gemini Embedding 2とVector Search 2とADK Gemini Live API Toolkitで100万件の商品からリアルタイム&マルチモーダル検索できるライブデモ作った。モデルが世界をどう見てるか覗く万華鏡のようなUX。誰でも試せます:LensMosaic - a live multimodal shopping demo youtu.be/SgMn-6q8Qg8?si…











