𝕄𝕚𝕟𝕠𝕣𝕚🏍️

450 posts

𝕄𝕚𝕟𝕠𝕣𝕚🏍️ banner
𝕄𝕚𝕟𝕠𝕣𝕚🏍️

𝕄𝕚𝕟𝕠𝕣𝕚🏍️

@helmetti

Executive Specialist (AI/ML) & Senior Director. MBA. @GoogleDevExpert. Raised in 🇲🇾 (Opinions are mine)

Japan เข้าร่วม Mayıs 2010
47 กำลังติดตาม1.8K ผู้ติดตาม
ทวีตที่ปักหมุด
𝕄𝕚𝕟𝕠𝕣𝕚🏍️
7/1より東京大学情報理工学系研究科で自然言語処理・計算言語学の研究員に従事する事になりました。LLMやエージェント等のふるまい等、言語学とAIの知識・大学の豊富なリソースを活用して地道ながら着実に成果を積み上げて行こうと思っています。皆様どうぞお手柔らかにお願い致します。
𝕄𝕚𝕟𝕠𝕣𝕚🏍️ tweet media
日本語
0
4
48
7.4K
Odashi
Odashi@odashi_t·
使いにくいと評判のGPUを手に入れた
Odashi tweet media
日本語
3
9
164
31.2K
chansung
chansung@algo_diver·
@helmetti Thanks for sharing, and we haven't met yet
English
1
0
1
171
𝕄𝕚𝕟𝕠𝕣𝕚🏍️
@ymotongpoo AIもバイクも使い分けが肝心です!今回はカーボンホイールにしました!ウイリーしたら割れる!
𝕄𝕚𝕟𝕠𝕣𝕚🏍️ tweet media
日本語
1
0
0
27
Yoshi Yamaguchi
Yoshi Yamaguchi@ymotongpoo·
@helmetti みのりさんはほんとにバイク買いすぎですwww
日本語
1
0
1
50
Yoshi Yamaguchi
Yoshi Yamaguchi@ymotongpoo·
AIの時代でもバイクでぶっ飛ばすと気持ちいいという感覚はAIには作れないのでバイクの勝ち
日本語
1
3
40
2.2K
Odashi
Odashi@odashi_t·
実際に企業と会話すると「日本語処理能力が高い」「地政学リスクがない」を要求されることが多い。文化面の強さは人文系の研究者から要望される一方でビジネス関係ではあまり話題にならない(それはそう)。
mamita@chemical_tree

国産LLMの意義として日本固有の知識を問う文化依存なタスクに強いというのはよく言われるわけだけど、実ビジネス/プロダクトでそれがクリティカルになるユースケースとかって実際どのくらいあるのだろうか(普通に知りたい)

日本語
2
2
76
18.5K
𝕄𝕚𝕟𝕠𝕣𝕚🏍️
ベクトルおじさんが見るに非構造化データの取り扱いがわかんないから手っ取り早くLLMに突っ込めばいいじゃん的なモノを強く感じますね。別にベクトル化のモチベーションは距離測る為だけではなく、コンテクスト周りや手法も進化してるしマルチモーダルで埋め込める今初手LLMはディープでポンと同じ香り
Kazunori Sato@kazunori_279

ベクトル検索の界隈をLLM以前から見ていると、起きてることはすごく単純。これまでの流れ:LLMすげえ→これからはベクトル検索だ!(根拠なし)→単純な類似検索やってみた→精度でねえ!面倒だからエージェントの推論任せでgrepしよう(←いまここ)。 俺が2年前に書いたような議論(単純な類似検索では検索品質低いし、IRのプロはみんな自前の推薦モデルを使う)は、RAG界隈では今だにほとんど見かけない。推薦モデル作る方法を今から学ぶより、"agentic"に済ませたほうが速いし結果がすぐ出るから。もちろんそれで済むデータ規模とレイテンシとコスト要件なら、最初からベクトル検索はいらない。 こういうLLM界隈の右往左往とは関係なく、大手各社は10年前も現在も何も惑わされずにベクトル検索でコンテンツ検索と推薦を数十億人規模に提供し、高い検索品質と大きな収益を上げている。 cloud.google.com/blog/products/…

日本語
0
1
4
870
𝕄𝕚𝕟𝕠𝕣𝕚🏍️ รีทวีตแล้ว
Kazunori Sato
Kazunori Sato@kazunori_279·
ここで私が言う推薦モデルとは、構造化データのみを用いる伝統的な統計モデルではなく、two-towerモデルのようなクエリテキストと回答テキスト、クエリテキストとマルチモーダルコンテンツ等の非構造化データ間の埋め込みの関係性を学習するディープモデルを指します。さらに特徴量として構造化データや時系列データから作る埋め込みも合わせて使うケースが多いです。Xのタイムラインもそうやって作られますし、弊社や大手各社のサービスの検索や推薦もほとんどこれに似た仕組みです。 もちろん、ここにLLM推薦を組み合わせるととても強力です(レイテンシとコストの制約が許せば)。私もgenerative recommendationという呼び方で2年前くらいからそうした記事を書いてきました(Agenticってキーワードはまだバズってなかったので)。ただ、現在の多くのベクトル検索不要議論は、上述のような「ベクトル検索の基本」を飛ばしたまま安易に後者のバズに乗ろうとする流れが多く、プロフェッショナルな議論を見ることは少ないと思っています。 cloud.google.com/transform/infi…
日本語
1
7
58
5.3K
Shuhei Fujiwara
Shuhei Fujiwara@shuhei_fujiwara·
Copilot 周りの連携が強いので VSCode 使ってたけど、飽きてきたので Emacs に帰ろうかな
日本語
1
0
3
401
𝕄𝕚𝕟𝕠𝕣𝕚🏍️
明日めっちゃ早口でしゃべります
GDG Greater Kwansai|7/18 I/O Extended Osaka 開催@gdgkwansai

📢 4/19(日) Build with AI Kansai 2026 「Gemini Embeddings 2 が拓くマルチモーダルエンベディングスの世界」 Minori MATSUDA 氏 (@helmetti) Gemini Embedding 2 のイノベーションの概要と、Vertex AI Vector Searchでのリファレンスを紹介します。 👇詳細 & 参加登録 gdgkwansai.link/bwai26x

日本語
0
2
5
1.5K
𝕄𝕚𝕟𝕠𝕣𝕚🏍️
次元がもったいないマンはあながち間違いでもなかった!
Kazunori Sato@kazunori_279

Grokファクトチェックした。そんな的外れではなさそう: 本投稿(@kazunori_279要するに、「LLMの高次元埋め込み空間をそのままグラフ(Knowledge Graph)に完全に移し替えて維持するのは現実的に難しい」という指摘です。 ファクトチェックのポイント「king - man + woman = queen」例→ 完全に事実。2013年のWord2Vec論文(Mikolov et al.)で示された有名なアナロジー計算です。以降、GloVeや現代のLLM埋め込みでも同様の幾何構造(高次元空間での意味的関係)が確認されています。投稿の例は正確です。 Google Knowledge Graph(KG)は「低次元な関係性」 → 正しい。Google KG(および一般的なKG)は、主に「entity1 — relation — entity2」という**三元組(triple)**で構成され、関係性が比較的低次元・シンボリックです。クエリが高速で正確なのはこの構造のおかげです。 LLMが捉える「高次元のセマンティクス」 → 正しい。現代の言語モデル(BERT以降)の埋め込みベクトルは通常512〜4096次元以上で、無数の幾何構造(アナロジー、類似度、ニュアンス)を保持しています。これを「漏らさず」グラフに射影するのは、情報損失の観点で極めて困難です。 「高次元グラフに射影して保守するのは大変」「次元削減し過ぎると昔のグラフDBと大差ない」 → 技術的に妥当な指摘。現在、GraphRAG(Microsoft)や知識グラフ+RAGのハイブリッド手法が海外で注目されていますが、多くの実装ではノードに高次元ベクトルをそのまま保持するか、ベクターDBと併用しています。 純粋にグラフDB(Neo4jなど)だけで高次元構造を「完全に」保守しようとすると、ストレージ・クエリコストが爆発的に増えたり、次元削減(PCAなど)せざるを得なくなります。結果として「昔のシンボリックKGに戻る」リスクは実際に議論されています。

日本語
0
0
1
481
𝕄𝕚𝕟𝕠𝕣𝕚🏍️
BQMLのML.GENERATE_EMBEDDINGにムルタァィエンベディングスが生えておる!'multimodalembedding@001'とあるけどこれはGemini Embeddings2と違うの?どうなの?!最大512次元なので別のモデルの予感。埋め込みおじさんの未来は明るい #multimodalembedding" target="_blank" rel="nofollow noopener">docs.cloud.google.com/bigquery/docs/…
日本語
0
0
1
241
𝕄𝕚𝕟𝕠𝕣𝕚🏍️
全文検索Namazuなつかしいな~と思いつつあれはPerlだったので辛い思い出しかなく特に正規表現が鬼でPythonが10人書いたら9人はほぼ同じコードっぽくなるのに対してPerlだとフリーダムすぎて人のコード読んでもわからん!ばっかりだった気がする。どれぐらいエグいかというとregexで1冊本が出るほど
𝕄𝕚𝕟𝕠𝕣𝕚🏍️ tweet media
日本語
0
0
0
165
𝕄𝕚𝕟𝕠𝕣𝕚🏍️
あ、ちなみにこれはEmbeddingsの近傍検索デモなので類似もガッツリちゃんと出ております!そこに注目!
日本語
0
0
0
137
𝕄𝕚𝕟𝕠𝕣𝕚🏍️
すげー!!!今デスクに置いてあったコカ・コーラゼロを映しながらこれなに?って聞いたら「これはコカ・コーラゼロでラベルから日本の物と思われますね!」やって! Live APIと組み合わせるのがセンスありすぎて鼻血ちょっと出た
Kazunori Sato@kazunori_279

Gemini Embedding 2とVector Search 2とADK Gemini Live API Toolkitで100万件の商品からリアルタイム&マルチモーダル検索できるライブデモ作った。モデルが世界をどう見てるか覗く万華鏡のようなUX。誰でも試せます:LensMosaic - a live multimodal shopping demo youtu.be/SgMn-6q8Qg8?si…

日本語
1
1
1
1.5K
𝕄𝕚𝕟𝕠𝕣𝕚🏍️ รีทวีตแล้ว
Kazunori Sato
Kazunori Sato@kazunori_279·
Gemini Embedding 2とVector Search 2とADK Gemini Live API Toolkitで100万件の商品からリアルタイム&マルチモーダル検索できるライブデモ作った。モデルが世界をどう見てるか覗く万華鏡のようなUX。誰でも試せます:LensMosaic - a live multimodal shopping demo youtu.be/SgMn-6q8Qg8?si…
YouTube video
YouTube
日本語
1
9
47
7.4K