やのけん

77 posts

やのけん banner
やのけん

やのけん

@yanokengineer

健康第一!

日本 東京 Katılım Mart 2023
166 Takip Edilen54 Takipçiler
やのけん
やのけん@yanokengineer·
■カフェイン断ち2日目 睡眠の質は良かった。 昨日は昼間に頭痛くなったけど、あれが禁断症状的なものだったのかしら。 今日は頭痛ないといいな!
日本語
1
0
2
105
やのけん
やのけん@yanokengineer·
花粉まじやばい!!沖縄に行ぎだい!!!
日本語
0
0
1
62
やのけん
やのけん@yanokengineer·
AI無いとほんとなにもできないな笑
日本語
0
0
0
51
やのけん
やのけん@yanokengineer·
cursorがダウンしているっぽい! ふふ。codex cursorの出番だ!!
日本語
1
0
0
168
やのけん
やのけん@yanokengineer·
ChatGPTのグループチャット、AIが生成した文字で画面埋め尽くされて元の会話が見ずらくなるなぁ 現状のUIだとLINEを置き換えるようなツールなるとは思えないけど、そこら辺もうまく改善できればあり得るのかな
日本語
0
0
0
94
やのけん
やのけん@yanokengineer·
すご!シンプルに精度が気になる フルマネージドって感じだからチューニングとかどれくらいできるのかしら
テツメモ|AI図解×検証|Newsletter@tetumemo

📕GoogleのGemini API『File Search Tool』が凄い技術なのに、またまたサラッと発表されてました これ、正直に言うとRAG(Retrieval-Augmented Generation)の民主化という意味で本当にゲームチェンジャーだと思っていて。 ただ「RAGって何?」「何がすごいの?」という方も多いと思うので、できるだけ分かりやすく解説してみます。 ■ まず『RAG』って何なのか RAGとは、簡単に言うと「AIに参考資料を見ながら答えさせる仕組み」のことです。 通常のAIは、学習した知識(覚えていること)だけで答えます。でもRAGを使うと… ・あなたがアップロードしたPDF、Word、テキストファイルなどを参照 ・その内容に基づいて正確に回答 ・しかも「この情報は○○に書いてありました」と引用も示してくれる 試験で例えるなら「教科書持ち込み可」の状態。自分の記憶だけに頼らず、信頼できる資料を見ながら答えられるようになるイメージです。 身近で無料で使えるサービスに例えると、NotebookLMが一番わかりやすいと思います。 ■ 従来のRAG構築、何が大変だったか 実は、この「参考資料を見ながら答える」仕組みを作るのが、めちゃくちゃ大変でした。 具体的には ・文書を最適なサイズに分割する(チャンキング) → 大きすぎると検索精度が落ちる、小さすぎると文脈が失われる ・AIが理解できる数値データに変換する(エンベディング) → テキストをベクトル(数値の羅列)に変換する処理 ・専用のデータベースで管理する(ベクターDB) → PineconeやSupabaseなどのサービスが必要 ・検索精度を調整する → どの情報を引っ張ってくるかのチューニング ・継続的なコスト管理 → クエリごとに課金されるサービスも多い 開発者の方なら分かると思いますが、これ全部を自前でやろうとすると「数週間〜数ヶ月」かかります。外部サービスを使っても、インフラ管理や調整に結構な時間を取られる... 海外の反応を見ていると「Pineconeを使った不安定なバージョンと格闘していた」「パイプラインの再構築に数週間かかった」という声が多くて、多くの開発者が苦労していたことが分かります。 ■ File Search Toolが解決すること Googleの新しいFile Search Toolは、これらの面倒な作業を『全部自動化』してくれます。 具体的には ・ファイルストレージ → 自動管理(コーパスあたり最大1GB無料) ・最適なチャンキング → AI側で自動判断 ・エンベディング生成 → クエリ時は無料 ・ベクター検索 → 最新のGemini Embeddingモデルで駆動 ・コンテキスト注入 → プロンプトに自動で組み込み ・引用機能 → 回答に自動で引用元を表示 開発者がやることは 1. ファイルをアップロード 2. 5行程度のコードで統合 3. 普通にAPIを呼ぶだけ これ、本当に革命的だなと。 従来「数週間」かかっていたものが「サクッと作るプロトタイプ」レベルで実現できるようになった。 ■ コスト構造が画期的 個人的に一番驚いたのは、新しい料金体系です。 【無料の範囲】 ・ストレージ(コーパスあたり最大1GB) ・クエリ時のエンベディング生成 ・検索処理 【課金対象】 ・初期インデックス作成時のみ(100万トークンあたり$0.15) つまり、ファイルを最初に読み込ませる時だけ課金されて、その後のクエリ(検索)は何回やっても無料。 従来のベクターDBサービスだと、クエリごとに課金されることも多かったので、これは本当に破格です。特にスケールさせたいサービスにとっては、コスト予測が立てやすくなります。 ■ 具体的な活用例 すでに早期アクセスプログラムで、様々な使われ方をしています 【カスタマーサポートボット】 企業のFAQ、マニュアル、過去の問い合わせ記録を登録 → 顧客の質問に対して、正確な引用付きで即座に回答 → ハルシネーション(AI特有の嘘)のリスクが大幅に減少 【社内ナレッジアシスタント】 議事録、仕様書、技術文書を一元管理 →「あのプロジェクトの仕様書は?」という質問に2秒で回答 → 新入社員のオンボーディングが劇的に改善 【ゲーム開発プラットフォーム(Beam社の事例)】 実際に使っているBeam社(Phaser Studio)では: ・3,000以上のファイル、6つのコーパスを管理 ・テンプレート、コンポーネント、設計ドキュメントを横断検索 ・従来「数時間かかっていた手動クロスリファレンス」が2秒未満に短縮 ・「数日かかっていたプロトタイプ作成」が数分で完成 CTOのコメントが印象的で「弾丸パターンのコードスニペット、ジャンルテンプレート、またはPhaser『脳』コーパスからのアーキテクチャガイダンスなど、適切な資料を瞬時に見つけ出すことが可能になった」とのこと。 ■ 業界への影響 海外の反応を見ていると、かなり大きな波紋が広がっています。 ・「数百のRAGスタートアップを殺す」 ・「RAGのAWS Lambdaモーメント」 ・「RAGボイラープレートの70%を解決」 ・「一夜にしてエコシステムシフト」 特にPineconeやSupabaseなどのベクターデータベース企業への影響が指摘されていて、RAGインフラを専門にしていた企業のビジネスモデルが揺らぐ可能性も。 ただ、個人的にはこれは「技術の民主化」だと思っていて。参入障壁が下がることで、今まで諦めていた人がAIアプリを作れるようになる。結果的に市場全体は拡大するんじゃないかと。 インフラではなく、本質的な価値創造に集中できる環境が整ってきた感じがします。 ■ 強力なベクトル検索と引用機能 技術的に優れている点をもう少し補足すると 【セマンティック検索】 最新のGemini Embeddingモデルを使用 → キーワードが完全一致しなくても、意味やコンテキストから関連情報を発見 →「正確な単語を使わなくても」必要な情報が見つかる 【自動引用機能】 回答に使われたドキュメントの該当箇所を自動で表示 → 情報の検証が容易 → ハルシネーションのリスク軽減 → 信頼性の向上 【広範なファイル形式対応】 PDF、DOCX、TXT、JSON、Python、JavaScriptなど → 技術文書もコードも一緒に管理できる ■ 試してみたい方へ Google AI Studioで実際に触れるデモ「Ask the Manual」があります(APIキー必要) Pythonなら本当に5行程度のコード例で試せます 1. ファイル検索ストアを作成 2. ファイルをアップロード 3. generate_content()でFileSearchツールを指定 4. 回答と引用元を取得 詳しくはFile Searchのドキュメントを参照してみてください。 個人的には、これで「AIに専門知識を持たせる」ハードルが一気に下がったなと。 カスタマーサポート、社内ナレッジ管理、クリエイティブツール...様々な分野で活用が進みそうです。 RAGに興味があった方、AIアプリを作りたかったけど技術的なハードルで諦めていた方は、ぜひ一度触ってみてください。

日本語
0
0
1
433
やのけん
やのけん@yanokengineer·
生成AIのおかげで1人でアプリを作って世に出すハードルが劇的に下がった。 アプリ開発はこれからは創作活動や自己表現としての役割が強くなって、音楽やダンスのように趣味としてもっと広がる気がする
日本語
0
0
0
52
やのけん
やのけん@yanokengineer·
HIIT後のサウナは昇天しそうになる Life is good..
日本語
0
0
0
48
やのけん
やのけん@yanokengineer·
きたー! アップデートのたびに思うのは、ハードウェアとか普通のソフトウェア商品だと 『今までの製品では〇〇ができなかったけど、今回で〇〇ができるようになりました!』 が分かるけど、LLMだと性能が上がった以外は何ができるか未知数なのが宝探しみたいで楽しいよね share.google/mGPoVmqBXGOdt0…
日本語
0
0
0
43
やのけん
やのけん@yanokengineer·
つまりこういうこと。 というかなんでautoこんなにtoken使ってるの?! というか最近cusorのtoken消費量激しい気がするの自分だけ?笑
やのけん tweet media
日本語
0
0
0
74
やのけん
やのけん@yanokengineer·
ということでUltra課金しました😢 もうAIから逃れられない^o^
日本語
1
0
0
60
やのけん
やのけん@yanokengineer·
cursorのauto mode 軽微な修正とかやらせる位ならよいが、 それ以外の実装をautoでやらせると中途半端な実装とか間違ってることが多い。 結果、修正で余計にトークンを使う羽目になるから最初からgpt-5とか高性能モデル使ったほうがお金も時間節約になるからホントケチってはいけない。
日本語
1
0
3
155
やのけん
やのけん@yanokengineer·
AIにフロントの実装を指示して、 できあがったデザインをチェックする前の玉手箱を開けるようなワクワク感がたまらない
日本語
0
0
1
97
Tom220413
Tom220413@zi_Matsu·
エンジニアのみなさん、在宅だったらまぁ大体は素足で作業するじゃないですか。 まじ、足先冷え性になりません???
日本語
1
0
2
116
Tom220413
Tom220413@zi_Matsu·
Golangでなんか実装したいなー(静的言語でっていう意味なんで正味Goじゃなくても・・・)
日本語
1
0
3
191
やのけん
やのけん@yanokengineer·
TablePlusもっと早く買ってればよかった!! 機会損失という概念をやっと理解しました(T_T)
日本語
0
0
2
115
やのけん retweetledi
とみたかずき │ サポットさんの人
AIを活用した新しいタスク管理ツール「サポットさん」をリリースしました!!! Slack上のあらゆる依頼やタスクを一元管理して、AIがリマインドまでフォローしてくれます。 サービスサイト👇️ lp.sapot-san.com PRTimes👇️ prtimes.jp/main/html/rd/p… Slackご利用のチームの方、ぜひ気軽にお試しください!
日本語
1
7
55
11.1K