Dataibridge

207 posts

Dataibridge

Dataibridge

@Dataibridge_01

データサイエンティスト 統計×AIで事業の意思決定を支援 【専門】 需要予測・効果測定・広告宣伝費最適化 ・満足度調査・ベイズ・機械学習・LLM等。法人、個人向けの研修、勉強会、キャリア相談、データサイエンス初学者向けのコーチング、分析依頼のご相談はDM又はHPからお願いします。実務で使えるデータ活用ノウハウを発信👇

Katılım Kasım 2021
207 Takip Edilen613 Takipçiler
Dataibridge
Dataibridge@Dataibridge_01·
大規模言語モデル(LLM)の可能性を最大限引き出す「新プロンプトエンジニアリング」の基礎から高度手法まで、仕組み理解+実例たっぷりで体系的に解説した入門資料。 ・LLM出力設定の勘所:温度・Top-K・Top-Pなどのパラメータが生成結果に与える影響と、正確性・創造性をコントロールする調整方法 ・基本〜高度プロンプト手法:ゼロ/フューショット、役割・コンテキスト設定、Chain of Thought(CoT)、ReAct、Tree of Thoughts(ToT)などのテクニックと具体例(特にコード生成・デバッグに即活用可能) ・実務で差がつくベストプラクティス:JSON指定・シンプル設計・プロンプト文書化テンプレートで幻覚抑制と再利用性を爆上げする方法 LLMの仕組みからコード実例、ベストプラクティスのテンプレートまで一気通貫で図解豊富。理論止まりじゃなく「明日からすぐ試せる」実践レベルが抜群に高い。 speakerdeck.com/mickey_kubo/pr…
日本語
1
9
74
3.4K
Dataibridge
Dataibridge@Dataibridge_01·
PFN(Preferred Networks)の視点から、LLMの歴史的進化・技術的特徴・課題・実務活用・未来展望までを53スライドで徹底解説。 Transformer以降のGPTシリーズや国産LLM(PLaMo)のリアルな現在を一気に整理できます。 
・LLMの進化タイムラインとスケーリング法則:GPT-2→GPT-4oまでの性能比較と推論最適化(量子化・LoRAなど)の実践Tips
・PFNの実プロジェクト事例:GPSamplerによる2.5x高速化やAIBU/PLaMoの事後学習・コンテナ活用で現場のコスト削減・精度向上
・課題とリスク対策:幻覚・バイアス・倫理的注意点(Hinton氏警告含む)から法的枠組みまで、プロジェクトで即活かせるリスク評価ポイント 
理論だけじゃなくPFNの実際の開発事例と図解(タイムライン・グラフ・比較表)が豊富で、少し古いですが2024年までの動向(GPT-4o/Claude 3対応)を現場目線でまとめてくれています。 speakerdeck.com/pfn/llm-no-gen…
日本語
1
83
503
30.5K
Dataibridge
Dataibridge@Dataibridge_01·
Anthropic公式ベストプラクティスを基に、Claude Codeで「自律的に正確にコードを書かせる」ための7つの鉄則を体系的に整理。コンテキストウィンドウ管理から自動化まで、実務で即戦力になる実践ノウハウ満載です。 ・検証方法を与える&「探索→計画→実装」フェーズ分けで、Claudeの自己修正力を最大化(プロンプトBefore/After例が超具体的) ・CLAUDE.md設定、具体的なコンテキスト提供術、Plan Mode活用、セッション管理(/clearやUndo)でコンテキスト肥大化を防ぎ、精度を安定させる ・よくある失敗パターン回避+ヘッドレス自動化やサブエージェント活用で、反復作業を劇的に効率化(CI連携や複数セッションTipsも) 公式ガイドを「自分が読む用にMarpでまとめた」だけあって、プロンプト例・スクショ・失敗回避策が図解豊富で読みやすく、理論じゃなく「明日から現場で試せる」実践度が抜群に高い。 speakerdeck.com/minorun365/cla…
日本語
0
11
61
2.6K
Dataibridge
Dataibridge@Dataibridge_01·
ローカルLLMの基礎知識から2025年の実践的なモデル選び・ハードウェア選定・量子化Tipsまでを、勉強会登壇資料として超わかりやすく整理。個人PCで「自分だけのLLM」を動かすための全体像が一気に掴めます。 
・ローカルLLMの定義・メリット(プライバシー保護・カスタマイズ性)から仕組み(Transformer・アテンション)まで基礎固め、量子化(4bit/8bit)でメモリを劇的に節約するリアル計算
・2025年モデル分類とお手頃〜巨大モデルの選び方(Qwen3、Gemma3、GPT-ossなどの具体例と日本語性能比較、MoEの効率化、マルチモーダル対応)
・ハードウェア実践Tips(RTX 4090/5060 TiなどのGPUメモリ目安、Mac/EVO X2推奨、速度爆上げトレンド)+サーバー代替案まで 
理論詰め込みじゃなく「2025年11月時点の最新モデル名・価格・性能比較」が図解豊富で、すぐに自宅PCで試せる実践レベルが段違い。勉強会資料ならではの「今」感と具体性が強い。 speakerdeck.com/kishida/local-…
日本語
1
2
20
713
Dataibridge
Dataibridge@Dataibridge_01·
LLM拡張の「解体新書」として、RAG・Function Calling/Tool Useから最新のMCP(Anthropic)・A2A(Google)プロトコルまでを徹底深掘り。 図解とOracle実例満載で、プロンプト/ファインチューニングを超えた実践的な全体像が一気に腑に落ちます。 
・RAGの仕組みからChunkチューニング・Graph RAG/Agentic RAGまでと、RAGAsによる評価指標のリアルな使い方
・Function Calling / Tool UseのReActパターンとLangChain実装例、外部API連携の勘所
・MCPとA2Aの違い・セキュリティ(OAuthなど)・Oracle ADKデモまで、すぐに試せる実装Tipsと注意点 
基礎から最新プロトコルまでを1スライドでバランスよく網羅し、メリット・デメリット・図解・Oracle Cloud実例が超実践的で「読んだらすぐ動かしたくなる」レベルが高く、LLM拡張の迷いが減ります。 speakerdeck.com/oracle4enginee…
日本語
0
2
8
330
Dataibridge
Dataibridge@Dataibridge_01·
Overleaf・GitHubなどの定番ツールからGitHub Copilot・Cursor・Claude Codeなどの最新AIまで、コーディング&論文執筆の効率化をライブデモ満載で徹底解説。 
・AIコーディング入門&実践:Claude CodeやCopilotの活用デモ(HP自動生成など)、失敗例から学ぶ成功ポイントと仕様駆動開発の勘所
・自然言語AIで論文執筆効率化:Cursorを使った卒論英文化、Prism・Overleaf+Atlasで申請書作成のワークフロー改善Tips
・ツール選びのリアル:料金体系・セキュリティ対策・導入手順、CoT/ReActなどの仕組み理解で即現場適用可能な比較まとめ 
東大・阪大・サイバーエージェントの研究者3名による実例&ライブデモが豊富で、理論止まりじゃなく「研究室で明日から即試せる」即戦力レベルが圧倒的。 speakerdeck.com/matsui_528/min…
日本語
1
17
145
9.4K
Dataibridge
Dataibridge@Dataibridge_01·
ニューラル言語モデルの簡易チュートリアルから「よくある誤解」を解消。 LLMが「テキストを丸暗記してるわけじゃない」「次単語予測の仕方を柔らかい規則として学習してる」本質を、図解と論文引用でスッキリ整理してくれます。 ・LLMの作り方と学習プロセス:1兆語規模コーパスで「傾向を捉えて汎化」する仕組み(過学習vs汎化の図解付き) ・誤解解消の核心:記憶≠学習、内部で統語・意味・依存構造・色空間まで自動獲得する具体例(LSTMユニットやCIELAB空間の類似度図) ・おまけ深掘り:言語運用能力と論理・算術能力の関係、二分探索的なヒューリスティック計算のリアル 理論書やコード中心の資料とは違い、言語学×ML研究者の視点で「分野越えの議論を促進」する前提擦り合わせに特化。誤解をピンポイントで潰すビジュアル図解と実例が豊富で、すぐに議論や実務理解が深まります。 speakerdeck.com/eumesy/before-…
日本語
1
7
19
927
Dataibridge
Dataibridge@Dataibridge_01·
2024年版(97枚)から大幅に更新された、上記2025年版(157枚)です。 主な変更点 ・D章が完全に刷新  「生成モデルの問題点」→「Instruction Tuning(RLHF/DPO)」へ大幅ボリュームアップ 。RLHFの詳細解説+DPOの徹底比較を新規追加 ・GANとFlow-based Modelを本編から削除→付録Eへ移動 。→ Diffusion Modelがより中心に(2025年現在のデファクトにフォーカス) 新設コンテンツ  ・Hugging Faceおまけ(Qwenを試してみよう)  ・Alignmentのまとめ  ・FAQ(動画生成の仕組み、AIエージェントなど)  ・2024-2025年の最新論文を参考文献に追加 ■ 2025年最新版 speakerdeck.com/takahashihiros… (参考:2024年版) speakerdeck.com/takahashihiros…
日本語
0
1
6
711
Dataibridge
Dataibridge@Dataibridge_01·
最尤推定などの基礎から、VAE・GAN・Flowモデル・Diffusionモデル、Transformer/GPT系言語モデルまでを丁寧に解説。 さらにInstruction Tuning(RLHF/DPO)やアライメントの勘所まで、生成モデル全体を俯瞰できる2025年講義資料です。 ・生成モデルの基礎固め:確率分布・最尤推定・GMMから始まり、VAEの変分下界やDiffusionのノイズ追加/除去プロセスを数式と図でクリアに理解 ・深層生成モデルの比較:GANの不安定性、Flowモデルの可逆性、Diffusionの画質優位性(Stable DiffusionでのVAE+Diffusionハイブリッドなど)と2025年現在のデファクトスタンダード ・実践的なアライメント手法:RLHF vs DPOの違い、好みデータ活用の効率化、Hugging FaceでのBERT/GPT活用例や不適切出力防止のsemi-supervisedアプローチまで 基礎から最新トレンド(Diffusion支配、DPOの台頭、alignmentの課題)までバランス良く深掘りしつつ、図解と実例が豊富で「読んで終わり」にならない実践寄りの構成になっています。 speakerdeck.com/takahashihiros…
日本語
1
76
654
37.1K
Dataibridge
Dataibridge@Dataibridge_01·
リクルート新人研修で実際に使われた資料で、LLMの基礎原理から構築・活用の全体像まで、遊び要素を交えながらハンズオンで深く理解できる「LLMことはじめ」の決定版。理論と実践がバランスよく詰まっています。 ・LLMの基礎と仕組み:Tokenizer、Transformer、Auto-regressive生成、Scaling Laws、Pre-training / Instruction Tuning / Alignmentの流れをわかりやすく ・実践的な活用Tips:Promptingの勘所、Few-shotの創発性、Structured Output、温度・Top-k/Top-pなどの生成パラメータ調整、LLM-as-a-Judgeによる評価方法 ・ハンズオンで即試せるRAG構築:Closed LLMを使った簡易RAG(ドキュメント準備→ベクトル化→Retrieval→回答生成)のステップと、Open/Closedモデルの選び分け 新人研修向けに「飽きさせない・置いてけぼり防止・達成感」を徹底的に意識した構成で、俳句大会などの遊びから本格Deep Diveまでスムーズにつながり、理論だけじゃない「つくって使って実感」できる実践度が高いところ。 LLMを「ブラックボックス」から「自分の武器」に変えられるはず。 speakerdeck.com/recruitenginee…
日本語
1
47
413
22.8K
Dataibridge
Dataibridge@Dataibridge_01·
ChatGPTが「人間のフィードバックから強化学習(RLHF)」で劇的に進化した理由を、InstructGPT論文ベースで丁寧に解説。GPTシリーズの基礎からコア技術のアライメントまで、技術的背景が一気に理解できる神資料。 ・GPTの進化史とTransformer・言語モデルの基礎:事前学習からfew-shot、CodeX/Copilotまでを整理 ・InstructGPTのRLHFプロセス:従来GPTの問題点(有害出力など)→人間フィードバックによる好ましい出力へのアライメント手法と性能向上の仕組み ・ChatGPTの実力と限界:自然な対話・コード生成・要約などの活用例と、事実誤認などの弱点、ModerationAPIなどの周辺技術まで 東大研究室内で共有されただけあって、論文引用が豊富で推測部分も明示。理論と実用がバランス良く、初心者でも読み進めやすい図解・整理が秀逸なところ。 「ChatGPTってすごい」の理由が腹落ちして、プロンプトの打ち方も変わるはず。 speakerdeck.com/imai_eruel/cha…
日本語
0
0
5
492
Dataibridge
Dataibridge@Dataibridge_01·
生成モデルの基礎(確率分布・最尤推定)から、VAE・GAN・Flow・Diffusionなどの深層生成モデル、Transformerを中心とした言語モデルまでを体系的に解説。 Hugging Faceの実践例や生成AIの課題(ハルシネーションなど)もカバーした約97スライドの充実講義資料です。 ・生成モデルの基礎:最尤推定やガウス混合モデルから始まり、深層学習での近似手法(ELBOなど)を丁寧に導出 ・各モデルの比較と特徴:VAE(訓練容易だが品質低め) vs GAN(高品質だが不安定) vs Flow(確率計算可能) vs Diffusion(高品質だが計算コスト高)を実例・数式で整理 ・言語モデルと実践:Transformer/BERT/GPTの進化、Hugging Faceを使った日本語テキスト補正などのコード例、RLHFなどの人間フィードバックの重要性と課題対応 大学講義レベルの体系性と数学的丁寧さがありつつ、モデル間の比較・トレードオフ・実装Tipsまでバランスよくまとめられている実践寄りの深さ。理論だけ・コードだけに偏っていません。 生成AIを「使う」だけでなく「理解して活かす」レベルに引き上げてくれそうな神資料です。 1回読めば、ChatGPTやStable Diffusionの裏側がぐっと腑に落ちやすくなります。 speakerdeck.com/takahashihiros…
日本語
0
57
507
26.6K
Dataibridge
Dataibridge@Dataibridge_01·
非情報系研究者向けに、ニューラルネットワークの基礎からTransformerとAttention機構までを、図解でわかりやすく解説。 ChatGPT級のAIがどう動くかの全体像がつかめ、ハンズオンで実際に動かして体感できます。 ・ニューラルネットワークの基礎:ニューロンの仕組み、重み・活性化関数、学習の流れを直感的に理解(数式は最小限、図で視覚的に) ・Transformerの本質:Encoder-Decoder構造、Attention(QKV)の計算プロセス、文脈依存の扱い方をステップバイステップで把握 ・実践ハンズオン:Google ColabでNN基礎実行→Transformer動かし→遺伝子データ(DNAウイルス判別)に応用。感情分析や翻訳の例も 情報系じゃない研究者目線で「概念理解+すぐ動かせる」を徹底的に意識した119ページの丁寧設計。数理的厳密さより「研究でどう活かすか」の入り口を重視していて、初心者が挫折しにくい。 speakerdeck.com/rishiyama/fei-…
日本語
1
72
581
32.1K
Dataibridge
Dataibridge@Dataibridge_01·
Transformerを起点に、LLM・生成AI・RAG・エージェントAI・MCPまでの現代AI主要概念を、6つの章で一貫した物語として丁寧に解説。 AIの「三重の進化」(計算→認知、生成→行動、孤立→協調)を羅針盤のように整理してくれます。 ・Transformerの核心(アテンション機構)と、それがLLMのスケーリング・創発能力を生んだ仕組み ・LLMの限界(ハルシネーションなど)をRAGでどう克服するか、生成AIからエージェントAIへのパラダイムシフト ・MCP(Model Context Protocol)の役割と、エージェント同士の協調・ツール連携による未来のAIエコシステム像 比喩を多用した直感的な図解と、技術の歴史的・論理的なつながりを「羅針盤」として一つの物語にまとめてくれています。理論の羅列ではなく、全体像がスッキリ腑に落ちます。 これ1回読めば、現代AIの地図が頭の中に描けて、次に学ぶべきことや現場での活用イメージが明確になりそう。 speakerdeck.com/mickey_kubo/tr…
日本語
1
27
288
14.6K
Dataibridge
Dataibridge@Dataibridge_01·
PyCon JP 2019での発表資料「Pythonによる日本語自然言語処理 〜系列ラベリングによる実世界テキスト分析〜」 nagisaライブラリを使った単語分割・品詞タグ付けから、系列ラベリングによる固有表現抽出(NER)まで、実世界テキストを分析する実践的な流れを丁寧に解説。 ・nagisaの基本活用:pip install一つで即開始できる単語分割・品詞タグ付け(extract/filter機能も便利) ・系列ラベリングの実装:Bidirectional LSTMで単語分割(BMESタグ)やPOSタグ付け、NER(人名・組織名・地名など)を高精度で抽出する方法 ・実践Tips:カスタム辞書追加、誤抽出のエラー分析→再学習ループ、KWDLCコーパスを使ったモデル訓練と評価(F1スコア向上の流れ) 理論解説だけでなく、PyCon登壇レベルのハンズオンコード例とGitHubチュートリアルが揃っていて、すぐに手を動かして日本語NLPパイプラインを試せる。 これ1枚読めば、日本語テキスト分析の「現場で使える」勘所がかなり掴めます。 speakerdeck.com/taishii/pycon-…
日本語
0
1
7
504
Dataibridge
Dataibridge@Dataibridge_01·
IBIS 2025チュートリアル資料として、強化学習の数理的枠組みから深層基盤モデルへの応用までを「驚きから理論に基づく納得へ」と体系的に整理。RLHF、DPO、報酬モデル、ベストオブNなどの実践トピックを直感+数式で深掘り。 ・強化学習の基礎枠組み:逐次的意思決定、数理的定義、環境との試行錯誤を深層基盤モデル(ポリシー・報酬モデル)でどう捉えるか ・モデルアライメントの実践:DPOの一般化、KL散度制御、報酬モデルの過最適化問題とスケーリング法、ベストオブNサンプリングの理論的保証 ・探索・活用の勘所:RLHFプロセス、SFTとの組み合わせ、探索アルゴリズムの図解と収束のポイントまで現場で活かせるTips 理論の「なぜ」を丁寧に解説しつつ、DPOやBoNなどの最新トピックを104スライドで図解豊富に繋げているので、ただのサーベイではなく「腑に落ちて実装に活かせる」実践理論ハイブリッド資料。 speakerdeck.com/akifumi_wachi/…
日本語
0
1
4
467
Dataibridge
Dataibridge@Dataibridge_01·
「Attentionって結局何?」「RNNからどう進化したの?」 この疑問を、基礎から丁寧に1.5時間で一気に解決してくれる神入門スライド。 慶應義塾大学Semantic Machine Intelligence Lab.(杉浦孔明教授)の講演資料で、ニューラルネット基礎→RNN/LSTMの限界→Attention機構→Transformerの全体像までを、図解満載で直感的に解説。QKVや位置エンコーディングのコンセプトがスッキリ腑に落ちます。 ・ニューラルネットの基礎復習からRNN/LSTMの問題点(長距離依存・勾配消失)を明確にし、Attentionの直感的理解(Nadaraya-WatsonからQKV、scaled dot-product attentionの計算式まで) ・位置エンコーディング(sin/cos三角関数の周期性)、Multi-Head Attention、残差接続・Layer NormなどのTransformerキーコンポーネントをステップバイステップでマスター ・過学習対策(Batch Norm vs Layer Norm)やインタラクティブツール(Transformer-explainer)の活用法まで、現場で生成AIの仕組みを活かすための概念理解が深まります。 理論詰め込みすぎず、図解・アナロジー(時計針など)が豊富で「1.5時間で基礎からTransformerまで」一気に理解できる構成。数式も最小限(内積・行列・指数関数のみ)で初心者に超優しいところ。 これ読めばTransformerのコンセプトが一気にクリアに! speakerdeck.com/keio_smilab/a-…
日本語
0
99
760
53.1K
Dataibridge
Dataibridge@Dataibridge_01·
「AIエージェントって結局何?」「どうやって作るの?最新の仕組みやツール知りたい」 そんな疑問に、54ページの神スライドが超丁寧に答えてくれます。 いまこそ学ぶLLMベースのAIエージェント入門 ― 基本的なしくみ/開発ツール/有名なOSSや論文の紹介 この資料で具体的に学べたり活かせる内容 ・LLMベースAIエージェントの基本的な仕組み(MRKL、ReActなど)を図解で整理 ・LangGraph、OpenAI Assistants APIなど実務で使える最新開発ツールの選び方 ・有名OSSや重要論文で実装された工夫点をピックアップしてすぐ応用可能 仕組みの基礎からツール・論文まで体系的に網羅していて、入門者でも「これで動かせる!」となる実践寄りの内容が詰まっています。 speakerdeck.com/os1ma/imakosox…
日本語
0
0
5
350
Dataibridge
Dataibridge@Dataibridge_01·
LLM(Amazon Bedrockなど)を使って、ドキュメントからRAG評価専用の合成テストデータ(質問・回答・変形質問・参照テキスト)を自動生成する方法を、実際に動くアプリ実装レベルで解説。 ・PDF/Word/Text/CSVからチャンク分割→LLMで高品質な質問回答ペアを一括生成する具体的なフロー ・質問の口語的変形や検証用参照テキストもオプションで自動作成できる実装Tips ・Streamlit + LangChain + Bedrockで作ったWebアプリの事例(三菱電機ニュースリリースPDFを使った実際の生成例付き) AWSマネージドサービスを活用した実装コードのイメージと具体的な生成事例がしっかり載っていて、明日からすぐ試せます。 speakerdeck.com/licux/llmniyor…
日本語
0
1
1
229
Dataibridge
Dataibridge@Dataibridge_01·
RAGの精度が劇的に上がる」勘所が掴める資料。 実例(薬の窓口やOptageなどの導入プロジェクト)で紹介するRAG構築時のリアル知見と、精度をグッと上げる具体的な勘所を徹底解説。基礎から現場で使えるTipsまで一気に学べます。 これからRAGをビジネスに本格導入したいエンジニア、すでに作ったけど精度改善で詰まってるデータサイエンティスト・AI実務者。理論じゃなく「即試せる」内容が欲しい人に最適。 ・構築時の知見:マネージドサービス(Bedrock Knowledge Baseなど)やAWS公式テンプレート活用で最小工数でRAGを立てる進め方と注意点 ・精度改善の勘所:2段階アプローチ(ユーザー試用→分析→目標合わせ→改善)で、CSV途中抽出・類似ドキュメント混同・PowerPoint読み順ズレなどの実例と即解決策 ・暗黙知対応:社内用語集作成やタグ付け・マルチモーダルモデル活用で「新入社員レベル」の高品質回答を実現する方法 机上論や抽象論じゃなく、クラスメソッドの実導入事例ベースで「なぜ起きたか→どう直したか→結果どう変わったか」がビフォーアフター付きで超具体的。再現性バツグンで現場すぐ活かせる! speakerdeck.com/yamahiro/shi-l…
日本語
0
1
2
243