Isao Takaesu

6.8K posts

Isao Takaesu

@bbr_bbq

I'm an engineer, Machine Learning hacker and CISSP. Speaker at Black Hat Arsenal, DEFCON Demo Labs/AI Village, PyconJP, CODE BLUE etc., All opinions are my own.

Tokyo, Japan Katılım Kasım 2009

99 Takip Edilen2.5K Takipçiler

Isao Takaesu@bbr_bbq·2d

Broken ChatbotにJWT認証を追加。これにより、未認証でLLM APIにアクセスできなくなりました。AIレッドチーミングツールのテストに同Chatbotを使用する場合は、ログイン→チャット画面→プロンプトの送信、の手順を踏む必要があります（これが本Updateの目的）。 github.com/13o-bbr-bbq/Br…

日本語

263

Isao Takaesu@bbr_bbq·4 Nis

Claude Codeの使用上限に達したので、本日の作業は強制終了！これからの時代、仕事は「コアタイム」じゃなくて「エージェントの使用上限」を基準にするのが良さそう（笑） ※そもそも私にはコアタイムなんてないですが..

日本語

495

Isao Takaesu@bbr_bbq·30 Mar

OWASP Agentic AIに則ってマルチエージェントシステムの脆弱性および対策を検証できるやられアプリ「Broken MAS」をリリースしました。現在対応している脅威はT1, T2, T6など数種類ですが、今後徐々に増やしていきます。 #brokenmas github.com/13o-bbr-bbq/Br…

日本語

4.1K

Isao Takaesu retweetledi

セキュリティ・キャンプ@security_camp·29 Mar

セキュリティ・キャンプ2026コネクトは終了しました。受講生の皆さま、プロデューサー・講師・チューター・関係者の皆さま、ありがとうございました！たくさんのコネクトが生まれた4日間となりました。ご感想などは、ぜひ #seccamp タグでシェアしてください✨ またお会いしましょう！

日本語

5.1K

Isao Takaesu@bbr_bbq·19 Mar

Claude Codeの認証が通らない..一先ずCodexに切り替えよう。

日本語

767

Isao Takaesu@bbr_bbq·18 Mar

AIエージェントのみで100万行規模のソフトウエアを構築した実験の報告。人間の役割は「コードを書くこと」から「AIが働きやすい環境やルールを設計、適切なコンテキスト管理」へ変化し、これが適切に行われた環境下では開発速度が飛躍的に向上することが実証されたとのこと。 openai.com/ja-JP/index/ha…

日本語

661

Isao Takaesu@bbr_bbq·18 Mar

NVIDIA謹製、OpenClawを安全に稼働させるオーケストレータ「NemoClaw」。サンドボックス環境「OpenShell」により、エージェントのファイル操作や外部通信をシステムレベルで隔離・制御。OpenClawの自律動作を強固なセキュリティ環境内で実行可能とのこと。大変興味深い。 github.com/NVIDIA/NemoClaw

日本語

4.5K

Isao Takaesu@bbr_bbq·17 Mar

従来のセキュリティ検証はツールごとに分断されているが、実際の攻撃は様々な脆弱性や設定不備を組み合わせて実行される。本記事では、マルチエージェントとデータ基盤(適切なコンテキストを与える役割)を用いた検証手法を提案。数日かかる検証を数分に短縮できるとしている。 thehackernews.com/2026/03/why-se…

日本語

658

Isao Takaesu@bbr_bbq·16 Mar

OpenClawの脅威分析。スキル汚染や記憶ポイズニング、間接プロンプトインジェクションなど、従来の局所的な防御では防げない複数段階の攻撃を実証。対策として、初期化から実行までのライフサイクル全体を保護する5層の多層防御アーキテクチャを提案している。 arxiv.org/abs/2603.11619

日本語

2.2K

Isao Takaesu@bbr_bbq·15 Mar

Dify上のエージェントから呼び出すカスタムの検証用MCPサーバー、どこに立てようかと思っていたら、Hugging Face Spaceでサクッと無料で実現できるんだな。いやー便利だ。

日本語

688

Isao Takaesu@bbr_bbq·8 Mar

AIエージェントの「Skill」を細工する攻撃を数学的に防ぐフレームワークの提案。従来のパターンマッチングと異なり、形式的分析を用いて権限の逸脱がないことを証明する。540のSkillを用いたベンチマークにおいて、誤検知0%、F1スコア96.9%を達成したとのこと。 arxiv.org/abs/2603.00195

日本語

3.5K

Isao Takaesu@bbr_bbq·8 Mar

公式LLM（GPT-5等）を安価で制限なしに使えると謳う「Shadow API」の闇を暴いた内容。調査の結果、半分近くで安価な別モデルへの「すり替え」が発覚。これにより、推論や医療タスクの精度が大幅に低下し、安全性も不安定だったとのこと。 arxiv.org/abs/2603.01919

日本語

4.4K

Isao Takaesu@bbr_bbq·8 Mar

Jailbreakに関する最新論文を読み込み、自動で実行可能な攻撃コードに変換・評価するシステム「Jailbreak Foundry」の提案。手動実装による対応遅れを解消し、平均28分で高精度に攻撃を再現。ベンチマークの陳腐化に対するソリューションになるとのこと。とても興味深い。 arxiv.org/abs/2602.24009

日本語

603

Isao Takaesu@bbr_bbq·8 Mar

OpenClawのようなAIエージェントに対するDoS攻撃。無駄な作業を実行させるように細工したSkillを標的エージェントに導入させることで、検証と称して長文を何度も生成するなどしてコストを跳ね上げることが可能とのこと。 arxiv.org/abs/2603.00902

日本語

479

Isao Takaesu retweetledi

みのるん@minorun365·2 Mar

記事を投稿しました！ #Qiita Claude Codeですべての日常業務を爆速化しよう！ qiita.com/minorun365/ite…

日本語

399

3.6K

919.8K

Isao Takaesu@bbr_bbq·1 Mar

リソースや時間の制約（言い訳だが）で実行できなかった面白い構想が、具体的な指示を出すだけで実現できることは、効率化以上の効果をもたらすかもしれない。

日本語

363

Isao Takaesu retweetledi

The Hacker News@TheHackersNews·27 Şub

🔥 You can now ask Kali Linux tools in plain English — powered by Anthropic Sonnet 4.5. Through MCP, Claude SSHs into Kali to run tools like nmap, gobuster, nikto, hydra, sqlmap, metasploit, john, wpscan, enum4linux-ng, checks dependencies, and returns results in-app. 🔗 Read about it here → #ai-powered-command-execution" target="_blank" rel="nofollow noopener">thehackernews.com/2026/02/threat…

English

312

1.7K

185K

Isao Takaesu@bbr_bbq·26 Şub

Strands AgentsのAgent SOPsとAgents as Toolsの合わせ技で、Agent Skills風の動きを再現できた（SOPsのスキル呼び出し順の強制と"MUST"による幻覚防止でより堅牢）。これにより、OWASP Agentic AIをベースとしたMASに対する脅威モデリング自動化が実現できる（PoCレベルなら既にできた）。

日本語

916

Isao Takaesu retweetledi

Urayaha Days@SundererD27468·26 Şub

AIエージェントの管理について考えさせられるデータが出てた熟練ユーザーは全ステップを逐一承認するんじゃなくて自動で走らせて方針がズレた時だけ止める（中断率は9%くらい）逐一承認の方が「ちゃんと見てる」感あるけど実は認知負荷が高くて本当に大事な判断の質が下がりやすいらしい承認時に止まってからログをさかのぼるよりログを見ながら問題があれば止める方が全体の質は高くなるのかもしれない anthropic.com/research/measu…

日本語

3.2K

Isao Takaesu@bbr_bbq·26 Şub

せっかく便利なツールなので、「暴走するから使わない」とならないよう、暴走を抑制する「Steering」な仕組みが必要か。例えば、実行役エージェントに監視役エージェント（Guardian Agents）を張り付けるとか？ちょっと考えてみよう。 itmedia.co.jp/news/articles/…

日本語

465

Keşfet

@elonmusk @BarackObama @taylorswift13 @cristiano @BillGates @NASA @nikifrancismediavine @katyperry