Isao Takaesu

6.8K posts

Isao Takaesu banner
Isao Takaesu

Isao Takaesu

@bbr_bbq

I'm an engineer, Machine Learning hacker and CISSP. Speaker at Black Hat Arsenal, DEFCON Demo Labs/AI Village, PyconJP, CODE BLUE etc., All opinions are my own.

Tokyo, Japan Katılım Kasım 2009
99 Takip Edilen2.5K Takipçiler
Isao Takaesu
Isao Takaesu@bbr_bbq·
Broken ChatbotにJWT認証を追加。これにより、未認証でLLM APIにアクセスできなくなりました。AIレッドチーミングツールのテストに同Chatbotを使用する場合は、ログイン→チャット画面→プロンプトの送信、の手順を踏む必要があります(これが本Updateの目的)。 github.com/13o-bbr-bbq/Br…
日本語
1
0
2
263
Isao Takaesu
Isao Takaesu@bbr_bbq·
Claude Codeの使用上限に達したので、本日の作業は強制終了!これからの時代、仕事は「コアタイム」じゃなくて「エージェントの使用上限」を基準にするのが良さそう(笑) ※そもそも私にはコアタイムなんてないですが..
日本語
0
0
3
495
Isao Takaesu
Isao Takaesu@bbr_bbq·
OWASP Agentic AIに則ってマルチエージェントシステムの脆弱性および対策を検証できるやられアプリ「Broken MAS」をリリースしました。現在対応している脅威はT1, T2, T6など数種類ですが、今後徐々に増やしていきます。 #brokenmas github.com/13o-bbr-bbq/Br…
Isao Takaesu tweet media
日本語
0
12
60
4.1K
Isao Takaesu retweetledi
セキュリティ・キャンプ
セキュリティ・キャンプ@security_camp·
セキュリティ・キャンプ2026コネクトは終了しました。受講生の皆さま、プロデューサー・講師・チューター・関係者の皆さま、ありがとうございました!たくさんのコネクトが生まれた4日間となりました。ご感想などは、ぜひ #seccamp タグでシェアしてください✨ またお会いしましょう!
セキュリティ・キャンプ tweet media
日本語
0
16
62
5.1K
Isao Takaesu
Isao Takaesu@bbr_bbq·
Claude Codeの認証が通らない..一先ずCodexに切り替えよう。
日本語
0
0
3
767
Isao Takaesu
Isao Takaesu@bbr_bbq·
AIエージェントのみで100万行規模のソフトウエアを構築した実験の報告。人間の役割は「コードを書くこと」から「AIが働きやすい環境やルールを設計、適切なコンテキスト管理」へ変化し、これが適切に行われた環境下では開発速度が飛躍的に向上することが実証されたとのこと。 openai.com/ja-JP/index/ha…
日本語
0
0
12
661
Isao Takaesu
Isao Takaesu@bbr_bbq·
NVIDIA謹製、OpenClawを安全に稼働させるオーケストレータ「NemoClaw」。サンドボックス環境「OpenShell」により、エージェントのファイル操作や外部通信をシステムレベルで隔離・制御。OpenClawの自律動作を強固なセキュリティ環境内で実行可能とのこと。大変興味深い。 github.com/NVIDIA/NemoClaw
日本語
0
5
72
4.5K
Isao Takaesu
Isao Takaesu@bbr_bbq·
従来のセキュリティ検証はツールごとに分断されているが、実際の攻撃は様々な脆弱性や設定不備を組み合わせて実行される。本記事では、マルチエージェントとデータ基盤(適切なコンテキストを与える役割)を用いた検証手法を提案。数日かかる検証を数分に短縮できるとしている。 thehackernews.com/2026/03/why-se…
日本語
0
1
9
658
Isao Takaesu
Isao Takaesu@bbr_bbq·
OpenClawの脅威分析。スキル汚染や記憶ポイズニング、間接プロンプトインジェクションなど、従来の局所的な防御では防げない複数段階の攻撃を実証。対策として、初期化から実行までのライフサイクル全体を保護する5層の多層防御アーキテクチャを提案している。 arxiv.org/abs/2603.11619
日本語
0
2
35
2.2K
Isao Takaesu
Isao Takaesu@bbr_bbq·
Dify上のエージェントから呼び出すカスタムの検証用MCPサーバー、どこに立てようかと思っていたら、Hugging Face Spaceでサクッと無料で実現できるんだな。いやー便利だ。
日本語
0
1
3
688
Isao Takaesu
Isao Takaesu@bbr_bbq·
AIエージェントの「Skill」を細工する攻撃を数学的に防ぐフレームワークの提案。従来のパターンマッチングと異なり、形式的分析を用いて権限の逸脱がないことを証明する。540のSkillを用いたベンチマークにおいて、誤検知0%、F1スコア96.9%を達成したとのこと。 arxiv.org/abs/2603.00195
日本語
0
9
61
3.5K
Isao Takaesu
Isao Takaesu@bbr_bbq·
公式LLM(GPT-5等)を安価で制限なしに使えると謳う「Shadow API」の闇を暴いた内容。調査の結果、半分近くで安価な別モデルへの「すり替え」が発覚。これにより、推論や医療タスクの精度が大幅に低下し、安全性も不安定だったとのこと。 arxiv.org/abs/2603.01919
日本語
0
11
38
4.4K
Isao Takaesu
Isao Takaesu@bbr_bbq·
Jailbreakに関する最新論文を読み込み、自動で実行可能な攻撃コードに変換・評価するシステム「Jailbreak Foundry」の提案。手動実装による対応遅れを解消し、平均28分で高精度に攻撃を再現。ベンチマークの陳腐化に対するソリューションになるとのこと。とても興味深い。 arxiv.org/abs/2602.24009
日本語
0
1
8
603
Isao Takaesu
Isao Takaesu@bbr_bbq·
OpenClawのようなAIエージェントに対するDoS攻撃。無駄な作業を実行させるように細工したSkillを標的エージェントに導入させることで、検証と称して長文を何度も生成するなどしてコストを跳ね上げることが可能とのこと。 arxiv.org/abs/2603.00902
日本語
2
0
8
479
Isao Takaesu
Isao Takaesu@bbr_bbq·
リソースや時間の制約(言い訳だが)で実行できなかった面白い構想が、具体的な指示を出すだけで実現できることは、効率化以上の効果をもたらすかもしれない。
日本語
0
0
2
363
Isao Takaesu retweetledi
The Hacker News
The Hacker News@TheHackersNews·
🔥 You can now ask Kali Linux tools in plain English — powered by Anthropic Sonnet 4.5. Through MCP, Claude SSHs into Kali to run tools like nmap, gobuster, nikto, hydra, sqlmap, metasploit, john, wpscan, enum4linux-ng, checks dependencies, and returns results in-app. 🔗 Read about it here → #ai-powered-command-execution" target="_blank" rel="nofollow noopener">thehackernews.com/2026/02/threat…
The Hacker News tweet media
English
44
312
1.7K
185K
Isao Takaesu
Isao Takaesu@bbr_bbq·
Strands AgentsのAgent SOPsとAgents as Toolsの合わせ技で、Agent Skills風の動きを再現できた(SOPsのスキル呼び出し順の強制と"MUST"による幻覚防止でより堅牢)。これにより、OWASP Agentic AIをベースとしたMASに対する脅威モデリング自動化が実現できる(PoCレベルなら既にできた)。
日本語
0
1
3
916
Isao Takaesu retweetledi
Urayaha Days
Urayaha Days@SundererD27468·
AIエージェントの管理について考えさせられるデータが出てた 熟練ユーザーは全ステップを逐一承認するんじゃなくて 自動で走らせて方針がズレた時だけ止める(中断率は9%くらい) 逐一承認の方が「ちゃんと見てる」感あるけど 実は認知負荷が高くて本当に大事な判断の質が下がりやすいらしい 承認時に止まってからログをさかのぼるよりログを見ながら問題があれば止める方が全体の質は高くなるのかもしれない anthropic.com/research/measu…
日本語
0
7
31
3.2K
Isao Takaesu
Isao Takaesu@bbr_bbq·
せっかく便利なツールなので、「暴走するから使わない」とならないよう、暴走を抑制する「Steering」な仕組みが必要か。例えば、実行役エージェントに監視役エージェント(Guardian Agents)を張り付けるとか?ちょっと考えてみよう。 itmedia.co.jp/news/articles/…
日本語
0
0
7
465