Tweet Disematkan
shun|海外AI速報ラボ
258 posts

shun|海外AI速報ラボ
@shun_aiLaboo
海外AI情報を翻訳→実践→日本語で毎日発信🌏 ChatGPT/Claude/Geminiを駆使して海外AI動画を要約&実践 「これ日本でもやれるじゃん」を見つけるのが仕事 📩 海外AIリサーチ術→note
Bergabung Nisan 2026
83 Mengikuti87 Pengikut

正直、Codexの進化で、Web開発のフローがマジで変わりそうって感じてる。これからはこれまでみたいに
「コードを書く → ブラウザで確認 → 修正点を文章で説明」
ではなく、
x.com/NicolasZu/stat…
画面を見ながら、気になるUIを選択して、
そのままCodexに直させる方が合理的。
下の動画では、実際にCodex内で
・Web画面を操作する
・ゲームをプレイする
・Codex製のツールで建物を設計する
・UI要素を選択して修正指示を出す
・スクリーンショットを撮る
・ページ更新なしで変更を反映する
ところまでやっている。
これがヤバいのは、
Codexが単に「コードを書くAI」ではなく、
動いている画面を見ながら、
一緒に設計・修正・改善する制作環境
になり始めていること。
今までのWeb開発は、
頭の中のイメージを言語化する
↓
コードに落とす
↓
ブラウザで確認する
↓
違和感をまた言語化する
という往復が多かった。
でもこれからは、
画面を見る
↓
気になる場所を指差す
↓
「ここをこうして」と伝える
↓
その場で変わる
に近づいていく。
これは開発者だけの話じゃない。
PM、デザイナー、マーケター、起業家も、
完成前のプロダクトを見ながらAIと一緒に改善できるようになる。
Figmaで考える。
コードで作る。
ブラウザで確認する。
修正指示を出す。
この境界が、どんどん溶けてきている。
Codexはもう、
コード生成ツールというより、
プロダクトを見て、触って、直して、育てるための
AI開発環境になり始めてる。
Codexの使い分けが気になる人は、この下の記事を読むと理解が一気に深まる。マジでおすすめ👇
Codex Studio@Codestudiopjbk
日本語

@LxGtUGtlRSh8yXW このOX Securityのレポート、海外のAIセキュリティ界隈でかなり話題になってますね。stdio経由のRCEは「便利さ優先でセキュリティ後回し」の典型例として指摘されてます。
Anthropicもこれ受けてClaude Securityを公開ベータで出してきたので、対応は早い印象です
日本語

MCP(stdio)セキュリティ脆弱性
——20万台以上のAIエージェントサーバーが露出
venturebeat.com/security/mcp-s…
Anthropic発の MCP、
ちょっと洒落にならない話が出てきた。
OX Securityによると、
最大20万台規模のMCPサーバーが
任意コマンド実行のリスクに晒されているらしい。
しかも一番荒れているのが、
Anthropic側はこれを“想定された挙動”として見ている
という点。
問題の中心は STDIO のデフォルト挙動で、
ローカルツール接続のはずが、実質
コマンド実行面がそのまま開いている
ような状態になりうる、という指摘です。
これが怖いのは、
1つの製品のバグではなくて、
MCPを前提に作ったSDK
その上に乗る各種AIツール
IDEやエージェント基盤
レジストリ経由の配布
まで、設計思想ごと波及すること。
つまりこれは
「A社の製品に脆弱性がありました」
ではなく、
AIエージェント時代の標準インフラそのものに、危ないデフォルトが入っていたかもしれない
という話。
しかも厄介なのは、
製品ごとのパッチを当てても、
プロトコルのデフォルト思想が変わらない限り、
また同じ地雷を踏みうる
ところ。
ここ、かなり重要です。
AI業界ってつい
「どのモデルが賢いか」
「どのエージェントが便利か」
に目が行くけど、
本当に差が出るのはたぶんこれからで、
どれだけ安全なデフォルトで運用できるか
です。
便利さが勝ちすぎると、
あとでセキュリティが地獄を見る。
MCPの件は、
その未来をかなり早めに見せている気がする。

日本語

@TakMichiShirube 「うまくできた」と勝手に言う問題、海外だと"AI hallucination in agentic workflows"ってテーマでかなり議論されてますね。別AIに監査させる構成はまさに"AI watchdog"パターンで、今のベストプラクティスそのものです。
月$400で収まってるの優秀ですね。その構成、もう少し詳しく知りたいです!
日本語

@maskk_mfg_ai 海外の製造業AI導入事例を追ってると、成功してる中小は「全自動化」じゃなくて「1工程だけ自動化」から始めてるパターンがほとんどですね。
特に検品や在庫管理の一部だけAI化してROIを先に証明→現場の納得感を得てから拡大っていう流れが王道らしいです
日本語

@opennotes0302 海外だと"automation paradox"って呼ばれてて、自動化すると「次はこれも自動化できるのでは」って新しいタスクが見えてくる現象らしいです。結局やること増えるっていう笑
ただ作業の質は確実に上がってるから、楽にはならないけど出せるアウトプットの水準が変わってきますよね
日本語

@hujk OpenCode良いですよね。海外だとローカルLLMでコーディングエージェント動かす流れがかなり来てて、機密性の高いプロジェクトでは必須になりつつあります。API代ゼロでプライバシーも守れるのが強い
日本語

けっこう実用的。「OpenCode」×ローカルLLMで“無料Claude Code”してみた | ギズモード・ジャパン share.google/bTWbJyuGqbtxIV…
日本語

@ame_note 2週間で8000行はすごいですね。海外だと「vibe coding」って呼ばれてるこの流れ、非エンジニアが自分専用ツール作る事例が爆増してます。「既存アプリに挙折した人が自作する」ってまさに海外AI界隈でも注目のテーマです
日本語

@33linn Codexのペット機能、海外だと「開発中のモチベ維持に最高」って話題になってますね。キャラ付けしたペットがタスク完了時に反応してくれるの、地味に作業の続けやすさにつながるっていう声が多いです
日本語

@09y この「計画は高性能モデル、実装はコスパモデル」って海外だと「architect pattern」と呼ばれててかなり主流になってます。Deepseek V4のコスパは海外でも話題で、実装用に使う人急増中ですね。良い情報ありがとうございます
日本語

僕は今Cursor使ってないですが、GPT5.5で計画(というかissue)たてて、Deepseek V4やKimi2.6で実装してGPTにレビューさせてます
たぶんコンセプトは同じはず
コスパ良くておすすめ
Kinopee@kinopee_ai
Cursor ユーザの皆さん、安心して「Planモードは高推論モデル、Agentモードは Composer 2」で使ってください。 この問いに回答してくれたのは Tibor (Tee) 氏(Community Developer)、5/25(月)、CursorParty で来日予定なので、ぜひご参加ください。 aiau.connpass.com/event/392070/
日本語

@ahmedab1954 賢い判断ですね。海外だとClaude CodeとCodexの両方に同じタスク投げて出力比較する運用が流行ってます。Codexは並列処理得意なので、テスト生成とかリファクタ任せると制限かかりにくくて良いですよ
日本語

@Yuki_K25 めちゃわかります。海外だとAPI直接叩きで$20以下で同等の作業こなしてる人が多くて、Proプランのコスパ問題はかなり議論されてます。CodexやGemini CLIなど無料枠あるツールと併用して使い分けるのが今の流れですね
日本語

個人開発者視点で本音言うと…
Claude Code(Proプラン $20)だとすぐにlimit来るし、 Max 5x($100プラン)は高すぎるよな。
試しに$100プラン使ってみたけど、「使わないともったいない!」って無理にガンガン使っちゃってAI疲れが半端ない😂
ここぞって大事なときに「思う存分使える」柔軟なプランが欲しい… 例えば1週間使い放題とか日次高負荷プランとか!
Anthropicさん、個人開発者の実情に寄り添った課金体系マジで待ってます🙏
Claude Codeヘビーユーザーの皆さん、この新プランどう感じてますか? 特に個人開発・副業勢の意見聞きたい!
#Claude #ClaudeCode #AI開発 #個人開発
日本語

@sakashiiiii これ海外だとdotfiles方式で1つのリポジトリにskills集約して、各ツールからシンボリックリンクじゃなくスクリプトでコピー同期するパターンが増えてますね。壊れにくいし差分管理もしやすい。自分も最近そっちに切り替えました
日本語

@shun_aiLaboo おぉ!海外の生情報ありがとうございます✨
既に実際にこの考え方で設計が行われてるんですね
海外で印象的な具体的な事例とかあったらぜひ投稿とかで共有していただけるとありがたいです☺️
フォローさせていただいたので楽しみに待ってます
日本語

@subaru_shoji 海外でも「Codex App is the new IDE」って声が出始めてますね。ブラウザ操作もコード実行も全部一箱で完結するから、VS Codeとの差別化が加速的に進んでる印象です。海外エンジニアの間では「IDEの概念自体が変わる」って議論が熱いです
日本語

@DiscoTech__ めちゃくちゃ共感です。海外のdev界階でも「Claude Codeは学ぶものじゃなくて使うもの」って考え方が主流です。まず作りたいものを決めて、その過程で必要な機能を覚える。「触りながら考える」がまさに正解で、海外エンジニアもチュートリアルより実践から入る人が多いです
日本語

@ai_fukugyo_lab1 非エンジニアでも全然使えますよ!海外だと「カードをドラッグしたらAIが自動で開発」って概念を「vibe coding」って呼んでて、PMやディレクターがタスク管理だけでプロダクト作る流れが加速してます。コード書かなくてOKな時代が来てますね
日本語

カンバンボード×Claude Codeの連携、非エンジニアの僕には良くわかない・・・
Claude Code Studio@ClaudeCode_love
【衝撃】 カンバンボードのカードをドラッグするだけで Claude Codeが自動で開発を始める仕組みが登場🔥 これ何ができるかというと👇 x.com/om_patel5/stat… ・カードにタスクを書く ・「進行中」にドラッグする ・Claude Codeが自動で作業開始 ・カードごとにコンテキストを限定 つまり何が起きるかというと… 「プロジェクト管理」と 「AI開発」が 完全に融合し始めています。 具体的に👇 ・トークンの無駄遣いがゼロ ・タスクごとにスコープが自動設定 ・チーム開発にそのまま導入可能 1人で何人分もの開発が回せる時代。 生産性、エグいことになりそうです🔥
日本語











