shingo / エンジニアとAI
62 posts

shingo / エンジニアとAI
@sng_dev
都内で働くIT系のエンジニア。 AIエージェントの無限の可能性を探求しています。 Gemini / Antigravity / Cursor / Cloud Code あたりを触ってます。
เข้าร่วม Şubat 2024
26 กำลังติดตาม9 ผู้ติดตาม


Anthropicから、コードの脆弱性を自動で発見して修正まで提案する「Claude Code Security」のプレビュー版が発表された。これ、ゲームチェンジャーになるかも。
x.com/claudeai/statu…
---
発表の要点を3つに絞ると、
・人間のセキュリティ研究者のようにコードを理解
従来の静的解析ツールでは見逃されがちな、複雑なビジネスロジックの欠陥やアクセス制御の不備まで、文脈を読んで見つけ出す。
・専門家が見逃したバグを500件以上発見
最強モデル「Claude Opus 4.6」を活用。何年もの間、人間の専門家のレビューをすり抜けてきたオープンソースの脆弱性をすでに見つけ出している。
・誤検知をAI自ら検証し、パッチまで提案
AIが自分の発見を再チェックしてノイズを減らし、ダッシュボード上で修正コードを提示する。人間は内容を確認して承認するだけでOK。
---
これまでの「ツールによるチェック」から、「AIが主導で脆弱性を探し出して直す」フェーズへと突入した。
これ一部の脆弱性診断やペネトレーションテストを専門でやってるセキュリティ会社には、かなりの脅威になる気がしてる。
攻撃者がAIを使って脆弱性を探すスピードが爆上がりする近未来、防御側もAIをフルスイングで活用しないと絶対に間に合わなくなる。
セキュリティの常識が、ここから一気に変わりそう。
詳しくは公式サイトに書いてあります。
anthropic.com/news/claude-co…
#Claude
Claude@claudeai
Introducing Claude Code Security, now in limited research preview. It scans codebases for vulnerabilities and suggests targeted software patches for human review, allowing teams to find and fix issues that traditional tools often miss. Learn more: anthropic.com/news/claude-co…
日本語

Cursor v2.5で、AIエージェントが「待たずに並列で動く」ようになった。
cursor.com/ja/changelog/2…
Cursorの最新アップデートv2.5で、3つの機能が追加された。
---
3点に絞ると、
・非同期サブエージェント
これまでサブエージェントは順番待ちで親エージェントをブロックしていた。それが並列実行になり、複数の作業が同時進行できるようになった。大規模なリファクタリングや難しいバグ対応にも対応できる
・エージェントツリーの形成
サブエージェントがさらにサブエージェントを起動でき、連携した作業のツリー構造が作れる。複数ファイルにまたがる機能追加もこれで一気に現実的になった
・Cursor Marketplace
Figma・Stripe・AWSなどのプラグインを1発インストール。スキルやMCPサーバーを束ねたパッケージをエディタ内の `/add-plugin` だけで導入できる
---
「AIがコードを書く」から「複数のAIエージェントが並列でタスクを分担する」へ。
AntigravityもCursorも、この方向に向かっているのは偶然じゃない。エージェントの並行実行が、これからの開発環境の標準になっていく気がする。
#Cursor #AIエージェント
日本語

AntigravityにGemini 3.1 Proが来た。コード1行触る前に、設計図も全部書いてくれる時代になった。
GoogleのエージェントIDE「Antigravity」に、Gemini 3.1 Proが正式統合された。
antigravity.google/blog/gemini-3-…
---
記事の内容を3点に絞ると、
・推論力が一段上がった
複雑なワークフローで「最適なアプローチを考えながら動く」能力が強化。単純な回答では対処できないシナリオに強い
・コード1行書く前にアーキテクチャ全体を設計
データベース移行タスクでは、データ損失リスクを先読みしてLocal-FirstなSync engineと競合解決戦略まで自律生成
・PDFを読んで動くアプリを作る
論文を丸ごと読み込ませたら、CRDT実装のリアルタイム同期アプリを1つのタスクで完成させた
---
「コードを書いてくれるAI」のフェーズはとっくに終わっていて、今は「設計から実装まで考えながら動くエージェント」の時代に入ってる。
Gemini 3.1 Proの統合で、Antigravityがそのレベルにまた一段近づいた印象。
#Antigravity #Gemini #AI開発
日本語

Anthropicが公開した「AIエージェントの自律性」に関する最新レポートは、今後のAI評価の基準を大きく変える内容でした。
anthropic.com/research/measu…
リリース前のテストではなく、現場でどう動いているかを測る「実測値」への移行が始まっています。
---
▼ 3行要約
・Anthropicが、数百万回のAPI利用やClaude Codeのログを元に「AIエージェントが実環境でどれだけ自律的に動いているか」を測定した研究レポート。
・【何がすごいか①】机上のテスト(Eval)ではなく、AIが作業を開始してから停止するまでの「ターン継続時間」など、現場の生データを使って自律性を可視化したこと。
・【何がすごいか②】AIの能力を測るには事前のテストでは不十分であり、今後は「リリース後のモニタリング基盤」への投資が必須になるという事実を明確にしたこと。
---
僕を含め、多くの人がAIの性能を「ベンチマークのスコア」で判断しがちです。しかしこのレポートは、実際のログ(APIの連続呼び出し等)から「いかに人間に頼らず自走したか」を測る重要性を説いています。
事実情報に絞って読んでも、AI業界の評価軸が「賢さ」から「真の自律性」へとシフトしていく熱量を感じる内容です。
#Anthropic #AIエージェント
日本語

Claude Sonnet 4.6のコスパについて言及してみました〜。このAIモデルは人気になる予感!
Cursorではもう選択できるみたいですが、Antigravityにはまだです...。
shingo / エンジニアとAI@sng_dev
日本語

OpenAIがまたとんでもない人物を引き抜きました。「OpenClaw」の生みの親、Peter Steinbergerが参画です。
このニュース、単なるヘッドハンティングではありません。これまで「強力だけど野良ツール」扱いだった技術が、本家のインフラに組み込まれる合図かも。
---
▼ 3行でわかるニュース
・OpenClawの開発者であるPeter Steinbergerが、正式にOpenAIに入社することがSam Altmanのポストで判明。
・これまで個人開発や別組織で尖ったツールを作っていたトップ層が、続々とOpenAI本体に合流する流れが加速。
・セキュリティや運用面で懸念があったプロダクトの知見が、公式のガバナンス下で再構築される可能性を示唆。
---
僕自身、OpenClawの挙動には注目していましたが、セキュリティ面での懸念から導入を見送っていました。
しかし、彼が「中の人」になったのなら話は別。
あのPCを遠隔操作できる機能が、OpenAIの堅牢なセキュリティ基準で使えるようになる未来が確定しました。
これまで様子見していた層も、この動きは無視できなさそう。
x.com/sama/status/20…
#OpenClaw
日本語

Cursorの個人プランにおける「Composer 1.5の利用枠」が緩和されました。これを待っていた個人開発者は多いはずです。
cursor.com/ja/blog/increa…
今回のアップデートは単なる「枠の増加」ではなく、コストパフォーマンスと性能のバランスを再定義するものです。
---
▼ 忙しい人のための3行要約
・個人プランにおける「Composer 1.5の利用枠」利用上限が引き上げられ、Agent機能による長時間の自律コーディングが可能に。
・ベンチマーク性能は最新のOpus 4.6と比較して約8割のスコアを記録し、実用ラインを維持。
・コスト面ではOpus 4.6の約7割に抑えられており、性能対費用(コスパ)の観点で「普段使い」に最適化された仕様。
---
これまでは「月額の枠を気にしてAgentをフル稼働できない」というジレンマがありましたが、今回の変更でその心理的ハードルが下がります。
最高峰の知能(Opusなど)をピンポイントで使いつつ、開発の殆どをこの新しい枠組みで回すという運用が、これからのスタンダードになりそうです。
特に「とりあえず書いてみる」という試行錯誤のフェーズでの使い勝手が格段に向上するアップデートと言えます。
#Cursor #AI
日本語

「並列処理」の実装でAIの生産性が爆上がりしたけど、これ「課金トラップ」では...。
Antigravityの並列処理機能。これまで一つずつ待っていたタスクを一気に投げられるのは革命的ですが、手放しで喜べない現実があります。
---
・Antigravityでは複数のタスクやプロンプトを同時に走らせる「並列処理」が可能で、作業が効率的に。
・並行して別々の検証を行ったり、コードとドキュメントを同時に生成させたりできる。
---
正直、機能自体は最高です。待ち時間のストレスがゼロになるし、思考の速度で作業が進む。でも、このペースで使ってたら「一週間の利用制限」なんて1日で溶けるのでは?
「フェラーリ渡すけどガソリンは5リットルな」と言われているような気分。
Antigravityに関わらずAIエージェント開発元各社は、機能を増やす前に、まずこの上限を緩和してくれないと仕事でガッツリ使い倒せません。
#antigravity
Google Antigravity@antigravity
In Antigravity, you're not limited to one cursor. Spawn parallel agents to handle backend and frontend simultaneously and orchestrate like a pro.
日本語

Cursorの「Composer 1.5」がリリースされてた!
中身を見たら単なるアップデートではなく「別次元」の進化でした。
これまでのComposer 1は「速くて安い」が魅力でしたが、今回の1.5はそこに「推論能力(Thinking)」が実装されています。
---
▼ 忙しい人のための3行要約
・強化学習(RL)の規模を20倍に拡大し、複雑なタスクへの推論能力が劇的に向上
・「Thinking Tokens」により、コードを書く前にモデルが自律的に計画・思考するプロセスが追加
・コンテキストが溢れそうになると「自己要約(Self-summarize)」を行い、長時間のタスクでも記憶を維持
---
個人的にComposer 1の最大の魅力は、レスポンスの速さと圧倒的なコストパフォーマンスでした。今回の1.5はその「速さ」という武器を捨てずに、o1のような「思考力」を手に入れています。
特に「自己要約機能」は、長時間のコーディングでAIが指示を忘れるというこれまでの課題を解決するもので、実務での信頼性が段違いになりそうです。
v1の軽快な使用感を維持したまま、より複雑な設計も任せられるようになったという感じ。
日常使いと複雑な課題への対応の両面で活躍できそう。期待大。
#Cursor #Composer
Cursor@cursor_ai
Composer 1.5 is now available. We’ve found it to strike a strong balance between intelligence and speed.
日本語





