生成AIに人生捧げた人｜大束良明

1K posts

生成AIに人生捧げた人｜大束良明

@otsukaroom

いろいろ作って生きてる24歳。物販でバズった → 海洋プラ事業 → 今は、実店舗の集客をAIで効率化するアプリを開発しています。LLM無職3年目 ☻϶

日本 Katılım Şubat 2020

1.3K Takip Edilen431 Takipçiler

Sabitlenmiş Tweet

生成AIに人生捧げた人｜大束良明@otsukaroom·13 May

Googleマップの評価や口コミ、なんとなく放置していませんか？実店舗の集客を、勘ではなく“数字”で伸ばす。店舗集客に特化したAIアプリ「クチトル」を開発しました！クチトルは、Googleビジネスプロフィールの運用や口コミ対策をサポートし、お店の魅力がしっかり伝わる状態づくりを支援するアプリです。実際に、Googleマップの口コミ評価がわずか1週間で 4.1 → 4.7 に改善した事例も出ています。「Googleビジネスプロフィールの運用を自分でできるようになりたい」「口コミを増やしたい」「集客をなんとなくではなく、数字で改善したい」そんな店舗様を、私たちが全力でサポートします。今回、さらに多くの店舗様にクチトルの効果を体感していただくため、 30日間の無料トライアルを実施します。実店舗の売上を、感覚ではなく実数で上げにいく。その第一歩を、クチトルで始めませんか？ 30日無料トライアルをご希望の方は、DMでご連絡ください！ kuchitoru.com

日本語

4.3K

生成AIに人生捧げた人｜大束良明@otsukaroom·1h

今の環境だとCodexが良いのは激しく同意なのですが、最近、Claude codeのライトユーザーが増えてると思いまして、Proプランだと Opusがまともに使えないので、Sonnetでなんとか開発したい層に向けたてポストした次第です！🫡 あと、サブエージェントとの連携はClaudeの方が優秀だと思っています。ちなみに僕は、GPT-5.5 xhigh 常用してます笑

日本語

ナビ@narrativenavi·6h

@otsukaroom それならCodexのがいいぞ！まじで今の環境でSonnetは意味がない。強火オタクからでした。

日本語

生成AIに人生捧げた人｜大束良明@otsukaroom·17h

自分用に個人開発をしている人はもうちょっとライトでもいいと思っていて、（特にClaude Proプラン Sonnetで回しているような人）要するに元ポストの肝はコンテキストを共有しないAIにレビューさせることだから、１,親エージェントがプランニング ↓ ２,サブエージェントAが実装担当（新規ブランチ作成）　↕︎レビュアーがOK出すまで自己改善ループ３,サブエージェントBがレビュアー（１レビューで停止して、実装が返ってきたら新規のサブエージェントCを起動する） ↓ ４,親エージェントに差分レベルでレビューしてメインに統合このワークフローで実行するだけで割と良いコードに仕上がるよ。skillsにしておくといいよ。

J@xjuntaro

AI駆動開発、この手法が最強すぎる↓ １）Codexと相談してプランニング、仕様書作成２）プランをサブエージェント3並列レビュー３）レビュー結果を反映４）単体・e2eテストの実装計画を仕様書に追記５）テストの網羅性についてサブエージェント3並列レビュー６）そのままCodexが実装７）テスト駆動開発実施（テストコードが全部通るまでAIが自律的試行錯誤）８）実装状態をサブエージェント3並列レビュー９）レビュー結果を反映１０）最後にテストコードが全部通ることを改めて確認１１）Vercelのプレビュー環境で軽く手動テスト動作確認１２）GitHubにプルリクエストを作成「サブエージェント3並列レビュー」のレビュー観点は細かくSkillsにしてます。そして週末定期的にコードベースをClaude Code Webの10並列とかで一気にリファクタリングして綺麗にする。これもテスト駆動開発で自動テスト通る前提でプルリクエストMerge。デプロイ前にプレビュー環境で手動テスト。これの凄いところは、AI駆動開発のワークフローをGitHub上で環境整えれば、業務委託先とかチーム開発で標準化して、ある程度誰でも似た水準の品質で開発させられること。見れば分かる通り、人間レビューの前にAIレビューを各所で合計「9回」入れているので、人間レビューは要件・設計レベルの重要なレイヤーだけに集中出来る。シニアエンジニアが準備した完璧なAI駆動開発ハーネス環境をジュニアエンジニアに使わせるイメージ。

日本語

2.3K

生成AIに人生捧げた人｜大束良明@otsukaroom·3h

@thsottiaux このXの雰囲気に賭けて、昨日週間制限を20%まで費やした。thank you tibo

日本語

Tibo@thsottiaux·9h

Some of you noticed limits drained faster in Codex, we root caused it to an optimization that we rolled back that had an impact on cache hit rates when compacting across long running sessions. We fixed this and have now reset usage limits for all accounts. Enjoy the weekend.

Kappaemme@Kappaemme1926

CODEX LIMITS ARE FIXED!

English

806

408

8.6K

630.9K

生成AIに人生捧げた人｜大束良明@otsukaroom·16h

@araz32008658 Codex Security でも脆弱性発見できなかったですか！？

日本語

961

medaka.base.eth ⛩@araz32008658·18h

すごいなこれ自作Defiを監査させたら11件の脆弱性発見 Claude Codexでは問題無しだったんだけどでも８時間かかった

Nyx Foundation@NyxFoundation

【お知らせ】コードではなく「仕様書」からバグを見つけるAIセキュリティ監査ツールを、本日OSS公開しました。名前はSPECA。Specification-to-Checklist Agentic Auditing Framework の略です。 SPECAは、「仕様駆動（Specification-driven）」で高信頼性ソフトウェアを監査するための、AIエージェント型セキュリティ監査フレームワークです。従来のコード駆動型ツールとは、根本的に異なるアプローチを取っています。自然言語で書かれた仕様、たとえば EIP やコンセンサス仕様書などから、まず明示的な型付きセキュリティプロパティ（Invariant / Precondition / Postcondition / Assumption）を抽出します。次に、それらを STRIDE + CWE Top 25 に基づく脅威モデルで整理します。そのうえで、各実装に対して proof-attempt reasoning、つまり「このプロパティが成立することを証明してみろ」と構造的に問いかけることで、仕様と実装のギャップを検出します。これにより、次の3つの価値を提供します。 - 仕様レベルでしか表現できない脆弱性: コードパターンだけでは拾えない、仕様由来のバグを検出できる - 複数実装間の横断比較: 同じプロパティ辞書で、複数の実装を一律に評価できる - 偽陽性の原因分析: 根拠を完全にトレースし、偽陽性を根本原因ごとに分解できる「これまでの実績」 SPECAは、これまで以下のような対象で実際に脆弱性を発見してきました。・Intmax ZK実装・SP1 zkVM実装・Ethereumクライアント実装20件以上・その他多数の DeFi プロトコル / OSSプロジェクト直近の Sherlock Ethereum Fusaka 監査コンテストデータを用いた再実験では、既知の脆弱性15件すべてを検出し、さらに追加バグ4件を独立に発見しました。 RepoAudit C/C++ ベンチマークでも、他のバグ発見AIと比較して最高水準の精度を維持しつつ、12件の新規候補バグを報告しています。「なぜ今、全部OSS公開するのか？」 SPECAの核心である以下の要素を、すべて公開しています。 - プロンプト: AIエージェントのハルシネーションを徹底的に抑えるproof-attemptプロンプト設計 - 再帰的自己改善: 偽陽性を削減しながら H/M/L リコールを維持する 3-gate audit-reviewループ（Dead Code / Trust Boundary / Scope） - ハーネス: 並列化、リジューム、予算制御、circuit breakerまで完備した再利用可能なPythonオーケストレータ - 解釈可能性: 全ステップのログ・出力をJSONで構造化し、監査可能・解釈可能にした設計バグバウンティのスコープやルールをそのまま BUG_BOUNTY_SCOPE.json として読み込み、実践的な脆弱性だけを抽出する設計です。 Claude Code CLI + MCPサーバーで動作し、Go / Rust / Nim / TypeScript / C などマルチ言語に対応しています。GitHub Actionsで全フェーズを自動実行できます。公開の決め手はシンプルです。エンタープライズのセキュリティ部門でも、ClaudeやOpenAIを活用したセキュリティツールを導入する選択肢が現実的になってきました。その今なら、SPECAをオープンに公開しても、ただ攻撃に悪用されるのを指をくわえて見ているだけではない。防御側・ホワイトハッカー側が先に活用できる環境を作れると判断しました。攻撃者より先に、ホワイトハッカーが現実システムのバグを見つけ、報告し、修正につなげられる世界を作りたい。「Call for white-hat hackers」ホワイトハッカーの皆さん、どうかこのSPECAを使ってください。悪意あるハッカーより先に、バグバウンティ対象の現実システムの脆弱性を発見しきって、報告し、修正に導いてください。あるいは、これをベースに、より高度なバグ発見システムを構築する研究・開発の土台にしてください。プロンプトも、ループも、ハーネスも、JSONログも、全部MITライセンスで公開しています。好きなだけ改造・拡張・フォークしてください。「使い方」 repoをcloneして、次のコマンドを実行するだけです。 uv run python3 scripts/run_phase.py --target 04 --workers 4 --max-concurrent 64 コマンド一つで即座に動かせます。 BUG_BOUNTY_SCOPE.json と TARGET_INFO.json を用意するだけで、新しいターゲットの監査を開始できます。 GitHub: github.com/NyxFoundation/… READMEと全ソースコードを読めば、すぐに動かせます。セキュリティ界隈の皆さんと一緒に、仕様から始まる本物の監査文化を次のステージに押し上げたいと思っています。ご意見・改善案・バグ報告・コラボレーションも大歓迎です。RT・コメント・試用報告、どれでも構いません。ぜひ反応いただけると嬉しいです。

日本語

51.2K

生成AIに人生捧げた人｜大束良明@otsukaroom·16h

@hiromitsu_asa 5年前くらいにCanvaでデザイナーやってた人は通った道。今は割とCanvaの案件もあるけど、当時はCanvaは冷笑されて絶対Adobeだった。時代の境目ですね。

日本語

202

Hiromitsu@hiromitsu_asa·21h

今どきAIを使わずにWEBサイトを作ること自体を否定してるというだけではわけでなく、明らかClaudeで何も考えずに作ったようなパープルギラギラこだわりゼロUIでドヤるな。だれでもできるようななってんだから、出来ただけで褒められるようなことはなく、求められる水準上がってんだよ。といいたいのだとしたら共感はする。

日本語

2.4K

生成AIに人生捧げた人｜大束良明@otsukaroom·1d

なんでこのポストこんなにインプ伸びてるの？？

生成AIに人生捧げた人｜大束良明@otsukaroom

Codexのコンテキストの圧縮って、何が圧縮されてるの？ってぐらい優秀じゃない？？ Claude Opus 4.6 でコンテキスト１M最高！！とか言ってたけど、Codexは258kでも何ら問題ないな。強いて言えば自動圧縮の時間が長いからタイムロスぐらい笑

日本語

生成AIに人生捧げた人｜大束良明@otsukaroom·2d

「/goalを使えるように設定して」と送れば使えるようになります。

ぬこぬこ / NUKO 🇯🇵@nukonuko

/goal 難民はとりあえず下記を実行して再起動 codex features enable goals

日本語

12.9K

生成AIに人生捧げた人｜大束良明@otsukaroom·2d

3年前、学生起業した海洋ゴミ事業からピボットして、生成AIに全振りしてエンジニアに転身しアプリ開発をしています。よかったらフォローしてください☺︎϶

日本語

1.8K

生成AIに人生捧げた人｜大束良明@otsukaroom·2d

日本語

50.5K

生成AIに人生捧げた人｜大束良明@otsukaroom·2d

@super_bonochin 良いところ見つけたいです！評判聞くに画像理解あたりですか？？知りたいです！！

日本語

119

炎鎮🔥 - ₿onochin -@super_bonochin·2d

@otsukaroom 自分は結構いいと思ってるんですけどね。人より早く叩いてたから、逆にいいところが見えてきますw

日本語

1.1K

生成AIに人生捧げた人｜大束良明@otsukaroom·2d

みんながGemini 3.5 Flash を叩いてるから、良いところを見つけたい。

日本語

2.2K

生成AIに人生捧げた人｜大束良明@otsukaroom·2d

引リツありがとうございます！！めちゃくちゃセッションが長くなっても、ほとんど劣化してる感じ無い＞本当にそうなんですよ。それのお陰で、例えばフロントエンドの開発で、skills共有なしでも圧縮後にデザインシステムが維持されるのでめちゃすごいです。もっと言えば、サブエージェントに実動を完全に依頼してるので、1つのアプリに対してチャット1本で1日過ごす日もあります笑

日本語

1.8K

炎鎮🔥 - ₿onochin -@super_bonochin·2d

これは最近、結構グローバルでも言われてますね。Codexのコンテキストの圧縮がめちゃくちゃ優秀だっていう話。めちゃくちゃセッションが長くなっても、ほとんど劣化してる感じ無いですよね。むしろコンテキストウィンドウが埋まってくると重たくなるので、さっさと圧縮してほしいまである。

生成AIに人生捧げた人｜大束良明@otsukaroom

日本語

363

246.1K

生成AIに人生捧げた人｜大束良明@otsukaroom·3d

@jturntdev The model might be locked due to the config settings. You could try asking in the chat to unlock it for you.

English

J J@jturntdev·3d

Since all the Codex Team love the App. I gave it another chance. We’re off to a good start… Cant even change the model……

J J@jturntdev

The Codex App is good. But the CLI is superior. I just feel the model behaves better. Plus performance.

English

3.7K

生成AIに人生捧げた人｜大束良明@otsukaroom·3d

@hajime2ai ミスがあって再考すると単純にコスト2倍ですからね。 Geminiは最高性能なのにコストが安いところが強みだったのに！2.0 , 2.5 Pro 時代笑

日本語

はじめ@AIとDXのひと@hajime2ai·3d

GPT-5.5ミスも少ないから実質的なコスパ最強過ぎるからな。エージェントとしては値段高くて性能微妙なGemini使うメリットが無い。何せCodexのサブスクでも使えるし。

Lisan al Gaib@scaling01

GPT-5.5-medium has lower end-to-end latency, uses less tokens and is overall smarter and cheaper than Gemini 3.5 Flash it might genuinely be over for anyone not named OpenAI or Anthropic

日本語

1.6K

生成AIに人生捧げた人｜大束良明@otsukaroom·3d

あなたのお店はGoogleマップから集客できていますか？即答できなかった方はチャンス！ちょっとした見直しで、ご新規さんの来店数や売上が大きく伸びる可能性大です✨ まずは、あなたのお店の状態をサクッと確認してください。 ▼▼無料診断はこちら▼▼ kuchitoru.com/lp/gbp-audit/

日本語

113

生成AIに人生捧げた人｜大束良明@otsukaroom·3d

@otani_ai_memo やる意味はないですけどね笑笑バイブコーディングの趣味です！笑

日本語