のばぺん retweetledi
のばぺん
565 posts

のばぺん
@NovaPen_createe
プロンプトコンテスト受賞経験:10回以上🥇 |日経クロストレンドにPromptの掲載経験あり|
noteで生成AIのテクニックを発信中!👇 Katılım Ocak 2024
30 Takip Edilen146 Takipçiler
のばぺん retweetledi

Exciting news - GPT-Image-2 by @OpenAI has claimed the #1 spot across all Image Arena leaderboards!
A clean sweep with a record-breaking +242 point lead in Text-to-Image - the largest gap we’ve seen to date.
- #1 Text-to-Image (1512), +242 over #2 (Nano-banana-2 with web-search aka gemini-3.1-flash-image)
- #1 Single-Image Edit (1513), +125 over #2 (Nano-banana-pro aka gemini-3-pro-image)
- #1 Multi-Image Edit (1464), +90 over #2 (Nano-banana-2)
No model has dominated Image Arena with margins this wide.
Huge congratulations to @OpenAI on this major breakthrough in image generation! More performance breakdowns by category in the thread below.

OpenAI@OpenAI
Made with ChatGPT Images 2.0
English
のばぺん retweetledi
のばぺん retweetledi
のばぺん retweetledi

Honestly this chart makes me more bullish on GPT 5.4 Pro than anything else.
People are focusing on Mythos looking strong, but what stands out to me is how well 5.4 Pro already stacks up on the overlap we actually have. GPQA is basically a tie at 94.4 vs 94.5. BrowseComp is a win for GPT 5.4 Pro at 89.3 vs 86.9. Yes, Mythos is ahead on Humanity’s Last Exam, 56.8 vs 42.7 without tools and 64.7 vs 58.7 with tools, but the bigger point is that 5.4 Pro is already this competitive right now.
So if GPT 5.4 Pro is already THIS COMPETITIVE here, then Spud Pro, the next OpenAI flagship, is guaranteed to beat Mythos. This chart makes OpenAI look extremely close before its next real jump, and once that next jump lands I do not think Mythos stays ahead.

English
のばぺん retweetledi

We're rolling out plugins in Codex.
Codex now works seamlessly out of the box with the most important tools builders already use, like @SlackHQ, @Figma, @NotionHQ, @gmail, and more.
developers.openai.com/codex/plugins
English
のばぺん retweetledi

OpenAIが徐々にAGIに近づいてる模様👀
・The InformationがOpenAIの最新モデルであるコードネーム「Spud」の開発が完了したと報じた
・製品展開チームが「AGI Deployment」に名称変更されたことも判明
・新モデルは数週間以内にリリースされる見込み
theinformation.com/articles/opena…
日本語
のばぺん retweetledi

直近のOpenAIは、AnthropicやGoogleとの競争に対抗して過去最大レベルの改革を行っており、かなりすごい情報が出てきています。まぁ本気で今年のIPOを目指しているのでしょう。以下直近確認できたものとコメント
・Anthropicに対抗して、全方位戦略をやめて法人向けプロダクト開発に体制変更。元々OpenAIは「AGI開発企業」として言語も画像も動画も音声もSNSもブラウザも、なんなら長期的にはロボティクスもやる体制だったが、さすがにリソースが分散しすぎて、一番収益が稼げるポイントでAnthropicなどに性能面で勝てなくなっていたため、思い切った模様
・動画生成 SNSのSora提供終了。動画生成は技術的にもかなり計算資源を食うこと、そもそも最初期を除きずっとユーザーが減っていたこと、動画生成機能提供による法的リスクが原因だろう。上記の全方位戦略からの転換による整理の一環。SNSはともかく、モデルの提供そのものをやめるかどうかまでは不明。ついでにSoraと紐づいていたディズニーとの契約も打ち切り(ディズニーのコメントを見る限り、そこまで派手に怒っている訳ではなさそう)
・Soraの研究の知見は今後世界モデル研究に活かす模様。ロボティクスへの応用を見込んでおり、この辺の方針はGoogleやNVIDIAなどと同じ。Anthropicは現状こちらの方面への取り組みはない。
・安全対策・セキュリティチームを別のチームの下に移管する
・製品部門をAGI Deploymentに改名する。法人向けプロダクトに舵を切りつつ、看板は思い切ったものにして差別化を図っていそう
・次期フロンティアモデルのコードネーム「Spud」の事前学習が完了。GPT-5.5なのか、GPT-6なのかは不明だが、数週間以内に公開されると見込まれている
・
日本語
のばぺん retweetledi
のばぺん retweetledi
のばぺん retweetledi

The Codex app is now on Windows.
Get the full Codex app experience on Windows with a native agent sandbox and support for Windows developer environments in PowerShell.
developers.openai.com/wendows
English
のばぺん retweetledi
のばぺん retweetledi

Introducing Nano Banana 2 🍌🍌, our best image generation and editing model yet. Try it now in the @GeminiApp, @GoogleAIStudio and more.
English
のばぺん retweetledi

行政オープンデータにAIエージェントから直接アクセスできる「行政オープンデータリモートMCPサーバ」を開発し、本日より無償で公開しました。
取締役を務めるAI HYVEの取り組みです。
これにより、ChatGPTやClaudeといったAIエージェントが、不動産取引価格、官公需入札、政府統計(e-Stat)など、これまで分断されていた行政データへシームレスに接続できるようになります。
AIエージェントが外部のツールやデータと連携し、自律的にタスクをこなす「AIエージェントの社会実装」が本格化する中で、今回の取り組みはその基盤となる重要な一歩です。私たちは、AIが行政データを日常的に活用するための「接続口」をオープンにすることで、誰もがAIの恩恵を受けられる社会の実現を加速させたいと考えています。
今回のプロジェクトは、AI HYVEがこれまで培ってきたAIエージェント開発・実装の知見を社会に還元するものであり、来るべき「“つながるAI”が当たり前になる時代」を見据えた実験的なオープンリリースです。
この小さな一歩が、行政サービスのDXを推進し、ひいては「人間とAIが共存する社会」の実現に繋がることを信じています。
共にこの挑戦を進めてくださったN-3の皆様、そして関係者のみなさんに心より感謝申し上げます。
prtimes.jp/main/html/rd/p…
日本語
のばぺん retweetledi
これはある。仕事で色々見てると、みんな気づいてないだけで、社会でそれなりに導入されてる。
とりにく@tori29umai
AI議論、『生成AIを利用していることに気づかせない』クオリティのものは案外見落とされているよなぁと。 明らかにディレクション不足のものばかり話題になりまともに監修されているものはそも議論されない。 ってのを広告代理店マンとお話した時、思い知らされて戦慄した(全然わからなかった
日本語
のばぺん retweetledi

ChatGPTの広告は悪手だ
Geminiは広告を出さないと宣言してて立派だ
と騒いでる人が多いけど
その発言、ブクマしておいたほうがいいよ
ここが破壊的イノベーションが起きるときの
大きな分岐路であったと
見えにくすぎてわからないかもだけど
これでGoogleはまた後塵を拝することになる
格好つけの代償は大きい
その理由をひとことで言えば
デジタル広告は需要が強すぎで単価もうなぎ登り
ということだ
人々が検索しなくなるのだから
AIの広告単価はさらに希少価値で上昇する
しかも知識層・稼ぐ層こそがAIを使うのだから
ユーザーの財布の大きさも検索を大きく超える
極端に言えば広告の潜在価値が
月20ドルの有料プランを超えてしまうかもしれない
格差の拡大する世界の上澄みを狙える媒体になる
それでも広告ビジネスに参入しないのか
そんなチャンスに抵抗することには経済合理性がない
進んで競争に負ける選択をするハラキリの美学
ということになってしまう
Googleが台頭した頃も同じことを言われていた
草の根で民主的に作られたホームページに乗っかって
その検索で広告を出して稼ごうなんて邪悪だと
資本主義で起きることは
常に起こるべくして起こる
OpenAIがやらないのであれば他社がやる
そこに広告主は殺到する
競争とは
選択ではなく否応なく巻き込まれるもの
国レベルで規制をかければ他国がやるだけ
何が起きるのかということについては
希望的観測や正論や自分の正義を脇において
極めて冷徹にロジカルに考えねばならない
広告が大嫌いな一市民より

日本語
のばぺん retweetledi
のばぺん retweetledi

GPT-5.2 Pro has now broken a new IQ record and achieved 147 IQ! This is 3 standard deviations above the population mean, and only less than 1 in 1000 people or ~0.1% of humans have this level of intelligence! Next stop over 150 IQ! Source: trackingai.org/IQ

English




