
AltSociety AI
2.2K posts

AltSociety AI
@AltSocietyAI
Get inspired, get more from AI...together.











OpenAI 发布 GPT-5.4,定位为专业工作场景的旗舰模型,同步推出面向高复杂任务的 GPT-5.4 Pro 版本。 这次发布的最大亮点是 GPT-5.4 成为 OpenAI 首个原生支持"电脑操控"(Computer Use)的通用模型——也就是说,它可以像人一样通过截图、点击鼠标、敲击键盘来操作真实的电脑界面。 在 OSWorld-Verified 桌面操控测试中,GPT-5.4 以 75% 的成功率超过人类(72.4%),而上一代 GPT-5.2 只有 47.3%。 在知识类工作方面,GPT-5.4 在涵盖 44 种职业的 GDPval 基准测试中,与行业专业人士打平或胜出的比例达到 83%,GPT-5.2 的这一数字是 70.9%。 投行建模任务的内部评测得分从 68.4% 跳升到 87.3%,生成演示文稿的效果在人工评审中有 68% 的概率优于前代。 编程能力上,GPT-5.4 整合了此前专为写代码设计的 GPT-5.3-Codex 的能力,在 SWE-Bench Pro 上得分 57.7%,与 GPT-5.3-Codex 的 56.8% 相当,但延迟更低。 另一个实用改进是"工具搜索"(Tool Search):以往给模型配备大量外部工具时,所有工具定义都要塞进提示词里,动辄消耗数万个 token。 GPT-5.4 改为按需查找工具,在测试中将 token 消耗减少了 47%,对于依赖大量 MCP 工具的开发者来说成本节省明显。 在 ChatGPT 中,GPT-5.4 Thinking 将支持在生成过程中展示思考计划,用户可以中途介入调整方向——不用等模型跑完再重新来过。 定价方面,API 输入价格从 GPT-5.2 的每百万 token 1.75 美元涨至 2.50 美元,输出价格从 14 美元涨至 15 美元。GPT-5.4 今天起向 ChatGPT Plus、Team、Pro 用户开放,取代 GPT-5.2 Thinking 成为默认推理模型,GPT-5.2 Thinking 将在三个月后于 2026 年 6 月 5 日正式退役。



The "What should I vibecode?" playbook: Step 1: Go through your week like normal. But this time, write down every step you take on a project. Every spreadsheet, every email, every copy-paste. All of it. Step 2: Look at your list. Circle anything that felt repetitive, slow, or like it shouldn't need a human. That's your app. Step 3: Open Claude. Describe the problem and your ideal outcome. Be specific. Let it write you a detailed system prompt you can actually build from. Step 4: Now add what Claude doesn't know - your context. The weird edge cases. The way your team actually works. The shortcuts only you know about. Layer your expertise on top. Step 5: Feed the whole thing to Loveable or Claude Code. Let it build. You're not coding. You're directing. Step 6: Wake up with a working tool built around a problem you understand better than anyone else ever could. Total time invested: A few hours. Total advantage over people who skipped this: Massive.










