ailands19

1.2K posts

ailands19

ailands19

@ailands19

己所不欲,勿施于人

Katılım Kasım 2019
189 Takip Edilen20 Takipçiler
图拉鼎
图拉鼎@tualatrix·
早上,我让 Codex 从昨天开始执行的“goal”整整跑了 21 小时 14 分钟,共消耗 9 亿 Token,终于进入了“Goal archived”状态。期间完全没有任何人工干预,它就是不停解决问题、验证结果…不断循环这个过程。 大家可能会好奇我用 Codex 做的什么任务,简单地说,我让它解决的是前后端数据字段的大重构问题。随着产品的不断迭代,早期的一些设计不再适应,需要对数据库建模(model)进行一些重构以适应未来发展。 我的产品后端 PostgreSQL,前端 SwiftData,加上自己实现的同步机制(local-first)。早期 model 还少时,重构会简单的多,现在 model 很多,关系又错综复杂,除非停止迭代,重构如果不一次性完成,任务非常繁杂。但好处是,只要定好标准和方向,重构又是相对容易验收的。 于是我想到了最近 Codex(命令行版本)推出的“/goal”功能(也就是 Codex 版本的“raphl loop”)。通过简单的提示词,指向一份文档让它去实现,就这样它连续跑了 21 小时。 最后验收的效果还不错,除了一些 App 端的小问题(这是我原本就测试没覆盖到的地方,没工作也正常),基本很满意。有了这次经历,我对 Codex(或其他 AI 产品)去解决大重构等长任务越来越有信心了。为了防止 AI 写的代码越来越屎山,也必须需要周期性的去重构、清理架构和代码。
图拉鼎 tweet media
中文
98
32
389
85.9K
ailands19 retweetledi
Geek
Geek@geekbb·
解决 Codex 用久了本地状态膨胀导致变慢的问题。清理本地堆积的聊天、worktree、日志和过期配置。 Keep Codex Fast github.com/vibeforge1111/…
Geek tweet media
中文
10
66
458
49.3K
ailands19
ailands19@ailands19·
两个很有价值的评论: 1、好像信息越多越专业,但实际上用户大多数时候只关心两件事:它在干活吗?干得怎么样? 2、请告诉我这个对话应该如何导航。我想到中间去看一看,我怎么知道中间发生了什么?我怎么能一下子跳过去,看一看当初 AI 说了什么,当初我说了什么?这件事到底是怎么解决的?
清凤@qqqqqf_

做了个叫 Arkloop的东西,是个 Agent 客户端 开源,本地优先,简单优先 你可以把他想象成 claude desktop but open source, 并且带有自己的 taste 哦对了,另说一点,不是任何 agent sdk 套壳,也没有任何 base 任何 claudecode 行为,我一个人打磨了三个月 和市面上大部分产品不同
我花了很多时间在一个细节上 : 减少认知负担 一个例子 : 我平常只用一个模型聊天,那为什么每条消息前面都要告诉我用了什么模型?这是噪音 再举一个 : 开发者总是喜欢让 agent 的 tool use 完整的展示到前端,但是背后真正的用户体验逻辑是我需要知道 agent 在工作/在往哪个方向偏,所以我们并不需要如此详细的信息 设计哲学:认知负担,信息,价值导向,美学 换个话题 我一个人做 Arkloop 用了三个月,现在他能用了,但是它离完美很远 做产品很重要的一件事是…不要闭门造车,也就是我需要你们的真诚建议 引用来自 Arkloop readme 中的一句话 “我欢迎所有形式的贡献。即使你不是开发者,只是一个普通用户——如果你在使用中感到任何不舒服的地方,哪怕只是一点间距、一个颜色、一个很小很小的细节,或者是一个很大的方向,都可以直接开一个 issue。 我认真对待每一个体验细节,你的反馈会让所有人的体验变得更好。 如果你是开发者,Arkloop 的 Agent 核心、记忆系统、hook 机制都是开放的。你可以接自己的 provider、写自己的插件、甚至改掉你不喜欢的任何设计。”

这是我认为整个项目最精髓的一点,我希望看到你们的反馈,不管是细节还是方向 我在用 dify 的时候,我常常发现,一个特别小的间距问题,竟然在这么大的仓库里没人修 因此,我很重视这点理念 Arkloop 现在并不稳定,还有很多不完善的地方。希望大家多多包容,多提意见 另带一提,Arkloop 可以从 openclaw/hermes 导入配置 Github 仓库:github.com/qqqqqf-q/Arklo… Arkloop 官网兼下载:arkloop.cn 关注我的推特:x.com/intent/follow?… 加入 Arkloop 的 telegram 群组:t.me/Arkloop_io

中文
0
0
1
18
程叙AI.
程叙AI.@chengzhx·
@fkysly 可以设置最大循环次数吗?否则Token很快就消耗完了😂
中文
2
0
0
1.9K
马天翼
马天翼@fkysly·
Codex 0.128.0 版本终于也支持了 ralph 拉尔夫循环,只需要配置里加上 goals=true 开启这个特性。 然后 /goal 就可以使用了。 [features] goals = true in your config.toml
中文
7
11
100
25.2K
ailands19
ailands19@ailands19·
如果你在使用 Codex 桌面版时觉得界面不够好用、缺少快捷键、或者想自己加一些“黑科技”功能,codex-plusplus 就是为你准备的强大且优雅的“越狱/插件化”框架。
陈成@chenchengpro

发现一个工程水准极高的项目:Codex++,给 OpenAI Codex 桌面应用做的插件系统。 Codex 是闭源代码签名的 Electron 应用,没有任何扩展机制。这个项目的做法相当硬核——它需要突破四层防线才能把代码注入进去: 第一层,改 asar 包。用 @electron/asar 解包 app.asar,把 package.json 的 main 字段从原始入口改成自己的 loader.cjs,同时精确保留原始 asar 的 unpacked 文件集(否则 Electron 的模块加载会 MODULE_NOT_FOUND)。重打包用原子操作:先写临时文件再 rename,防止写入中断导致 app 损坏。 第二层,过完整性校验。Electron 会校验 asar header 的 SHA-256(注意不是整个文件,是 header JSON),存在 Info.plist 的 ElectronAsarIntegrity 里。改完 asar 必须同步更新这个哈希。 第三层,关 fuse。Electron 在 Framework 二进制里有一组 fuse 开关,用已知的 sentinel 字符串 "dL7pKGdnNz796PbbjQWNKmHXBZaB9tsX" 定位,后面跟 version + count header,每个 fuse 占一字节(ASCII '0'=off, '1'=on)。直接把 EnableEmbeddedAsarIntegrityValidation 从 '1' 改成 '0'。加上第二层的哈希更新,形成双保险。 第四层,重签名。上面的操作破坏了原始 Developer ID 签名,用 codesign --force --deep --sign - 做 ad-hoc 重签名,让 macOS 不拦截。 注入的 loader.cjs 只有 70 行,设计原则是"插件系统崩了绝不能带崩 Codex"。所有逻辑包在 safe() 里,异常只写日志到 loader.log,最后一行永远是 require("./" + originalMain)——无条件把控制权交还给 Codex 原始入口。 Runtime 层也有意思。它需要访问 Codex 的内部 window services 对象,但这是个 minified 的闭源 bundle,变量名是混淆过的。解法是用 fingerprint 匹配:搜索包含 buildFlavor: 的工厂函数调用,然后检查调用体里是否同时包含 allowDevtools:、preloadPath:、globalState: 等至少 5 个已知属性名,命中后回溯找到赋值的变量名,在语句结尾注入 globalThis.codexpp_window_services = ;。一套完整的 JS AST 级别的 source patch。 Sparkle 自动更新兼容是最精巧的部分。Sparkle 要求有效的 Developer ID 签名才能更新,但补丁后的 app 只有 ad-hoc 签名。解决方案:hook Node 的 Module._load,拦截 Sparkle 模块的 installUpdatesIfAvailable 方法。更新前用 ditto 把备份的原始签名 .app 复制回去让 Sparkle 正常工作,更新完后 launchd 监听到 app.asar 文件变化,自动触发 codexplusplus repair --quiet 重新走一遍补丁流程。全自动,用户零感知。 不是一个简单的 monkey-patch,是从二进制 fuse 到 JS source patch 到 Sparkle hook 的完整工程体系。 github.com/b-nnett/codex-…

中文
0
0
1
120
ailands19 retweetledi
阿绎 AYi
阿绎 AYi@AYi_AInotes·
GPT-5.5 和 Claude Opus 4.7 同一天发了官方提示工程指南。 两家的建议完全相反, 1️⃣OpenAI 说:少给流程,说清楚你要什么结果,让模型自己选路径。 2️⃣Anthropic 说:别指望它猜你意思,意图、格式、成功标准,一个都不能含糊。 一个嫌你管太多,一个嫌你说不清楚。 Claude 首席工程师 Boris Cherny 说,他自己都需要几天适应🤣 → Anthropic Claude Opus 4.7 迁移指南: platform.claude.com/docs/en/build-… → OpenAI GPT-5.5 提示工程指南: developers.openai.com/api/docs/guide… → OpenAI《使用 GPT-5.5》官方文档: developers.openai.com/api/docs/guide… → Boris Cherny(Claude Code 首席工程师) → t.co/ZXSgy1uIMA 对数百个社区帖子的深度分析(提示具体性与输出质量高度正相关)
阿绎 AYi@AYi_AInotes

我终于明白为啥最近很多人都在说,GPT和Claude突然变笨了, 昨天OpenAI和Anthropic同时发布了官方提示工程指南, 看完我才发现,并不是模型变笨了, 是它们终于聪明到,不再容忍人类懒得想清楚了🤣🤣🤣 而且最有意思的是, 两个模型的进化方向,居然是完全相反的, Claude Opus 4.7变得越来越字面, 以前它会主动帮你补全模糊的指令, 现在你说什么它就做什么,多一个字都不会猜🤣🤣 GPT-5.5变得越来越自主, 以前你要手把手教它每一步怎么做, 现在你只要告诉它你想要什么结果,它自己会选最优路径, 所以老提示失效的原因也完全相反, 用在Claude上的模糊提示,会得到越来越窄的输出, 用在GPT上的详细流程,会变成多余的噪声, 过去三年我们一直在学怎么教模型做事, 现在反过来了, 模型开始要求我们,先把自己的思考结构化, 其实就是提示工程的本质, 已经从教模型怎么做,变成了先把自己想明白, 所以真正的瓶颈可能不是模型的能力,而是写提示的那个人的思考清晰度, 我感觉以后赢的人,不会是提示写得最长最复杂的人,而是那个最知道自己真正想要什么的人🤔

中文
18
182
1.1K
195.1K
ailands19
ailands19@ailands19·
@dotey 请教宝玉老师:它和官方发布的 /goal 是否有一定的重叠?
中文
1
0
0
309
宝玉
宝玉@dotey·
试用下来 CodexPotter 不错,推荐下。它不是基于 Codex 插件机制,它本身是一个 cli,然后会后台启动 codex cli,把指令传给 codex,同步显示 codex cli 结果。 CodexPotter 先把想要的结果写进一个 MAIN.md 文件,然后工具在后台不停地启动新的 Codex 会话,每一轮都用全新、干净的上下文,对照 MAIN.md 检查代码、修正、再检查、再修正,直到结果跟你写的一致才停。 默认最多是 6 轮,但是你可以通过配置修改数字。 使用上需要注意,CodexPotter 适合目标明确的任务,比如“按照这个设计文档实现订阅系统”,不适合需要来回讨论的交互式开发。它是个任务执行器,不是聊天伙伴。 顺便说一下:Ralph 这个名字的来源是《辛普森一家》那个爱重复同一句话的小孩 Ralph Wiggum pattern。 github.com/breezewish/Cod…
宝玉 tweet media宝玉 tweet media
宝玉@dotey

请问有没有好用的 Ralph Loop for Codex? 类似于 Claude Code 的 Ralph Wiggum Plugin github.com/anthropics/cla… 用过 oh my codex,给我装了一坨 MCP,魔改了我的 codex Custom instructions,我个人很不喜欢这种。

中文
20
39
317
53.3K
ailands19 retweetledi
yibie
yibie@yibie·
我认为多 Agent 并行协作一定会是未来最重要的工作范式。 推荐这篇文章,作者分享了自己使用 Agent Team(多 Agent 协作)的方法。 重点是: - 合理地分配角色 - 维护一份质量优秀的 CLAUDE.md 《用 Claude Code 将三万行 Go 项目移植到 Rust:Agent Team 实践与 Harness 效率优化》 maxlv.net/blog/porting-m…
中文
3
28
151
11.6K
ailands19 retweetledi
Joruno
Joruno@wsl8297·
画流程图、架构图时,用 draw.io 一个个拖组件真的很磨人,图一复杂就得反复挪位置、调连线,越改越乱。 我最近发现一个开源项目:next-ai-draw-io。你只要用自然语言描述想画什么,AI 直接生成 draw.io 可用的图(XML)。 它主要做三件事: - 文字生成图表:把需求说清楚,图就出来了 - 传图复刻与优化:上传现有截图,让 AI 复刻并顺手优化排版 - 对话式修改:边聊边改,不用每次重生成整份 XML,AI 会只改动相关节点,修改更准、更快 GitHub:github.com/DayuanJiang/ne… 技术栈是 Next.js + AI SDK + react-drawio,调用 OpenAI API 来理解自然语言;还支持版本历史,随时回看、回滚。 如果你想把画图从「手动拖拽」升级到「开口就能画」,这个项目很值得试一试。
中文
4
36
189
13.1K
ailands19 retweetledi
GitTrend
GitTrend@GitTrend0x·
今天 GitHub 被 Agent 全栈基础设施军团彻底屠榜了!🚀 5 个星标暴增最狠的项目,专业拆解下! 1. warpdotdev/warp 
将传统终端彻底 Agent 化,成为内置编码 Agent 的智能开发环境,一键集成 Claude Code、Codex 等 CLI Agent,解决开发者反复切换上下文的低效痛点。 
🔗 直达 github.com/warpdotdev/warp 
程序员昨晚睡一觉,醒来终端直接变身 Agent 指挥部,34k+ stars 一夜暴增——这速度,AI 都得给 Warp 递烟叫大哥! 
🟢 2. mattpocock/skills 
工程师专属 Agent 技能库,把代码审查、重构、文档生成、测试用例等日常工作流封装成可组合、可版本化的独立 skill 模块,从 prompt 工程进化到 skill 工程,彻底解决传统 Agent “啥都想干、啥都不精”的致命痛点。 
🔗 直达 github.com/mattpocock/ski… 
以前 Agent 像个什么都会点却一事无成的实习生,现在直接外挂老程序员全套肌肉记忆,5.5k stars 单日暴增,哥们儿们集体高呼:终于能把我的“黑魔法”打包传给 AI 了! 
🟢🟢 3. zerobootdev/zeroboot 
为 AI Agent 提供亚毫秒级 KVM VM 沙箱,通过 copy-on-write forking 实现 0.8ms 启动、265KB 内存占用和硬件隔离,190x 快于 E2B 等方案,完美解决 Agent 执行 untrusted code 的安全与速度双重痛点。 
🔗 直达 github.com/zerobootdev/ze… 
AI Agent 以前跑代码像在泥地里爬,现在 0.8ms 就起飞还带硬件铁笼,2.2k stars 暴增,程序员看完直呼:这才是真正的“一人顶团队”执行力,安全快到犯规! 
🟢🟢🟢 4. alash3al/stash 
AI Agent 持久化内存层,基于 Postgres + pgvector 构建知识图谱、事实、目标和自我模型,MCP 原生集成,让 Agent 真正“记住”历史交互而非每次重置上下文。 
🔗 直达 github.com/alash3al/stash 
Agent 以前像失忆金鱼,每轮对话都要从“你好我是 AI”重新开始,现在直接装上永久大脑,523 stars 暴增,程序员感慨:终于不用一遍遍教 AI “我上次跟你说过的”了,效率直接起飞! 
🟢🟢🟢🟢 5. AIScientists-Dev/WorldSeed 
多智能体世界引擎,通过 YAML 定义规则让 AI agents 在模拟世界中自主对话、竞争、结盟,生成 emergent artifacts,支持复杂仿真、游戏与行为研究。 
🔗 直达 github.com/AIScientists-D… 
单个 Agent 以前孤军奋战,现在直接扔进 AI 版“狼人杀+模拟城市”里互卷互帮,516 stars 暴增,程序员看完灵魂一颤:这不就是 Agent 集团军级演习吗?团队协作拉满!
 ⚠️⚠️ 总结:从开发环境、技能库、执行沙箱、持久记忆到多 Agent 世界模拟,这5个项目一口气给 Agent 补齐全栈基础设施,把“单兵作战”直接升级成“集团军级”战斗力,看完不转发你都对不起你的 Cursor!🚀🤖
GitTrend@GitTrend0x

今天 GitHub 被 AI Agent军团+语音 AI 核弹彻底屠榜了!🚀 5 个星标暴增最狠的项目,专业拆解下! 1. abhigyanpatwari/GitNexus 大代码库让 AI agent 两眼一抹黑?这纯浏览器客户端知识图谱引擎,拖个 repo 就自动构建 Graph RAG + MCP 工具,预计算关系智能直接喂给你的 agent。 🔗 直达 github.com/abhigyanpatwar… 以前 agent 进代码库跟无头苍蝇一样,现在浏览器里点两下就出关系图谱,MCP 工具一插直接变“老司机”,1565 星暴增,代码探索终于不靠玄学了! 🟢 2. microsoft/VibeVoice 开源前沿语音AI框架,提供端到端高性能语音处理与交互能力,解决商用语音模型闭源贵、定制难的落地痛点。 🔗 直达 github.com/microsoft/Vibe… 微软这波直接把Siri按地上摩擦!程序员语音喊指令、AI Agent语音回话,键盘侠秒变语音流氓,1523星暴增,画面感拉满,语音时代真来了兄弟们! 🟢🟢 3. TauricResearch/TradingAgents 基于多智能体LLM的金融交易框架,让多个AI Agent自主协作完成市场分析、决策与执行,解决传统量化交易人工干预多、响应迟缓的核心痛点。 🔗 直达 github.com/TauricResearch… 交易员直接放假回家睡觉了!AI多Agent自己开盘炒股、实时决策,969星暴增,华尔街要哭晕在厕所,这才是真正的“智能体炒家”啊! 🟢🟢🟢 4. ComposioHQ/awesome-codex-skills 实用 Codex 技能精选清单,助力 AI Agent 通过 CLI/API 自动化复杂工作流,解决 Agent 工具链缺失、集成繁琐的工程痛点。 🔗 直达 github.com/ComposioHQ/awe… Agent小弟们终于有技能包了!以前手搓工具链,现在直接复制粘贴自动化,961星暴增,程序员直呼“终于不用当Agent保姆了”! 🟢🟢🟢🟢 5. davila7/claude-code-templates CLI 工具专门配置与监控 Claude Code,支持 AI 编码工作流标准化管理,解决大规模 Agent开发中配置混乱、监控盲区的痛点。 🔗 直达 github.com/davila7/claude… Claude Agent 大规模上阵时终于不乱套了!监控一键搞定,347星暴增,团队协作直接变AI自管,程序员爽到飞起! ⚠️⚠️ 总结 从免费 Claude 编码 Agent 到语音交互前沿,再到多智能体金融战场和工具链全家桶,AI Agent军团已全面武装开发者与交易员,一个人顶 10人团队的梦想今天在 GitHub 彻底实现🔥🤖

中文
1
17
92
22.1K
ailands19 retweetledi
Saito
Saito@SaitoWu·
这可能是今年我听过信息密度最高的一期技术播客。 Reiner Pope(前 Google TPU 架构师,现 MatX CEO)用一整期黑板课,系统讲透了 Transformer 在真实集群上到底是怎么跑的:批处理、KV Cache、内存 vs 计算 Roofline、MoE 稀疏性为什么大胜、API 定价背后的机制,以及硬件限制如何塑造了今天的 AI 进展。
Saito@SaitoWu

x.com/i/article/2049…

中文
9
250
940
162.1K
ailands19 retweetledi
idan
idan@linidan_·
别尬吹openclaw了,slock.ai才是OPC神器啊,真有当老板的感觉了。 用AI写了一篇文章之后,调了半天,当场把gemini-3.1 pro从审稿人晋升成了内容主编,把kimi-k2.6贬为干杂活的废物。 gemini是文案届真神!!之前是我说话太大声了🙇‍♂️
idan tweet media
中文
12
23
178
38.5K
ailands19 retweetledi
lifcc
lifcc@mylifcc·
Codex++ 直接开源 + 内置 iOS Simulator?这波操作直接把开发循环干碎了 🔥 以后原型 native UI 再也不用切来切去 Xcode 了,效率起飞! 自定义键盘快捷键这个 tweak 也太实用,我已经想好要加哪些快捷键了~ 开源了就该冲!@b_nnett 牛逼,PR 安排上 仓库地址在这里:github.com/b-nnett/codex-…
Bennett@b_nnett

iOS simulator directly in Codex!

中文
9
65
428
67.1K
ailands19 retweetledi
宝玉
宝玉@dotey·
OpenAI 上周发布 GPT-5.5 后,紧接着放出了一份官方提示词指南。这份指南传递的核心信息只有一个:别再写长提示词了。 GPT-5.5 距离上一代 GPT-5.4 只隔了六周,API 定价每百万输入 Token 5 美元、输出 30 美元,上下文窗口 100 万 Token,目前已面向 Plus、Pro、Business 和 Enterprise 用户开放。模型本身的变化各家媒体已经报道过,这份提示词指南更值得关注的是它暗示的使用方式转变。 【1】越短越好,告诉它“要什么”而不是“怎么做” 过去用 AI 模型,很多人习惯写一长串步骤,手把手教模型该先查什么、再比什么、最后怎么输出。OpenAI 在指南里直接说:这套玩法过时了。GPT-5.5 的推理能力够强,你只需要描述清楚想要的结果、成功的标准和限制条件,剩下的让它自己规划路径。 指南原话的意思是:以前的模型比较笨,需要你教它每一步怎么走,但对 GPT-5.5 来说,这些啰嗦的指令反而成了干扰,会缩小它的搜索空间,让输出变得死板。 对开发者来说,这意味着需要重新审视手头积攒的提示词模板。以前管用的“保姆式”写法,现在可能适得其反。 【2】给 AI 装上“性格”和“刹车” 指南花了不少篇幅讲两件事:一是怎么给模型设定性格(语气、态度、合作方式),二是怎么让它知道什么时候该停。 性格设定分两层。一层是“听起来像什么人”,比如热情还是干练、直接还是委婉。另一层是“怎么干活”,比如什么时候该主动提问、什么时候可以自己做主。OpenAI 建议两层都写短,几句话就够。 停止条件可能更实用。指南建议给搜索行为设定“检索预算”,明确告诉模型:搜到什么程度就收手。比如第一次搜索如果已经能回答问题,就别再搜了。只有在核心问题没被回答、缺少关键事实、或用户要求穷尽所有情况时,才允许发起下一次搜索。 这对做客服、做知识问答产品的团队很有参考价值。搜索次数直接关联 Token 消耗和成本,设好预算能省不少钱。 【3】一个有意思的细节:开场白 GPT-5.5 在开始输出文字之前,可能会在后台默默花时间推理和规划。用户盯着空白屏幕等待的体验很差。指南建议让模型在正式干活之前,先输出一两句话,告诉用户“收到了,我先做这个”。 这不会让任务真的变快,但能让用户觉得响应快了。做过产品的人都知道,感知速度有时候比实际速度更重要。 【4】创意写作要区分事实和发挥 指南里有一段专门讲给 AI 写幻灯片、宣传文案、演讲稿时的注意事项:产品数据、客户信息、路线图这些必须用有出处的事实,不能让模型编造。如果手头没有数据,宁可用占位符标出来,也别让 AI 自由发挥出一个看起来很真但完全瞎编的数字。 这条建议对应的是 AI 最大的实用风险之一:模型编故事的能力太强,强到你可能分不清哪些是真的。尤其是在做对外材料的时候,一个编造的客户案例或数据点,后果可能比不写还糟。 OpenAI 推荐的提示词模板最终浓缩成六个模块:角色、性格、目标、成功标准、限制条件、停止规则。每个模块都强调“尽量简短,只在需要改变模型行为的地方加细节”。 从 GPT-4 时代的“提示词工程”到现在 GPT-5.5 的“少说多做”,提示词的写法以前是人适应模型的局限,现在是模型开始适应人的模糊表达。对于还在用两年前的提示词模板的团队,可能要考虑重写你的提示词了。 更详细的文档:developers.openai.com/api/docs/guide…
宝玉 tweet media
Adam.GPT@TheRealAdamG

developers.openai.com/api/docs/guide… **NEW: GPT-5.5 Prompting Guide** "GPT-5.5 works best when prompts define the outcome and leave room for the model to choose an efficient solution path. Compared with earlier models, you can often use shorter, more outcome-oriented prompts: describe what good looks like, what constraints matter, what evidence is available, and what the final answer should contain. Avoid carrying over every instruction from an older prompt stack. Legacy prompts often over-specify the process because earlier models needed more help staying on track. With GPT-5.5, that can add noise, narrow the model’s search space, or lead to overly mechanical answers. For more detail on GPT-5.5 behavior changes, start with the Using GPT-5.5 guide. This guide focuses on prompt changes that follow from those behavior changes. The patterns here are starting points. Adapt them to your product surface, tools, evals, and user experience goals."

中文
39
173
837
101.3K