
Edge Byte
16 posts



@cursor_ai 开放了Python和TypeScript的SDK,并且说在SDK里使用Composer 2.5到memorial day周一晚上为止都是一折。好吧,立刻开动。先用SDK开发了一个webchat,再增加模型选择为standard or fast,再增加MCP,Skill支持,把WebChat变成一个Coding Agent,然后,1折天高任鸟飞。Composer 2.5真得很强。

中文

@plusxiaxia 我这个回答如何?在 github/gitlab 提一个 issue,然后用 codex 启动一个 issue lead subagent ,告诉它已知问题和数据,让它来完成这个 issue。当然那个 subagent 会调动 planner,planner reviewer,implementer,code reviewer 来完成,最终也许花费几小时,让我们先聊一下人生如何?
中文

@yanhua1010 生产力瓶颈在人不在 agent。你会发现很多 agent 停下来等你。哪怕你同时只开了 10 条 agent 流水线在跑,总会有 agent 碰到 real blocker 要你做决策。问题你不是总在电脑前,一觉醒来,发现 5 条 agent 流水线停了。这时候你需要一个 agent 来管这些 agents。
中文

@freeman1266 修改这个文件,修改 profile, 修改模型配置,可以让你的 GPT5.5 在订阅模式下使用 1M 上下文以及修改系统缺省的两种提示词,这才是正确的打开方式。
中文

大多数人用 Codex,配置从来没动过。
但真正决定它每次启动长什么样的,不是斜杠命令——是 ~/.codex/config.toml。
先搞清楚六层优先级:
CLI flag > Profile > 项目级 > 用户级 > 系统级 > 内置默认
举个例子:用户级设了 model = "gpt-5.5",进了某个仓库被覆盖成 gpt-5-pro,启动时再加 --model gpt-4.1——最后生效的是 gpt-4.1。
几个默认就开着、你可能不知道的东西:
· shell_snapshot — 缓存 shell 环境,重复命令加速
· multi_agent — subagent 协作,默认开
· web_search = "cached" — 走 OpenAI 索引缓存而不是实时抓页面,防 prompt injection
两个默认关着、值得打开的:
· features.undo = true — 每轮偷偷打一个 git 快照,一键撤销所有改动,几乎所有人都该开
· features.memories = true — 跨会话记住上下文
一个容易踩的坑:
sandboxmode 和 approvalpolicy 是两个独立维度,别搞混。前者控制"能干啥",后者控制"问不问你"。可以组合出"全自动但只读"——CI 环境标准配置。
实际行为和配置对不上?
/debug-config 一条命令,把六层配置从低到高全部打出来,排错不用瞎猜。
打开你的 ~/.codex/config.toml,大概率能找到至少三个应该改但没改的键。

中文

@realWeZZard 为啥要用 sdk 呢?直接一个会话加 subagent 不能解决所有问题吗? 可惜 Cursor 调用 subagent 都不能指定模型。但是 copilot 可以!以前 copilot 才是最被低估的最便宜 harness,可惜企业版收费模式 6/1 之后改成按 token 收,好日子一去不返。
中文

当下AI写代码最难的 benchmark 叫 ProgramBench。
Claude Opus 4.7 最好,也只在"接近完成"这个指标上拿到了 3%,GPT-5、Gemini 系列,全是零。
这个测试是 Meta、Stanford、Harvard 的研究团队搞的:
给 AI 一个编译好的二进制文件和它的文档,让 AI 从零把这个程序重新写出来。
没有源代码,不能反编译,不能上网查资料。
从小工具到大项目都有,有jq、ripgrep 这种命令行小工具。
也有 FFmpeg、SQLite、PHP 编译器这种级别。
官网:programbench.com
论文:arxiv.org/abs/2605.03546

中文

很多人用 Claude Code,其实还停留在最原始的方式:打开终端,丢一个需求,然后一路等它跑完。
但 Claude Code 真正好用的地方,不只是“会写代码”,而是它内置了一堆命令,可以帮你省 token、省时间、少翻车。
比如上下文快满了,不要等系统自动压缩,先用 /context 看一下占用,再用 /compact 手动压缩,并告诉它哪些结论必须保留。这个习惯很关键,越早压缩越省钱,也越不容易把重要信息丢掉。
再比如,不是所有任务都需要 Opus + max。写小工具、改样式、做格式化,用便宜一点的模型和低推理深度就够了;遇到复杂架构、疑难 bug,再切回强模型。模型和 effort 可以在同一个 session 里切,不会丢上下文。
还有一个特别实用的命令是 /plan。不确定方案的时候,先让 Claude 只做计划,不要改文件。方向对了再执行,方向不对也只浪费几百 token,不会白跑一大圈。
复杂项目还可以用 /agents 拆成前端、后端、数据库几个 subagent,各干各的,避免上下文互相污染。
我觉得 Claude Code 最值得养成的习惯,其实就三类:
省钱:/model、/effort、/compact
提效:/plan、/branch、/agents
自动化:/hooks、/loop、/memory
不用一下子记住 50 个命令,先把这几个用顺手,就已经能明显感觉到差别。
sitin@sitinme
中文

你每天用的谷歌Chrome浏览器,居然在后台悄悄给你塞了个4GB的AI大模型!零通知、零授权,自动下载Gemini Nano。
它把你电脑当算力节点跑诈骗检测,删了还会自动重下。
谷歌Chrome浏览器开始在后台自动向符合硬件条件的用户设备下载体积约4GB的Gemini Nano人工智能模型文件。
该下载行为未提供前置授权弹窗或明确的存储空间预警,并在用户手动删除后自动重新下载,引发安全研究员与用户对终端控制权及资源消耗的争议。
该核心文件名为“weights.bin”,存放于用户系统目录的OptGuideOnDeviceModel文件夹中。
据测试,在无用户交互的情况下,后台下载及部署过程约耗时14分钟。
Chrome利用该本地大语言模型驱动“辅助写作”、端侧诈骗检测与网页总结等默认开启的AI功能。
用户若需彻底阻止该模型下载,必须进入开发者面板,手动禁用“优化指南端侧模型”与“Prompt API”,并清理本地残留目录。
方法:想彻底禁用并删除:
1.打开chrome://flags
搜索并禁用以下两项:
optimization-guide-on-device-model(设为Disabled)
prompt-api-for-gemini-nano(或相关Prompt API,设为Disabled)
2.重启Chrome
3.手动删除文件夹:
Windows:%LOCALAPPDATA%\Google\Chrome\User Data\OptGuideOnDeviceModel
Mac:~/Library/Application Support/Google/Chrome/User Data/OptGuideOnDeviceModel
建议同时在Chrome设置里关闭所有AI实验功能。
中文

一位中国开发者借助 Claude Code 打造出智能代理系统,专门为小企业制作落地页,仅凭一己之力,每月为 47 家小型企业提供服务,每家收费 400 美元。
他基于 Claude Sonnet 4.6 搭建了一套由 7 个代理组成的完整系统,能够自动扫描小城镇的谷歌地图,筛选出尚未搭建官网的本地商户,仅用一个周末,就能为每家企业生成完整的落地页样机,配套宣传视频和冷启动话术。
整个项目没有助理,没有销售团队,也没有业务开发人员。只有他自己、一台 MacBook、一部 iPhone,再加上一个 API 密钥,就完成了全部运营。
对比传统网页设计公司,承接同类业务需要维持一支 8 人团队并支付固定薪资,而他的成本只有模型 tokens 费用,以及 Lovable、Higgsfield 和 Calendly 等工具的订阅开销。
这 7 个代理通过 Claude Code Router 中的统一协调器协同工作,每日 token 消耗量约 300 万,每月 API 成本平均仅 480 美元。
全部代理都依托 MCP 服务器运行,共享状态直接写入文件系统,不存在内存共享与竞争问题。其中一个代理还部署在 iPhone 上,即便在地铁、出租车或步行途中,也能及时处理客户的积极反馈。
他在启动前为协调器设置的系统提示如下:
“你是一家独立代理机构的协调员,负责向本地企业推销成品网站。你负责将只读任务分配给 6 个子代理,所有写入操作由你统一执行。
子代理分工:
// Scout:在指定城市的谷歌地图中筛选细分行业商户,要求经营超过 5 年、评论少于 50 条、无官网或官网停留在 2014 年版本,但评分表现优秀。
// Diagnoser:为每个潜在客户撰写 50 字左右的行业诊断、核心优势定位、适配语气,以及不超过 70 字的冷启动文案。
// Builder:每天为诊断最精准、需求最强烈的前 5 家客户,通过 MCP 在 Lovable 中生成落地页样机。
// Filmer:截取 5 张样机截图,使用 Higgsfield 生成 10 秒竖版 1080x1920 视频,搭配柔和缩放效果。
// Pitcher:通过适配渠道发送个性化冷启动信息,屋顶工发邮件、技工发短信、美容院发 Instagram、房产中介发 LinkedIn。
// Checker:在信息发送前进行审核,确保内容个性化、无 AI 痕迹、不滥用流行术语。
// Mobile:部署在 iPhone 上,实时处理积极回复,通过 Calendly 预约 Zoom 会议,即使机主在外也能正常运作。
严禁两个子代理同时对接同一客户。仅当订单金额超过 3000 美元,或当日细分行业回复率低于 12% 时,才暂停并申请人工审核。”
这套系统拥有清晰的自我定位与行动边界,知道如何自主挖掘潜在客户,无需人工干预即可完成从筛选、诊断、建站到视频制作、信息发送的全流程。
人类仅在订单超 3000 美元或回复率异常时介入。
系统 24 小时不间断运行:
- Scout 每日扫描约 220 家本地企业,筛选出 30 个优质潜在客户
- Diagnoser 每日生成 30 份结构化诊断、简报与冷启动文案
- Builder 每日完成 3 至 5 个精准客户的落地页制作
- Filmer 为每个页面生成 10 秒竖版宣传视频
- Pitcher 每日跨 4 个渠道发送 30 条个性化信息,平均回复率约 14%
- Checker 全程负责发送前内容审核
只有当订单金额超过 3000 美元,或当日回复率低于 12% 时,协调器才会提醒机主。
即便机主在地铁或出租车上,部署在 iPhone 上的 Mobile 代理也能自动处理客户的积极回复,通过 Calendly 按对方当地时间预约 Zoom 会议,并将客户重新归入队列。机主只需轻点批准,十分钟内即可接入会议。
他公开的某周六系统日志记录如下:
“scout report:在奥斯汀、丹佛、迈阿密核查 218 家企业,34 家无官网,19 家官网为 2014 年版本,6 家在评论中提及改版需求,筛选前 30 家移交诊断。”
“pitcher:跨 4 渠道发送 30 条冷启动信息,收到 14 条回复,5 条积极反馈,预约 3 场周日 Zoom 会议,移交跟进。”
“builder:为西区牙科诊所完成 Lovable 落地页,5 个板块,移动端适配,浅米色风格,文件路径已生成,启动视频渲染。”
“eval flag:莲花沙龙订单金额 3400 美元,超出 3000 美元限额,申请人工审核。”
他没有独立服务器,也没有专属后台,仅依靠本地文件沙箱、MCP 路由、一个 Claude API 密钥,以及同步到手机的 Claude Code 完成全部运作。
这是今年最精简的单人智能代理商业模式:每月 API 成本 480 美元,月收入约 18800 美元,整个系统仅由 7 段提示词、一套文件系统和一部手机支撑。
中文







