第九比特
867 posts

第九比特
@ninthbit_ai
AI Native · Indie Developer. 💻Collaborated with Douyin, Feishu, BiliBili and Meituan. 🐱梦想是养一只三花。📚道理全在书上,做人却在书外。





“AI 一次只修改一个变量”,这里变量具体指代什么?我看原文中是 change one thing in prompt。其实我很疑惑的是,如果最终效果由 A、B、C 三个点决定,第一次改 A 分数提升,但没达到通过阈值,这时是继续优化 A 还是去优化 B 呢? 最近看见很多用 autoresearch 优化 skill 的文章,但是我自己实践下来发现并不简单。

很开心最近学习到一批 autoresearch + OpenClaw 的案例开始跑出正反馈。 做营销推送的,AI 自动分人群、试策略,然后自动往更优解收敛。 做投放的,AI 生成素材、跑小流量测试、再筛选放大。 做转化优化的,AI 改文案、调测试路径,把提升一点点吃干榨净。 做机器学习模型的,可以自己跑实验、调参数组合。 这些之前都是靠调参工程师😂一轮一轮盯的活。 业务里数据 → 决策 → 执行 → 再数据这条链路真的需要考虑重新定义下了,让 AI 自己去持续逼近最优解。


We're rolling out plugins in Codex. Codex now works seamlessly out of the box with the most important tools builders already use, like @SlackHQ, @Figma, @NotionHQ, @gmail, and more. developers.openai.com/codex/plugins



分享一下我现在信息消费的来源: 1/4是优质的X账号(动态更新) 1/4是最优秀从业者的播客和文章 1/4是和最领先的AI聊 1/4是读不可压缩的书籍 其他信息可以不看,保护大脑前额叶


🔥又一个 autoResearch 实战案例,very nice 😂 Ole Lehmann 用 Claude 实际测试落地页文案,把通过率从 56% 提升到 92%,整个过程一晚完成,几乎零手动修改。 核心就是让 AI 自己优化自己的技能。 以下是他的实际操作过程: 1. 准备一个现有的「技能」(Skill) 他有一个专门生成落地页文案的 Claude Skill,初始质量检查通过率只有 56%。 2. 定义清晰的评分清单(Checklist) 设置 3–6 项具体、可衡量的检查项目,例如:标题格式、避免营销废话、价值主张是否清晰等(必须是 AI 能客观判断的标准) 3. 启动 AutoResearch 循环 AI 一次只修改一个变量,生成文案变体后,由 AI 自己按清单打分并计算通过率。 4. 评估并保留/舍弃修改 通过率提升则保留变化,否则撤销修改,回到上一版本。 5. 持续迭代 经过 4 轮迭代,通过率从 56% 提升到 92%。当连续三次达到高通过率时停止。 6. 最终结果 得到大幅改进的文案生成技能,以后可更稳定地产出高质量文案。 此方法源于 Andrej Karpathy 的 AutoResearch(原用于机器学习代码优化),Ole Lehmann 将其适配到 Claude Skills。成本低(一晚约 16 次实验只需约 15 美元),适合作为前置过滤器,先用 AI 筛选,再用真实流量验证。 🚀你也想快速上手的话,看我写的这篇文章就行,主打一个通俗易懂。👇 x.com/lonely__mh/sta…










