idan

639 posts

idan banner
idan

idan

@linidan_

all in AI | Anthropic / OpenAI Coding Agent User|learning / building in public

Shenzhen CN Katılım Temmuz 2019
136 Takip Edilen334 Takipçiler
idan
idan@linidan_·
3 亿 token 第一眼看有点夸张。 但如果 /goal 真能无干预连续跑 7 小时,这笔账就不能只按 token 算,它至少展示了一种可能:用算力换取更少人工介入的工程时间。 这也是我最近调整 vibe coding 工作流的核心:不再纠结怎么省 token,而是怎么减少 human in loop。
图拉鼎@tualatrix

Codex 的新增的“goal”太好用了! 已经连续干了 7 小时活、消耗了 3 亿 Token 了,是我目前最高的连续不中断让 AI 干活的记录。 不停地完成任务、审计任务这样循环下去,非常仔细。不用再看到「需要我为你做下一步吗?」真的太好了。

中文
0
0
0
149
idan
idan@linidan_·
底层逻辑就是尽可能把手头的活儿全自动化。我的实践分两层: 1. 确定性强的原子操作:直接写成 CLI 脚本(比如自动部署开发环境、跑单测) 2. 灵活但有规律的操作:用 Prompt 解决。比如端到端测试,只要给够产品背景,让 Agent 现场写网页点击或接口请求脚本去模拟用户路径,快速验证(但这部分我实践下来是最耗Token的) 这两层最后都封装成 Agent 的 Skill,随着开发不断迭代。 另外,为了保证这种全自动化的质量,干活和验收的角色最好不是同一个Agent的,不然它会假设自己做的都是对的,参考的是这篇文章,不过这种方式也是会导致token消耗量变大: anthropic.com/engineering/ha…
中文
0
1
1
74
idan
idan@linidan_·
四个月前,我分享过一套「低成本 vibe coding 攻略」。那时候我满脑子想的都是怎么省 token、怎么组合套餐最划算。但到今天(2026 年 5 月 1 日),那套东西已经过时了。 我的重点已经从「省 token」转移到了「省时间」上。 以前是研究怎么让 AI 像个高级程序员;现在是研究怎么把 AI 组织成一个小团队,让他们分工干活、互相验收。 以下是我这几个月跑下来的核心变化: 1. 不用手动验证了:Work + Verify 双角色 以前写代码,是人带着 AI 冲。最后还是得人去手动复核逻辑、跑测试,人依然是那个最累的瓶颈。 现在我的做法是:每个项目至少配两个 Agent。 Work Agent:负责改代码、出方案,它只管实现。 Verify Agent:负责找问题、写测试。 一个干活,一个验收。不要让同一个模型自己证明自己没问题。 2. 模型分层:按岗位分模型 算力管理的关键是「合适」。我现在的策略是: 内容/逻辑梳理:重度依赖 Gemini 和 Claude。Gemini 的长文本和叙事能力目前依然很稳。 硬核代码产出:主力是 Codex 和 Claude。 备份/简单活:国产模型(DeepSeek 等)。主模型限额时顶上,或者处理简单的增删改查。 闲聊杂事:国产模型,响应快且便宜。 3. Skill 从技巧变成基础设施 以前我的 Skill 库里全是「一键同步」、「自动提交」这种小动作。 现在,Skill 是 Agent 的基础能力。 浏览器自动化、数据库审计、生产环境日志探测、发布 Checklist,全部固化成 Agent 能稳定调用的工具。 当 Agent 能直接看日志、查库、操作浏览器时,你就没必要盯着屏幕了。你只需要建好测试环境,告诉它结果,让他们自己跑直到测试全绿。 4. 人只做拍板 现在的目标变了:从「省力」升级到「控场」。 把重复劳动、低频排查、人工验证全交给这套架构后,我多出了 70% 的时间。这些时间我全用来做最核心的判断和拍板。 你不再是那个盯着终端满场飞奔找 Bug 的执行者。你是一个决策者,只需要看着各个自动化任务在后台跑完,然后在关键节点检查验收,点一下「合并」或者「发布」。
中文
1
0
2
121
idan
idan@linidan_·
@ai_xiaomu 其实感觉16g的air 就够用了
中文
0
0
0
480
黄小木
黄小木@ai_xiaomu·
m5pro,极限二选一 主要用途还是AI编程,上网,看文档,偶尔剪视频。 是多花3500元上满血呢还是48g残血就行?
黄小木 tweet media
中文
101
0
38
28.5K
黄小木
黄小木@ai_xiaomu·
为什么我从大厂出来要先干自媒体而不是先撸个产品? Vibe coding时代,产品永远不缺,流量更珍贵。 我这个月在x上认识的大腿们,大家一起转发下可以瞬间触达接近十万人。 而且这个成本近乎免费。 你想想如果你是个独立开发者触达这么多人你需要花多少钱? @Chris_Defi 给我试用了他的重磅新品,会在x上先来一波福利,尽请期待🤗
中文
29
1
36
4.6K
idan
idan@linidan_·
@huangyihe 其实开发也可以用APP吧
中文
0
0
2
820
huangyihe
huangyihe@huangyihe·
Codex绝对是OpenAI近期的大亮点。开发用CLI,日常用App。加上高额度和不怎么恶心人,是当下性价比很高的选择。 我逐渐把开发工作从之前的OpenCode + OMO转到Codex CLI。省下来的GitHub Copilot额度用在newtype OS里(内容创作)。像SEO、GEO之类的零散工作,我就扔到Codex App里完成。 在现实约束下,AI模型和工具都是阶段性的,需要持续调整。背后最重要的是自己的数据(积累和清理),以及对自己需求的理解和工作流的优化。这样才能做到应用层接谁家都OK。
中文
6
3
45
9.5K
idan
idan@linidan_·
@HIRO_MDT claude过期了,我手上这几个模型,试了下,gemini效果比较好
中文
0
0
0
193
Hiro祥龙
Hiro祥龙@HIRO_MDT·
@linidan_ 你确定gemini文案好吗? 文案的创意性Claude独一档,除了英语思维和中文语义不行,Claude是唯一一款全球影视大厂都在用来改写剧本的llm,gemini除了前端其他都是水桶
中文
1
0
2
365
idan
idan@linidan_·
别尬吹openclaw了,slock.ai才是OPC神器啊,真有当老板的感觉了。 用AI写了一篇文章之后,调了半天,当场把gemini-3.1 pro从审稿人晋升成了内容主编,把kimi-k2.6贬为干杂活的废物。 gemini是文案届真神!!之前是我说话太大声了🙇‍♂️
idan tweet media
中文
12
23
178
38.5K
mini
mini@nhung00303355·
ZXX
23
86
2.6K
570.8K
得否
得否@wangdefou·
说一个你知道的最新的梗 让我看看你的网速
中文
51
0
20
9.9K
idan
idan@linidan_·
@Russell3402 流量是最贵的,有资本才有资格不做流量
中文
1
0
1
490
Russell
Russell@Russell3402·
怎么10个AI创业9个都是做流量🤪
中文
45
0
40
11.9K
idan
idan@linidan_·
@shuesyanle 这个我就不清楚了,我的gemini 3.1 pro是可以的
中文
0
0
0
1.8K
jeevacation
jeevacation@shuesyanle·
@linidan_ 我的 gemini pro 一直是 429,flash 才能用这是为啥,我还是有 pro 订阅的
中文
2
0
0
1.9K
idan
idan@linidan_·
@v1ncent_AI 可以看看具体agent里的Activity,里面有具体的工作日志,可以查到不回复、执行中断之类的原因。
中文
0
0
0
1.4K
Vincent Cheng
Vincent Cheng@v1ncent_AI·
@linidan_ 玩了下不错,但长程连续工作感觉有点问题,容易中断
中文
2
0
1
1.7K