zonokaya
99 posts


Coding Agent 的出现,拯救了我对编程的热情。
对我来说,编程最重要的从来不是写出多少行代码,而是对数据、计算、状态和通信做出最完整、最优雅的抽象。
大部分 bug,本质上都不是语法问题,而是抽象问题。错误的抽象一旦进入系统,就会不断繁殖,最后变成修不完的 bug 和还不清的系统债务。
但过去的软件工程行业里,有太多人只是因为行业热门、薪水较高而进入这个领域。他们会写代码,却对抽象没有感知,对结构没有审美,也不关心一个复杂系统为什么要这样组织。
这样的人工作一两年之后,能力往往就会停滞。代码写得更多了,但对系统的理解并没有变深。
更糟糕的是,普通面试很难筛掉他们。甚至因为他们不把时间花在真正困难的系统思考和设计判断上,反而更容易拥有精力去夸夸其谈和向上管理。
最后在团队里,真正愿意思考结构的人,反而要花大量时间替别人补洞、擦屁股,修正错误抽象带来的连锁后果。
这让我一度对写代码这件事产生了生理性的厌恶。
但 Coding Agent 改变了这一点,团队里再也不需要这些只会提供干扰的人的参与,用代码表达思想从未如此畅快。
中文

最近我把和 Claude Code 所有的聊天切到英文交流了,开始会有些蹩脚,但是发现后面越用越舒服,大多数 AI 模型底层的英文训练数据远多余其他语言,我不想经过一层看不见的翻译,加上我想着提高自己的英文输出和说的能力,想立一个 flag 有机会做一次全英文的技术大会分享,应该会比较有意思。
于是我给 Waza 加了一个能力叫做 English Coaching,你尽管输入你的蹩脚英语,他会在任务执行完毕后,输出一个 😇 然后给你纠正你的问题,是语法错误还是单词或者是不够地道,这样你会使用起来越来越熟练,相比每天打卡学习多邻国,我更喜欢这个寓教于乐的感觉,假如你也需要,可以去看看 Waza,一条命令直接安装即可。
github.com/tw93/waza

中文

@zzNeutrino 本来就没认真拦过,这么容易翻的墙,翻不翻只取决于你想不想翻,GFW就没打算封死,只是把不需要国际互联网的人留在国内生态,如果真认真去拦了,就不是一个机场能解决的了
中文

大晚上看到这篇《大模型踩坑记》文章,太有意思了😂。
作者 @0xTYZ 踩坑记录写得很真实,几个问题背后的根因值得展开说说:
1️⃣坑一根因:国产模型对 system prompt 的指令理解普遍偏「字面量」。Claude/GPT 会做语义推断,「何时通知」规则里没明说问候,它也知道问候算一种需要响应的事件;但部分国产模型的 instruction following 更像正则匹配,条件不命中就静默。本质是 RLHF 对边缘 case 的泛化能力差距。
2️⃣坑二原因:变量替换混乱,说明模型没有真正区分「模板占位符文本」和「运行时值」。`你的姓名` 是 prompt 里的占位符描述,模型应该在推理阶段用实际值替换,结果直接原样输出,上下文追踪能力不够。
3️⃣坑三原因:大概率是安全审核在工具调用链路上触发了误杀,我自己在使用中经常遇到。国产模型内容审核粒度粗,遇到某些词汇组合直接截断,连 function call 的 payload 也不放过,所以看起来就是「莫名停止」。这种黑盒行为在生产环境简直是灾难,你不知道它什么时候会出现。
4️⃣坑四/五原因:工具调用稳定性和输出格式遵循度,这两项几乎是目前所有国产模型的通病,个人感觉是在 function calling / structured output 的对齐训练上投入不足。
🔥一点看法:
国产模型这两年进步有目共睹,但进步速度和生产可用是两件事。指令遵循的稳定性、边缘 case 的处理、审核系统的可预测性,这三项和顶尖模型的差距,不是几个 benchmark 分数能遮住的。
玩归玩,闹归闹,生产环境选模型,稳定性优先,别为情怀买单。
以上。
tengyz (openbee)@0xTYZ
中文

推荐这个基于 Claude Agent SDK + Electron 开发的开源 Agent
Craft Agents 是 Craft 团队开源的一款 AI Agent 工具,核心理念是为 Claude Code 提供一个更友好的图形界面,让用户能更高效地与 AI 编程助手协作。
核心特色
告别命令行的 Claude Code 体验——保留 Claude Code 的全部能力,但用精心设计的 UI/UX 包装。作者坦言自己不喜欢终端界面,更偏爱优雅的视觉设计、字体排版和触控交互。
解决实际痛点——针对 Claude Code 使用中常见的困扰:难以审查计划、不易理解代码变更的原因、多任务切换困难等问题,提供了更清晰的工作流。
非技术人员也能用——Craft 内部的财务、市场、客服、HR 团队都已开始日常使用,证明了它对「非程序员」的友好度。
可 fork、可定制——采用 Apache 2.0 协议开源。作者认为未来的个人软件不是从零构建,而是「fork + remix」——基于现有项目二次定制,打造真正属于自己的工具。
技术背景
基于 Web 技术栈开发,底层调用 Claude Agent SDK。作者是有 20+ 年经验的 iOS/UIKit 工程师,这是他首次认真尝试 Web 开发,整个项目 100% 代码由 Claude 编写,但架构决策和 UX 细节打磨完全由人主导。
项目地址
下载:agents.craft.do
源码:github.com/lukilabs/craft…

Balint Orosz@balintorosz
中文

@zach_sndr @conductor_build there is a terminal panel, you can just vim/nvim it😉
English

I have a genuine question, why doesn't @conductor_build have it own text editor, or AM I MISSING SOMETHING 😭
English

用了一天 @conductor_build ,记录下感受,说它是 code editor 吧,它没有任何手动编辑文件的能力,说它不是 code editor 吧,它又几乎能完全替代现有的 code editor,除了不能手动编辑文件,预览、diff、terminal、git 该有的都有,最抓痛点的是针对同一个项目可以开很多不同的独立 workspace,每个 workspace 可以并行 ai coding 推到不同的 git 分支,极大提升了 ai coding 的效率
缺点就是效率提升之后 token 消耗巨快,我先是用完了两个 codex 账号,然后又买了个新的 claude code pro,然后 claude code pro 又用完了,又开了新的 claude code max,现在 claude code max 也用完了... 才有空来写个感受
中文

马斯克说的很对,我们守着一个质量占太阳系99.86%的核聚变发电厂(太阳),却一直在朝自己造核电站方向在努力:
日本成功测试了一种在太空发电并通过无线方式将电力传输回地球的系统。放置在轨道上的太阳能电池板收集能量,并利用微波传输技术将其发送到地面站。
微波能量抵达地球后,被转换回可用的电能。这表明,我们可以从地球之外获取能量,并且无需物理电缆或燃料运输即可输送。
与地面太阳能发电不同,太空太阳能发电系统可以不受天气、云层或昼夜循环的影响,持续不断地收集能量。这使得该系统在稳定、大规模的可再生能源生产方面极具吸引力。
这项测试是迈向未来太空太阳能发电场的早期但至关重要的一步。工程师们认为,规模更大的阵列最终可以为城市或偏远地区提供清洁能源。
专家认为,这有望改变人类的能源生产方式,将太空技术与应对气候变化的解决方案相结合。虽然目前仍处于试验阶段,但此次成功证实了该概念在技术上是可行的。

中文























