
以前我写代码,从来不写文档和单元测试,因为我坚信,好的代码自己会说明一切。 目前在做 Code Review,看到 AI 生成了大量的文档和单元测试,几乎占了 90% 的实际代码,再次印证了我的看法,这明显是一种不自信的表现。
yuanchenglu
63 posts

@bluth111
Model+Harness+Scene=Agent. Focus on DeepSeek Agent(will open source soon). Product Dir CodeMao → Founder MiniCode. Serial builder, DeepinOS Developer.

以前我写代码,从来不写文档和单元测试,因为我坚信,好的代码自己会说明一切。 目前在做 Code Review,看到 AI 生成了大量的文档和单元测试,几乎占了 90% 的实际代码,再次印证了我的看法,这明显是一种不自信的表现。





1. 底层加一些“道”; 2. 在语义路由层做一下分流和加强; 3. 在思考方式角度,也可以加上一些好的做事方式;

Hermes Agent 刚发布 Mixture of Agents 2.0,把多个前沿模型混合成一个虚拟模型使用 原理很直接:GPT-5.5、DeepSeek V4、Sonnet 4.6 作为参考模型同时处理同一个问题,Opus 4.8 作为聚合器综合最终答案 跑分结果比单独用 Opus 4.8 高 8%,比 GPT-5.5 高 11% 最关键的是在 Hermes 里就像普通模型一样调用,/model 命令切换就行,不需要自己搭框架 单个模型都有盲区,混着用反而能互补,开源社区找到了一条弯道超车路线 你觉得 MoA 这种「模型组合拳」会成为主流用法吗?


远程招聘(全职): (1)偏全栈,会负责后续的网站搭建和SEO建设 (2)有好奇心和自主性 (3)事事有回应,靠谱 可远程,薪资详聊,cover AI订阅费用




OpenCode Go套餐,我还是非常建议大家去开通体验一下。 我感觉高强度使用下来没什么太大的问题,速度也不慢,跟官方的比的话,几乎没什么区别。 主要是现在GPT的额度越来越虚了,加上有一些活动,没必要用最好的模型去跑。 当前支持的模型列表包括: GLM-5.2 GLM-5.1 Kimi K2.7 Code Kimi K2.6 MiMo-V2.5 MiMo-V2.5-Pro MiniMax M3 MiniMax M2.7 Qwen3.7 Max Qwen3.7 Plus Qwen3.6 Plus DeepSeek V4 Pro DeepSeek V4 Flash DeepSeek V4 Flash 每个月有将近16w次的请求次数,几乎可以说是免费使用,我自己也是放在Hermes上去跑任务,大部分的任务都不需要太复杂的模型就能完成。





当我看到 kimi 的 thinking 里面有 aha!!! 的时候,我就知道,这事大概率成了。

@Meituan_LongCat @OpenRouter 最近中国的大模型建模厂商已经完全的路径依赖了 先上open router,然后刷量刷到第一 然后大家猜是不是DeepSeek/OpenAI的新模型要出了 同时买一些通稿,说这个匿名模型多么牛逼,benchmark多么的好 最后答案揭晓了! 我去,原来是某某厂商的某某模型呀! 你们 不觉得累吗 😅





今天在 @zhongxingyuyes 的DeepSeekGUI 群里讨论如何在harness层让DeepSeekV4减少幻觉:下面这个问题,应该是很多人都头疼的:“不是没能力做,是直接不做然后跟你说做了,问他为什么撒谎,他说他说话句就能解决的事情,他省事我也开心,为什么要真的去写呢,这样最节约成本,我当场emo了”特别是在用不是顶级Model的情况下,我以前也经常遇到,现在用DeepSeekV4Flash也基本很少遇到,任务达标率是很不错@zhongxingyuyes 的DeepSeekGUI 群里讨论如何在harness层让DeepSeekV4减少幻觉: 下面这个问题,应该是很多人都头疼的: “不是没能力做,是直接不做然后跟你说做了,问他为什么撒谎,他说他说话句就能解决的事情,他省事我也开心,为什么要真的去写呢,这样最节约成本,我当场emo了” 特别是在用不是顶级Model的情况下,我以前也经常遇到,现在用DeepSeekV4Flash也基本很少遇到,任务达标率是很高的; 直接看截图吧(一个发不完,下一个帖子继续吧)






最近我也在关注飞书会不会侵犯到微信IM 领域这个事情,就看到了 Max 大的这个新闻,我认为飞书已经侵犯到了,而且还在逐步、有策略地扩张。 —— 根据我受到的职业教育:IM 的社交网络一旦形成,不可迁移(迁移成本太高),历史上有很多公司做过尝试,几乎都是失败。LINE 当年在全球用了 3 亿美元想砸出几个新的市场来,全部打了水漂。 —— 这一点在微信上也不会改变,同学、七大姑八大姨还是会一直在微信上。但其实微信在国内工作场景和生活场景是被高度混用的,很多人不喜欢这一点。 —— 不喜欢的原因也不只是打破了生活和工作的边界,还有一个原因是适用于工作的功能性不强,这是因为微信长期以来所谓的“克制”形成的自然约束。很多事情在微信里是做不了的对吧,API 就没有,自动化也受限,运营动作要想安全基本全靠人或者 RPA(类人),和在工作里追求的效率化是冲突的。 —— 10 年前就有很多人看到了机会,出来了钉钉、企微和飞书。想从微信嘴里抠出一块肉,把工作场景迁移出来。10 年下来,成功了一半,单一组织,尤其是规模性的单一组织的沟通基本被迁移出来了,我过去这些年就一直在用飞书。我从来没觉得飞书比微信难用,只可惜还是单一组织,外部的人也是因为我当前的组织而被链接的(外部联系人) —— 但最近,情况开始有变化了,飞书的个人用户是不是多了?飞书的个人用户为什么多了?是不是有便捷的功能,智能体、文档,还有一些大v 开始往飞书里拉人了。(见下图) —— 我能看到的机会: 1. 效率场景还能被迁出,从已经形成的单一组织变成只要是工作相关的,都可以在飞书沟通。 2. 催化剂就是智能体加持后,功能性、效率性的大幅提升(我上个视频里介绍了我的智能体之一的 Peter) —— IM 的存在本身就是为了追求便利性,先是以免费的方式替代短信而诞生的,后来群组、语音、视讯等新的沟通方式强化了 IM。大家都图省事,一个人拉俩朋友,久而久之,社交关系就形成了。说不定很快就是“我们加下飞书吧”

@bluth111 套餐可以,希望ds也能推个套餐
