lei wanglei
3.8K posts


@huanghllose @Lonely__MH 还可以切换到中文界面,不过配置安装的时候一定要注意网络环境,我被这个网络问题折腾了很久最后才搞定,
中文

聚币宣发有没有参与?- 有
帖子删了么?-从来不删,做了的认没做的不认,不自欺欺人
为什么参与? - 人情关系
费用呢? -每个月都有爱之家捐款(历史推文多次提及),非要说这笔钱是哪一笔广告费也挺假的
不怕被告么? - 这号一开始搞键政都不怕,随意。

btcggbond@btcggbondpro
@Paris13Jeanne 聚币诈骗有你,你完了,赶紧自首
中文


@wumingool @wzyd888 @0b7cm 是的,属实。
X产品负责人nikitabier 1月30日公开确认:中国政府在政治动荡时会用色情内容淹没X中文搜索结果,以阻止公民获取实时信息。
“这是一个难以解决的问题,但我们已意识到并正在努力解决。”
他还提到涉及500-1000万预注册账号。多家媒体报道属实,X团队正处理。
中文


@lianyanshe xai的图片和视频能力怎么样,基于x训练这方面应该不会差太多吧,主要是我看到国内做ai漫剧的人用这玩意当廉价劳动力,不知道真假
中文

目前的 AI 编程能力排行榜,中国的开源模型把 TOP5 的 4 名都给占了,上面这些模型基本上都用过,简单聊一下使用感受。
1、Anthropic 的 4.7 是两个月前发布的能力还是第一,更何况还有前端时间封禁的 Fable 刚刚解禁,领先国内半年左右,目前国内顶级模型相当于Opus 4.6(2月5日发布),GLM-5.1是最争气的才 2 个月就追上了4.6大概能达到 90% 的能力,论编程能力还是国内第一。
2、最新的 GPT 5.5 在 codex 里使用能力是最强的,黑话还是很多,而且产品上比 Claude code 做的更好,更适合执行实际的工程任务,边界判断和测试更多。Google 的 Gemini 已经变成美国豆包了,主打性价比。meta 的模型没用过不知道实际能力如何。
3、Qwen 3.7 max(5 月 20 日) 目前综合能力第一,因为有多模态和多语言优势。有专门优化过智能体设计,放到 Claude code、openclaw、hermes 里面都可以很好的使用工具链。
4、GLM-5.1 (4 月 8 日)最早追平Opus 4.6的能力,主打长程任务,一直都被称为 Claude 平替花 20% 的钱达到 90% 的效果,从GLM-4.7发布半年多以来确立领先地位,多次提价依旧火爆,大概领先其他国内模型1个月左右时间。但比较可惜5.1 是一个纯文本模型,还不具备原生多模态能力,一般两个月时间迭代一次,估计下一代快来了。
5、Minimax m3(6 月 1 日) 占了晚发布的优势,也是第一次进入前五,把 minimax 多模态的能力合并进来了,模型参数量也翻倍,所以这次提价也算合理。但实际体验下来m3的规划能力相比来说稍差,同样一个任务需要更多的步骤。
6、Kimi-k2.6(4 月 20 日)Agent 集群协作,是国内里最早支持多模态的,前端审美能力在线,cursor 的编程模型基座就是基于k2.6
7、DeepSeek-V4-Pro(4月24日)和MiMo-V2.5-Pro(4月24日)两个能力接近,DeepSeek还是价格屠夫,API 定价永久 2.5 折,缓存命中率高,不搞 Token plan,因为每个人都是 Token plan。MiMo原来定价偏贵,降价以后两者差距其实不大了。两个模型在写作能力上表现不错,如果你是写文章可以用这两家
8、xAI 表现很拉,唯一强项在 X 的搜索能力,腾讯的hunyuan-hy3也比较一般,但在腾讯产品内有专门调优过,可以跟上其他模型的上一代标准,代码就别指望了。普通的简单任务因为腾讯有更好的数据源,实际表现也不会差太多。腾讯最强的点在于它独有的上下文优势。

中文

时隔两个月,Hermes agent已经从0.7.0版本更新到了0.16.0,并且成了OpenRouter上调用量遥遥领先的agent产品。
所以我把《Hermes橙皮书📙》完全重新了,83页的pdf,包含中英双语版本,继续开源!

花叔@AlchainHust
中文

@xunyi1018 @bi_9527zx hermes不是和minimax嵌入的比较深吗,在国产模型里面,我今天用minimax的云服务,直接下了一个指令然后根据直接就自动调用了模型生成了符合内容的视频,就是太费积分了,30元积分所剩无几(小白刚接触),来学习的
中文

@bi_9527zx 主模型用 mimo2.5pro,视觉模型用 mimo2.5 或者 minimax m3,标题和压缩上下文用 minimax m2.7high speed 用着也很不错,deepseek 单独编程还不错,但要是用智能体,感觉它的自主性和工具调用差 mimo 有点多
中文

Hermes Agent这样设置那么恭喜你为了省钱又进一步😂
deepseek为主大模型,kimi2.6为视觉模型,并且无需来回切换,只要丢图片进去就会自动使用kimi2.6去识别。(理论是你可以设置更多的大模型去完成不同的工作,并且全程自动无需切换大模型)
写很多以X文章的形式去编辑这类干货教程已经很多了,我想试试普通的发帖方式编辑会不会被更多的人去看到。
那么话不多说下面直接是干货!
-
主模型:deepseek-v4-pro
视觉模型:kimi-k2.6
运作逻辑:deepseek 负责所有的工具调用、代码、排查、对话,一旦你丢过来图片或者视频帧,系统自动切到 kimi 去识图,识完把结果扔回给 deepseek 继续处理。整个过程不需要手动切换模型,你体感上就是同一个助手在干活,但实际上后面是两个大脑在协作。
-
为什么这样搭
deepseek-v4-pro 的工具调用和长上下文处理能力确实强,跑代码任务、排查问题、多步骤复杂操作的稳定性比 kimi 好一截。
但它有一个硬伤暂时不支持多模态,直接给它丢图片会报 unknown variant image_url 的错。
而 kimi-k2.6 的多模态能力不用说,中文 OCR 也准,但纯文本推理和工具调用不如 deepseek 稳。
所以最优解就是各取所长,deepseek 当大脑,kimi 当眼睛。
(其实说白了就是为了省Token!!!)
-
配置步骤
第一步,确保 API Key 就位。在 `~/.hermes/.env` 里确认两行:
```
DEEPSEEK_API_KEY=你的deepseek密钥
KIMI_API_KEY=你的kimi密钥
```
第二步,切主模型,终端敲:
```
hermes config set model.default deepseek-v4-pro
hermes config set model.provider deepseek
```
第三步,设视觉模型:
```
hermes config set auxiliary.vision.model kimi-k2.6
hermes config set auxiliary.vision.provider kimi-coding
hermes config set auxiliary.vision.base_url api.moonshot.ai/v1
```
第四步,如果你的 kimi key 是老 key(sk- 开头不是 sk-kimi- 开头),需要在 `.env` 最后加一行:
```
KIMI_BASE_URL=api.moonshot.ai/v1
```
新 key 走 api.kimi.com,老 key 走 api.moonshot.ai,config 默认写的 api.moonshot.cn 是错的,不改会 401。
第五步,`/reset` 重开会话,生效。
-
踩过的坑
一个是上面说的 api 地址问题,moonshot.cn 和 moonshot.ai 差一个字母,排查了好一阵。
另一个更隐蔽:Hermes 内置的 vision 工具往 kimi API 发请求时,content 数组里 image_url 排在了 text 前面,kimi 的接口不认这个顺序,偶尔 400。
目前的变通方案是发图时绕过内置工具,直接 Python 调 moonshot API,text 放 image_url 前面就没事。
不影响使用,但不算完美,等后续优化。
-
配完之后你正常跟他聊天就行,deepseek 处理一切。
发图过来的时候,你不需要说"用 kimi 看",系统自动检测到图片就走 kimi 视觉,识读完无缝回到 deepseek 继续对话。
你体感上就是同一个助手能看能想能干,但后台其实是两个模型在做各自最擅长的事。
这个方案的最大好处是不用你在聊天里手动切模型,流程全自动。而且以后如果想换视觉模型,改 `auxiliary.vision.model` 一行就行,不影响主模型。
-
兄弟们有哪个不懂的直接甩在评论区,狙击手会挨个解答!
中文

用了一下午就能写一个谷歌chrome多开软件。
大家提提意见~
可以导入代理ip,鼠标键盘同步窗口。
github.com/cryptoresetlif…
下载地址github.com/cryptoresetlif…

中文


















