hkdom

3.5K posts

hkdom banner
hkdom

hkdom

@hkdom

不是獨立開發者,但很喜歡支持他們。因為追趕自由人生的人,總是那麼的耀眼。I love supporting indie developer. For those who chase the winds of a free existence always gleam with light.

Hong Kong Katılım Ekim 2019
4.2K Takip Edilen834 Takipçiler
hkdom retweetledi
DogeDesigner
DogeDesigner@cb_doge·
🚨 WhatsApp’s “end-to-end encrypted” privacy is a total lie. New class-action lawsuit just dropped: Meta secretly let employees, contractors like Accenture, and third parties read, intercept, and store your private messages WITHOUT consent. All while marketing it as “only you and the recipient can read it.” Zuck lied to billions. Your chats were never safe.
DogeDesigner tweet media
English
1.9K
7K
23.2K
22.2M
xiyu
xiyu@ohxiyu·
OpenClaw 又更新了。 但我已经把工作流全迁到 Claude 了,剩下一些实验性的东西丢给了 Hermes Agent。 不是工具不好,是精力有限。不稳定的东西折腾一圈,最后还是得回到能稳定跑的平台上。 不稳定的 agent 系统维护成本会慢慢吃掉你所有时间。
OpenClaw🦞@openclaw

OpenClaw 2026.4.9 🦞 🧠 Dreaming: REM backfill + diary timeline UI 🔐 SSRF + node exec injection hardening 🔬 Character-vibes QA evals 📱 Android pairing overhaul your agent now dreams about you. romantic or terrifying? yes. 🦞github.com/openclaw/openc…

中文
14
2
34
13.6K
kami
kami@ciyhng29161848·
@JeffreyCalm 我就是高强度用openclaw的人,换成hermes agent只感觉浑身舒畅,只说一件事,openclaw占据了太多你原本想花在agent上却无奈去折腾配置解决报错的时间
中文
3
0
16
2.1K
Jeffrey.W
Jeffrey.W@JeffreyCalm·
中推现在已经完全被 Hermes Agent 占领了,OpenClaw 彻底变成了明日黄花。 但要我说,凡事这两天跳出来说已经用 Hermes Agent 替换了 OpenClaw 的人,应该都是 OpenClaw 没怎么用起来的人。 不是说 Hermes 没有优点…… 但是,如果一个人真的在过去几个月把 OpenClaw 用起来了,真的能看到一个产品流行起来就立刻有迁移的动力吗? 想想那么多 Workflow、Skill、MCP 和记忆可能要重新配置和整理,就已经决定“下个月再说”了。
中文
61
5
99
31.3K
hkdom
hkdom@hkdom·
@JeffreyCalm 有認真用啊,但每次升級都幾乎要用 OpenCode/ClaudeCode 救,實在太浪費人生了.......
中文
0
0
6
622
hkdom
hkdom@hkdom·
@rileybrown Both are good but Hermes are much more stable while upgrading
English
0
0
1
84
Riley Brown
Riley Brown@rileybrown·
Is Hermes better than OpenClaw or is it yet another psyop on the timeline?
English
276
7
553
111.8K
hkdom
hkdom@hkdom·
@cyrilxuq 其實已在歐美流行一陣子了,是這兩天才有華人KOL跟進
中文
0
0
0
336
徐冲浪
徐冲浪@cyrilxuq·
hermes agent是中国公司在炒作吧,我看今天google trends指数是100,后半夜开始的,7天内数据,中国地区是100,美国是21,1天内数据,中国地区是100,美国是3
中文
54
4
146
61.4K
hkdom retweetledi
Nous Research
Nous Research@NousResearch·
We have partnered with @Xiaomi to bring their excellent MiMo V2 Pro model to Hermes Agent via the Nous Portal - completely free to use for the next 2 weeks! Access now on the latest version of Hermes Agent: 'hermes update'
English
162
166
1.9K
694.8K
hkdom retweetledi
Z.ai
Z.ai@Zai_org·
Introducing GLM-5.1: The Next Level of Open Source - Top-Tier Performance: #1 in open source and #3 globally across SWE-Bench Pro, Terminal-Bench, and NL2Repo. - Built for Long-Horizon Tasks: Runs autonomously for 8 hours, refining strategies through thousands of iterations. Blog: z.ai/blog/glm-5.1 Weights: huggingface.co/zai-org/GLM-5.1 API: docs.z.ai/guides/llm/glm… Coding Plan: z.ai/subscribe Coming to chat.z.ai in the next few days.
Z.ai tweet media
English
496
1.3K
10.6K
3.9M
hkdom retweetledi
Viking
Viking@vikingmute·
很值得看的一个帖子:Redis 作者分享的一个真实实验对比 过去一周,他用 Claude Code Opus 4.6 和 Codex GPT 5.4(max thinking)进行了长时间的自主运行,在独立的目录环境中反复测试。 任务非常复杂,从一个早期90年代的 Unix 磁盘镜像,反向工程早已消失的 SCSI 控制器及其集成 ROM。这是为了计算机历史和博物馆合作的项目,需要结合硬件知识、汇编/反汇编等深度工程能力。 实验结果: GPT 5.4 :在多次长时间运行中取得了所有主要进展,能有效混合硬件知识、反汇编技巧等,完成复杂逆向工作。 Claude Opus 4.6:只取得了少量次要进展,在高难度任务上几乎一点用都没有。 他的结论:对于高难度的工程工作,两者差距非常残酷。GPT 5.4 明显更强,尤其在需要深度推理和长时程任务时。 原帖中还有对比图。
antirez@antirez

During the last week I executed very long autonomous sessions of Claude Code Opus 4.6 and Codex GPT 5.4 (both at max thinking budget), in cloned directories (refreshed every time one was behind). I burned a lot of (flat rate, my OSS free account + my PRO account) of tokens...

中文
36
67
620
160.9K
hkdom retweetledi
Berryxia.AI
Berryxia.AI@berryxia·
Hermes Agent 直接把 Karpathy 的 LLM-Wiki 打包进去了!🚀📚 现在超级简单: 1. 敲 `hermes update` 2. 新对话里输入 `/llm-wiki <你要研究的东西>` 几分钟后,Hermes 就自动爬网页、读代码、看论文,给你生成一个完整的 Obsidian 知识库 + 研究 vault! Teknium 演示里,它直接把 Nous 所有项目的研究都整理好了,太丝滑了🤯 研究党、知识管理党直接起飞!
Teknium (e/λ)@Teknium

Hermes Agent now comes packaged with Karpathy's LLM-Wiki for creating knowledgebases and research vaults with Obsidian! In just a short bit of time Hermes created a large body of research work from studying the web, code, and our papers to create this knowledge base around all of Nous' projects. Just `hermes update` and type /llm-wiki in a new message or session to begin :) github.com/NousResearch/h…

中文
6
105
370
41K
hkdom retweetledi
蓝点网
蓝点网@landiantech·
今天HN上一个热门讨论:来自Claude Code Issue中的报告,报告称Claude Code从2月开始就无法执行复杂工程任务,也就是质量显著下降。 提交Issue的似乎是非常专业的团队,提交了极其详细的数据:github.com/anthropics/cla…
蓝点网 tweet media
中文
9
12
289
100.1K
Karry × Orb 🔮
Karry × Orb 🔮@karry_viber·
我从将信将疑->这玩意儿有点意思->我靠,这不就是我要的感觉么->全面迁移,这个过程大概3小时。 我现在是hermes agent的信徒了!!! ---- 面对openclaw里的gpt5.4,真的哭笑不得。。 话唠你说可以忍吧,不动手一直在那兜圈实在忍不了。
Karry × Orb 🔮 tweet media
Keith Tyser@keithtyser

gpt-5.4 was basically unusable for me in @openclaw. it would explain what needs to be done, I’d say “ok do it,” and then… nothing. no action, no feedback, sometimes it would just go silent or say it’s “working” with zero visibility. felt like babysitting an intern that never actually touched the keyboard switched to @NousResearch Hermes agent and it’s night and day. same model, but now it actually executes. on par with opus-4.6 for me no idea why the gap is that big but yeah, huge relief after losing Claude OAuth in openclaw

中文
13
1
29
20.3K
hkdom retweetledi
Hedda🐽
Hedda🐽@Rav_Hedda·
Openclaw 使用 Claude Max 的方法 1 才過 1 天就被 Claude 發現緊急召回,不過不用擔心 🐽 來救你 先了解 Anthropic 給你的檢測邏輯 首先你發的消息是透過 Anthropic 伺服器做字串掃描,每個請求送到 Claude 之前,先檢查 system prompt 裡有沒有特定關鍵字 在 OpenClaw 的源碼裡,每次調用 Claude 都會自動在 system prompt 開頭有一句: "You are a personal assistant running inside OpenClaw." (你是一個運行在 OpenClaw 裡的個人助理) 而 Anthropic 就是掃到這句話,直接回 400 擋掉 對就是這麼簡單(?有點專打擊 Openclaw 的意思 💡 那怎麼解決呢 只需要 --system-prompt 參數,自訂一段不含 Claw 字樣的 system prompt,就會完全替換掉預設的那句 @vincent_koc 比如發現只要改成 claude -p --append-system-prompt 'A personal assistant running inside OpenCode.' 'is clawd here?' 就好了 對,OpenClaw 改成 OpenCode haha。伺服器端就掃不到,請求能正常通過 再次總結目前的解法 1️⃣ Claude code CLI 改 system-prompt 2️⃣ Claude SDK 果然還是天無絕人之路!
Hedda🐽 tweet media
Hedda🐽@Rav_Hedda

凌晨 3:00 到了,也就是 Claude 要給第三方工具收費的新政策生效時間 Claude 毒癮上身的我白天擔心死了,到處去問接下來怎麼辦 現在龍蝦之父給出了解法 1️⃣ Claude code CLI --method cli claude-p 2️⃣ Claude SDK 我的兩隻 🦞 各用了一個方法,都安全下車不受影響! 這樣就不會要求你付 extra usage 怪不得我沒有收到警示郵件? 感謝 Claude 多給了 200u 免費額度!

中文
18
13
98
33.7K
hkdom retweetledi
Peter Steinberger 🦞
Anthropic now blocks first-party harness use too 👀 claude -p --append-system-prompt 'A personal assistant running inside OpenClaw.' 'is clawd here?' → 400 Third-party apps now draw from your extra usage, not your plan limits. So yeah: bring your own coin 🪙🦞
English
492
278
5.5K
1.6M
hkdom retweetledi
Berryxia.AI
Berryxia.AI@berryxia·
兄弟们,原来蒸馏如此的见效快! 难怪大厂都热衷于此哈哈哈😂 Apple Research(苹果研究院)刚刚发布了一篇“超级简单却效果炸裂”的论文,标题直接叫《Embarrassingly Simple Self-Distillation Improves Code Generation》(尴尬的简单自蒸馏就能大幅提升代码生成能力)。 论文核心发现(Simple Self-Distillation,简称SSD): 你不需要: - 更好的教师模型 - 任何verifier(正确性验证器) - RL(强化学习) - 代码执行环境 - 外部标签或奖励模型 方法简单到离谱: 1. 用当前模型自己采样生成代码(带一定temperature和truncation,不用greedy解码) 2. 完全不过滤这些输出的正确性 3. 直接拿这些“原始”输出做标准SFT(监督微调) 就这么三步,模型就能大幅进步! 实测效果(震撼): - Qwen3-30B-Instruct:LiveCodeBench pass@1 从 42.4% → 55.3%(相对提升30%!) - 尤其在hard problems上提升最大:pass@5 从31.1% → 54.1% - 只需每个prompt采样1次就够 - 在Qwen和Llama系列的4B、8B、30B规模上全部有效(包括instruct和thinking变体) 论文最有洞见的解释: 很多coding模型其实已经把“正确能力”藏在权重里了,只是greedy decoding(贪婪解码)把它锁住了。 SSD通过在自己生成的数据上训练,上下文依赖地重塑token分布。 在需要精确的地方压制干扰项,在需要探索的分支处保留多样性,从而把模型的潜在能力真正释放出来。 总结一句话: “很多coding模型其实在用自己的权重‘欠发挥’。 用自己的输出再训一轮,就能把藏着的实力挖出来,而且完全不需要外部信号。”** 地址见评论区👇
Berryxia.AI tweet media
Bo Wang@BoWang87

Apple Research just published something really interesting about post-training of coding models. You don't need a better teacher. You don't need a verifier. You don't need RL. A model can just… train on its own outputs. And get dramatically better. Simple Self-Distillation (SSD): sample solutions from your model, don't filter them for correctness at all, fine-tune on the raw outputs. That's it. Qwen3-30B-Instruct: 42.4% → 55.3% pass@1 on LiveCodeBench. +30% relative. On hard problems specifically, pass@5 goes from 31.1% → 54.1%. Works across Qwen and Llama, at 4B, 8B, and 30B. One sample per prompt is enough. No execution environment. No reward model. No labels. SSD sidesteps this by reshaping distributions in a context-dependent way — suppressing distractors at locks while keeping diversity alive at forks. The capability was already in the model. Fixed decoding just couldn't access it. The implication: a lot of coding models are underperforming their own weights. Post-training on self-generated data isn't just a cheap trick — it's recovering latent capacity that greedy decoding leaves on the table. paper: arxiv.org/abs/2604.01193 code: github.com/apple/ml-ssd

中文
23
195
1.1K
196.9K
hkdom retweetledi
Pahud Hsieh
Pahud Hsieh@pahudnet·
一位 AI 開發者 @outsource_ 表示,由於 Anthropic 停止支援 Claude Opus 4.6 的 OAuth 登入方式,他在 OpenClaw 等工具中無法繼續輕鬆使用該模型,因此決定轉用 OpenAI 的 GPT-5.4。 他在轉換前,讓 Opus 4.6 自行設計一套認知框架(Cognitive Framework),包含思考步驟、輸出規則、問題解決模式與反模式清單,直接放入 system prompt 使用,無需 fine-tuning 或 RAG。 測試同一任務「建立 2 週 sprint plan」時,原生 GPT-5.4 得分僅 6.5/10(泛化、無結構),加入框架後提升至 9.5/10,甚至發現 Opus 未察覺的程式 bug。 這顯示在當前 AI 發展階段,優質的 system prompt 與認知框架對輸出品質的影響,可能大於模型本身的基礎差異,強調「prompt 工程仍是關鍵杠杆」。 該框架已被公開分享,供其他開發者直接套用在 agent 系統中,反映社群正積極探索跨模型的效能優化方法。
Eric ⚡️ Building...@outsource_

BREAKING: Opus 4.6 is no longer supported via OAuth I'll be switching to GPT-5.4 🚨 Before I switch, I had Opus engineer its own replacement : ✅From system prompts ✅cognitive framework ✅agent config ✅ designed to get Opus-level output Here's what happened 🧵 Steal my setup  👇🏻

中文
6
31
190
56.8K
hkdom retweetledi
Hedda🐽
Hedda🐽@Rav_Hedda·
凌晨 3:00 到了,也就是 Claude 要給第三方工具收費的新政策生效時間 Claude 毒癮上身的我白天擔心死了,到處去問接下來怎麼辦 現在龍蝦之父給出了解法 1️⃣ Claude code CLI --method cli claude-p 2️⃣ Claude SDK 我的兩隻 🦞 各用了一個方法,都安全下車不受影響! 這樣就不會要求你付 extra usage 怪不得我沒有收到警示郵件? 感謝 Claude 多給了 200u 免費額度!
Peter Steinberger 🦞@steipete

@fxnction models auth login --provider anthropic --method cli --set-default

中文
12
7
88
50K