Alro·Yonas

1.4K posts

Alro·Yonas banner
Alro·Yonas

Alro·Yonas

@tanglang52

漫品人生、多元认知、通识智慧 、自我迭代。 我所追寻的,是让知识褪去艰涩的外衣,成为滋养灵魂的养分;让认知跨越刻意的束缚,化作指引生活的微光 —— 最终在不慌不忙的自我救赎里,过上踏实幸福的日子。 一个普通学习者的读书 / 学习随手记 都是自己瞎琢磨的小感悟, 没啥专业度, 一家之言,大家随便看看,理性参考~

china Katılım Aralık 2015
6.7K Takip Edilen209 Takipçiler
Sabitlenmiş Tweet
Alro·Yonas
Alro·Yonas@tanglang52·
行动是唯一的解药。
Alro·Yonas tweet media
中文
0
0
11
603
Alro·Yonas retweetledi
Observer
Observer@amazinglvxw·
Hermes Agent 让 AI 自己学习。但谁保证它学对了? Hermes Agent (30K⭐) 的自我改进能力很强——Agent 使用中自动创建 Skill,下次直接调用。 但有个被忽略的问题:Agent 自己决定"学什么",真的靠谱吗? 我们用 Enso 做了 5 个月实验,发现三个残酷事实: 1️⃣ Agent 会走捷径跳过学习 写在 Prompt 里的规则,Agent 会绕过。我们的审计发现:1600行规则中大部分被跳过。 解法:把学习从"Agent 选择"变成"代码强制"。10个 Shell Hook,物理上无法跳过。 2️⃣ 不遗忘比遗忘更危险 Hermes 的 Skill 只增不减。EvoClaw 论文证明:未验证的错误记忆会雪球式累积。 解法:主动遗忘——stale 衰减 + LRU 淘汰 + 每周健康检查。 3️⃣ 学习质量需要独立验证 Claudini 论文发现:Agent 会 Reward Hacking(合法改进耗尽后 game 评估协议)。 解法:不可变 Hook 保护 Harness 不被 Agent 篡改(我们的 Agent 真的试过改自己的安全机制——被拦住了😂) 两种路线: Hermes: Agent 自主决定学什么 → 重量级(需GPU) → 风险:学错没人管 Enso: 代码决定学什么 → 轻量级(纯Shell) → 安全:不可变核+遗忘+Lint 30K Stars 证明自进化是正确方向。 但"让 Agent 学习"和"保证 Agent 学对"是两个不同的问题。 Hermes 解决了第一个。Enso 解决了第二个。 1267行代码,零依赖,开源:github.com/amazinglvxw/en…
中文
4
11
70
11.8K
Alro·Yonas retweetledi
Andy Stewart
Andy Stewart@manateelazycat·
最近 Hermes Agent 很火,堪称吊打小龙虾OpenClaw哇! 我仔细研究了一下,发现它在记忆模块上做得特别优秀。 Token 消耗直接省一大半,很多人养了之后直呼“性价比养虾哈哈哈” 传统 OpenClaw(小龙虾): 维护记忆的方式非常简单暴力,它主要靠SOUL.md 灵魂文件和 MEMORY.md 记忆文件。 所有聊天记录、角色设定、你的偏好、历史任务,全都一股脑儿塞进去。好处是透明、容易理解 但问题也很明显:聊天次数一多,这两个文件就变得非常庞大。 每次任务一来,OpenClaw 就把整个文件几乎全量丢给大模型,结果导致:大模型注意力严重分散,Token 消耗非常高 所以很多人养小龙虾,最后要么养挂了,要么被 token 账单干趴下。 创新Hermes Agent(赫妹): 而 Hermes Agent 在这一点上做了两个非常聪明的创新 1. 主动创建 Skill(技能) 它会在对话过程中,自动把值得复用的任务总结成一个小笔记(Skill),相当于自己写了一本专属秘籍,存进内部数据库。 2. 渐进式 + 模块化调用 需要的时候只智能加载当前需要的部分,而不是一次性全塞进来。 这样做的好处是:节省 token、记忆不会膨胀、注意力更集中,还能越用越聪明。 两款 Agent 都很好用,各有优势。 但如果你想长期养一个省钱、聪明、越来越懂你的私人 Agent,我强烈推荐大家尝试 Hermes Agent! 目前最方便的方式是在懒猫微服部署,内网穿透非常方便,支持一键安装 Hermes Agent,几分钟就能跑起来,接 Telegram 就能日常使用。 想玩的老板评论区打 “1”,我私信给你详细的安装教程和使用技巧!
Andy Stewart tweet media
中文
24
19
116
22.6K
Alro·Yonas retweetledi
宝玉
宝玉@dotey·
Hermes Agent 势头很猛,这几天推荐的人很多,可以关注一下。我自己安装试用了还可以。 Hermes Agent 是由 Nous Research 在今年 2 月底开源的 AI 智能体框架,上线不到两个月,GitHub 星标已经接近三万。这个项目被社区认为是 OpenClaw(龙虾)上线以来,第一个真正意义上的竞争对手。 两者都是自托管的开源智能体,都能接入 Telegram、Discord、Slack、WhatsApp 等聊天平台,都支持多模型切换,都走 MIT 协议。但设计哲学完全不同。 【1】龙虾是网关,Hermes 是引擎 OpenClaw 的核心是一个 Gateway(网关守护进程),负责统一管理会话、路由和渠道连接,像一个调度中心,把你的各种聊天应用连接到 AI agent。你可以理解为它是一个“多渠道个人助理操作系统”。 Hermes Agent 的核心则是 agent 自身的执行循环。它不是围绕“怎么把消息送到 agent”来设计的,而是围绕“agent 怎么变得越来越强”来设计的。官方管这叫 closed learning loop(闭环学习循环)。 【2】会自己写技能的 agent 这是 Hermes 最有意思的地方。当它完成一个复杂任务(通常涉及五次以上工具调用)后,会把整个过程沉淀成一份结构化的技能文档,存成 Markdown 文件。下次遇到类似任务,直接加载这份技能,不用从头解决。 更关键的是,这些技能在使用过程中会自我迭代。如果 agent 在执行技能时发现了更好的方法,它会自动更新技能文档。有 Reddit 用户反馈,agent 在两小时内自动生成了三份技能文档后,重复性研究任务的速度提升了 40%。 OpenClaw 也有技能系统,但主要依赖人工编写和社区贡献的技能市场 ClawHub。Hermes 这边等于把“写技能”这件事也交给了 agent 自己。 【3】记忆体系的差异 两者都声称有跨会话记忆能力,但实现方式不同。 Hermes 用 SQLite 数据库配合全文检索,把所有历史对话存下来,需要时通过搜索加摘要召回。它把记忆分成两层:一层是常驻的关键信息(写在 MEMORY.md 里,每次对话都带上),另一层是全量历史检索(容量无限,按需调用)。 OpenClaw 的记忆则是工作区里的 Markdown 文件,走的是“文件即记忆”的路线,通过语义检索工具来查找。在上下文压缩前会执行一次静默记忆写入,防止压缩丢信息。 简单说,Hermes 更像是给 agent 装了一个搜索引擎式的大脑,OpenClaw 更像是给它一个笔记本。 【4】安全思路也不一样 Hermes 搞了一套五层纵深防御:用户授权、危险命令审批、容器隔离、凭据过滤、上下文注入扫描。默认对高风险操作(比如执行终端命令、写文件)要人工审批,超时未批准就自动拒绝。 OpenClaw 这边则更强调信任模型和配置审计。它提供了 openclaw security audit 命令,可以一键扫描网关配置的安全隐患。但 OpenClaw 在安全方面的历史记录不太好看,今年 2 月被曝出多个高危漏洞,13.5 万个实例暴露在公网上,技能市场也有超过 300 个恶意技能被发现。 【5】要不要换或者选哪一个 如果你日常用的 Agent 已经顺手,没必要。如果你之前的龙虾主要是 claude code 的授权现在用不了可以试试这个,但不能保证继续用多久。如果喜欢折腾想试试不同的选择,也可以试试。 如果你想要一个“多渠道助理平台”,接入各种聊天工具,用社区现成的技能市场,OpenClaw 的生态更成熟,34.6 万星标不是白来的。 如果你更关心 agent 的长期进化能力,想让它用得越久越聪明,或者你是做 AI 研究的,需要生成训练轨迹、跑强化学习实验,Hermes 的架构更对口。它还内建了一个兼容 OpenAI API 的服务端,可以直接作为后端接入 Open WebUI 等第三方界面。 Hermes 跑在 5 美元一个月的 VPS 上就够用,也支持 Docker、SSH 远程、Modal 等 serverless 方案。安装只需要一行 curl 命令。 安装不复杂,参考官方文档即可:hermes-agent.nousresearch.com/docs/getting-s… 爱马仕的英文也是 Hermes。
Nous Research@NousResearch

Meet Hermes Agent, the open source agent that grows with you. Hermes Agent remembers what it learns and gets more capable over time, with a multi-level memory system and persistent dedicated machine access.

中文
62
297
1.5K
242.9K
Alro·Yonas retweetledi
Farza 🇵🇰🇺🇸
This really exploded. You can download Clicky below. I'm seeing people already use it for stuff like: - Learning Blender - Getting live coaching in a chess game - Getting design feedback in Lovable Enjoy! github.com/farzaa/clicky/…
Farza 🇵🇰🇺🇸@FarzaTV

I built this thing called Clicky. It's an AI teacher that lives as a buddy next to your cursor. It can see your screen, talk to you, and even point at stuff, kinda like having a real teacher next to you. I've been using it the past few days to learn Davinci Resolve, 10/10.

English
81
61
1.4K
109.4K
Alro·Yonas retweetledi
Bill The Investor
Bill The Investor@billtheinvestor·
我开发了一个叫 Clicky 的工具,它像一个 AI 教师,住在你光标旁边。它可以看见你的屏幕,和你对话,甚至能指着东西,有点像真有人在你旁边教学。我过去几天用它学习 Davinci Resolve,评分 10/10。
中文
26
41
333
35.5K
Alro·Yonas retweetledi
V.
V.@Moodsby_v·
Charlotte Salt
V. tweet media
English
0
83
525
9K
Alro·Yonas retweetledi
Alro·Yonas retweetledi
Oriku
Oriku@Oriku175·
Liquid mask on hover. Move your cursor — watch the image melt away. Built this in @framer + @hiunicornstudio this weekend. More satisfying than I expected 😶 Live demo in the replies 👇
English
37
42
667
21.1K
Alro·Yonas retweetledi
am.will
am.will@LLMJunky·
Milla Jovovich has a Github 😏 She's co-developed the highest-scoring AI memory system ever benchmarked with @bensig Totally free and OSS. What a boss.
am.will tweet media
Ben Sigman@bensig

Excited to announce a new open-source, free-to-use memory tool I have been developing with my good friend @MillaJovovich. The project is called MemPalace and it is an agentic memory tool that scored 100% on LongMemEval - the industry standard benchmark for memory… this is higher on than any other published results - free or paid - and it is available now on GitHub. You can check out Milla’s video about it on her Instagram. I’ll also put some links in the comments below - please try it out, critique it, fork it, contribute to it - and join our discord.

English
235
1.3K
12.2K
1.4M
Alro·Yonas retweetledi
Berryxia.AI
Berryxia.AI@berryxia·
Karpathy 前两天刚说“应该有人做这个”, 兄弟们,48小时后就有人直接干出来了! Graphify 横空出世: ✅ 指向任意文件夹 ✅ 在 Claude Code 里输入 /graphify ✅ 自动生成完整知识图谱 + Obsidian vault + Wiki ✅ 支持 13 种代码语言 + PDF + 图片(Claude Vision) ✅ 查询 token 用量只有原来的 1/71.5! 以后 AI 再也不用每次硬啃整个文件夹了,直接问知识图谱就行,太丝滑了🤯 一键安装:pip install graphify && graphify install
Berryxia.AI tweet media
中文
17
262
1.2K
80.4K
Alro·Yonas retweetledi
Farza 🇵🇰🇺🇸
This is Farzapedia. I had an LLM take 2,500 entries from my diary, Apple Notes, and some iMessage convos to create a personal Wikipedia for me. It made 400 detailed articles for my friends, my startups, research areas, and even my favorite animes and their impact on me complete with backlinks. But, this Wiki was not built for me! I built it for my agent! The structure of the wiki files and how it's all backlinked is very easily crawlable by any agent + makes it a truly useful knowledge base. I can spin up Claude Code on the wiki and starting at index.md (a catalog of all my articles) the agent does a really good job at drilling into the specific pages on my wiki it needs context on when I have a query. For example, when trying to cook up a new landing page I may ask: "I'm trying to design this landing page for a new idea I have. Please look into the images and films that inspired me recently and give me ideas for new copy and aesthetics". In my diary I kept track of everything from: learnings, people, inspo, interesting links, images. So the agent reads my wiki and pulls up my "Philosophy" articles from notes on a Studio Ghibli documentary, "Competitor" articles with YC companies whose landing pages I screenshotted, and pics of 1970s Beatles merch I saved years ago. And it delivers a great answer. I built a similar system to this a year ago with RAG but it was ass. A knowledge base that lets an agent find what it needs via a file system it actually understands just works better. The most magical thing now is as I add new things to my wiki (articles, images of inspo, meeting notes) the system will likely update 2-3 different articles where it feels that context belongs, or, just creates a new article. It's like this super genius librarian for your brain that's always filing stuff for your perfectly and also let's you easily query the knowledge for tasks useful to you (ex. design, product, writing, etc) and it never gets tired. I might spend next week productizing this, if that's of interest to you DM me + tell me your usecase!
Andrej Karpathy@karpathy

Wow, this tweet went very viral! I wanted share a possibly slightly improved version of the tweet in an "idea file". The idea of the idea file is that in this era of LLM agents, there is less of a point/need of sharing the specific code/app, you just share the idea, then the other person's agent customizes & builds it for your specific needs. So here's the idea in a gist format: gist.github.com/karpathy/442a6… You can give this to your agent and it can build you your own LLM wiki and guide you on how to use it etc. It's intentionally kept a little bit abstract/vague because there are so many directions to take this in. And ofc, people can adjust the idea or contribute their own in the Discussion which is cool.

English
222
361
4.6K
1.7M