香蕉Banana

905 posts

香蕉Banana banner
香蕉Banana

香蕉Banana

@treydtw

💻AI Coding、自动化 |📷自媒体 | 全网同名:香蕉 Banana 公众号:香蕉Labo

Katılım Aralık 2024
118 Takip Edilen2.2K Takipçiler
香蕉Banana
香蕉Banana@treydtw·
很详细的 hermes Agent报告,适合快速了解
meng shao@shao__meng

Hermes Agent 深度技术报告 (包含 OpenClaw 迁移方案) @Scobleizer @blevlabs 创办的 ScobleMediaAgent 深度收集信息生成报告 @NousResearch 官方发布、创始人 @Teknium 审核修正 docs.google.com/document/d/1sZ… 关于 Hermes Agent 是什么,不多赘述,如果你正在用 OpenClaw,不妨试试 Hermes Agent,架构和运行更稳定,也有专业研究团队 Nous Research 支撑! - Hermes Agent 技术架构亮点 1. 学习闭环 (The Learning Loop) — 核心创新 · Skills 创建:自动从复杂任务中提取可复用流程,存储于 ~/.hermes/skills/ · Skills 自优化:执行中发现更优路径时自动更新 Skills,运行时迭代改进 · 记忆提示:自动将关键信息持久化到 MEMORY.md / USER.md,无需手动指令 · 跨会话召回:SQLite + FTS5 全文搜索历史会话,Gemini Flash summarization · 用户建模:Honcho 方言式用户理解层,跨会话/跨平台构建用户画像 2. 双层记忆系统 L1 持久记忆 (~1,300 tokens):始终注入系统提示词 · MEMORY.md (~800 tokens):Agent 的个人笔记 · USER.md (~500 tokens):用户画像与偏好 L2 会话搜索 (无限容量):SQLite 持久化存储,FTS5 快速检索 3. 模型生态支持 支持 200+ 模型,通过多层级配置: · OpenRouter (推荐默认) · Anthropic (原生 API) · GitHub Copilot (支持 GPT-5.x/Claude/Gemini) · Ollama (本地开源模型) · 以及 10+ 其他直连提供商 (Kimi、MiniMax、Qwen 等) 4. 网关架构 (Messaging Gateway) 支持 13 个消息平台 (报告最初只列了7个,Teknium 修正): Telegram、Discord、Slack、WhatsApp、Signal、Email、Home Assistant、Matrix、Mattermost、SMS、DingTalk、Webhook、API Server 核心特性:跨平台会话连续性——从 CLI 开始,Telegram 继续,Discord 完成,代理精准接续上下文。 - 关键功能模块 · Sub agents 并行:上下文隔离的并行工作流,防止"上下文污染" · MCP 集成:选择性工具加载、自动重载、工具过滤 · 浏览器控制:Browser Use CLI 2.0 / CDP 实时 Chrome 连接 / Headless · 语音模式:CLI 按键通话 + Telegram/Discord 语音消息 + Discord 语音频道 · Cron 调度:自然语言定时任务,支持按任务指定模型和交付平台 · 插件系统:Python 文件即插件,无需 Fork,支持工具/命令/生命周期钩子 · IDE 集成 (ACP):VS Code / Zed / JetBrains 原生 Agent 后端支持 · 研究/RL 训练:Atropos 集成、轨迹生成、OPD (On-Policy Distillation) - 安全架构 (7层防护) · Tirith 预执行扫描:静态分析终端命令危险模式 · 智能审批:Codex 风格审批系统,学习用户偏好 · PII 脱敏:发送至 LLM 前自动擦除个人身份信息 · 容器隔离:Docker 后端,显式工作区挂载 · 环境变量隔离:子进程自动剥离 Agent 凭证变量 · 记忆安全扫描:拦截提示注入、凭证外泄、SSH 后门、隐形 Unicode · 供应链安全:依赖版本严格约束,CI 测试供应链攻击向量 - OpenClaw 迁移 Hermes 迁移路径: hermes claw migrate # 完整迁移 hermes claw migrate --dry-run # 预览 导入内容:SOUL.md、记忆、技能、允许列表、消息配置、API 密钥、TTS 资源等。 社区共识:"OpenClaw 做初级工作,Hermes 是高级工程师" (来自 Teknium 转发评价)

中文
0
0
1
105
香蕉Banana
香蕉Banana@treydtw·
看到hermes agent挺火的,去看了下它的实现 代码里面有一个方法 run_conversation, 通过工具调用,把一件事情持续完成 这是相对于 Openclaw比较好的一点,openclaw需要聊天对话,然后很多活在这个过程中完成。 hermes agent则是发布一个任务后,直接去干,直到完成。比较像Claude Code的 YOLO
香蕉Banana tweet media香蕉Banana tweet media
中文
2
0
6
195
香蕉Banana
香蕉Banana@treydtw·
都去给我用!! 豆包输入法Mac版本终于开始内测了 手机上就一直在用,真的太舒服了。 相对于typeless的几个优势,完全免费、快速、准确,还不会改你的原意,而且还是流失输出。 已经没有什么理由继续充值typeless了
香蕉Banana tweet media
中文
0
0
0
302
香蕉Banana
香蕉Banana@treydtw·
知识不足是因为只用过豆包,没有用过Claude code,甚至不知道有Claude code。 AI First是思维模式的重塑,需要持续、正向的反馈来驱动。 如果不理解AI能力的边界,不知道它能做什么、不能做什么的边界在哪,自然就不会知道AI其实可以大幅缩短自己的工作时长。 既是认知不足,也是知识不足
dontbesilent@dontbesilent

我倾向于解读为知识问题,不能 AI First 不是习惯不好,是知识不足 用的少、没用过、不了解,所以觉得 AI 解决不了问题,所以就不用 用过的产品都很差,所以觉得 AI 解决不了问题,所以就不用 有的人觉得 AI 能思考不能执行,所以自己干活 有的人觉得 AI 能执行不能思考,所以还是喜欢问人 都是知识不足

中文
0
0
0
259
香蕉Banana
香蕉Banana@treydtw·
@XianyuLi cmd或者powershell都可以的,装个clink,还能带提示
香蕉Banana tweet media
中文
0
0
1
327
Xiangyu 香鱼🐬
Xiangyu 香鱼🐬@XianyuLi·
现在大家windows的终端一般大家都推荐啥啊
中文
87
1
40
22.4K
香蕉Banana
香蕉Banana@treydtw·
转需! 试用了下相当不错,cli的方式有时候还会担心封号,浏览器的方式就放心好多
yan5xu@yan5xu

😅嗯,bb-browser,badboy browser,坏孩子浏览器来了,真的很丧良心,但真的很好用。 现在你可以用 bb-browser site 的方式直接拉到任何网站的信息,目前支持 Reddit、Twitter、GitHub、Hacker News、小红书、知乎、B站、微博、豆瓣、YouTube,50+ 个命令,我会持续更新。 当然能做到信息获取这件事不稀奇,我也是看到 @jakevin7 的 twitter-cli 的启发,才做的。但 bb-browser 的实现方式非常丧良心 — 我是通过 Chrome 插件 + CDP 直接操控你真实的浏览器。不是无头浏览器,不是偷 Cookie,不是模拟请求。你已登录了,它就直接用你的登录态。它直接在浏览器 console 里面跑 eval,以前爬虫最麻烦的登录态、还有各种鉴权都没有了😂。(这种方式真的。。。太作弊了,我都能想到哪些大厂前端发现我在这么搞,会怎么骂我,因为真的很难防) 另外我还在命令行里面埋了 guide 命令,也就是说你只要装了 bb-browser CLI 或 MCP,跟你的 Agent 说"我需要把 XX 网站 CLI 化",它就能帮你做了!!

中文
0
0
1
200
泊舟
泊舟@bozhou_ai·
教你如何让AI帮你自动发送推文,不封号 第一步:打开console.x.com 第二步:点击APPS,然后Create APP,记录一下三个TOKEN,然后刷新一下 第三步:点击你的APP,然后右边OAuth 1.0 Keys,重新生成一下两个Token,记录一下 第四步:npm install -g @xdevplatform/xurl 下载官方cli 第五步:执行两个命令 xurl auth apps add my-app --client-id YOUR_CLIENT_ID --client-secret YOUR_CLIENT_SECRET xurl auth oauth1 --consumer-key KEY --consumer-secret SECRET --access-token TOKEN --token-secret SECRET 把对应的内容填充进去 第六步:发推 # 纯文字 xurl post '推文内容' # 带图片:先上传(必须加 --category tweet_image),再发 xurl media upload --media-type image/jpeg --category tweet_image photo.jpg xurl post '推文内容' --media-id MEDIA_ID 官方skills在这里 github.com/xdevplatform/x… 有免费额度,但是比较少,按量付费蛮便宜的,重点是官方不封号
泊舟 tweet media泊舟 tweet media
中文
7
6
40
5.7K
香蕉Banana
香蕉Banana@treydtw·
我的虾对此次的更新用了一句话: 版本规模:巨大 升级后问题也确实有,先是网页控制台没了,查了下说是忘记把ui打进去了。接着是刚昨天发的微信插件又用不了了,因为微信插件用了过时的方法😅 好在,有codex,直接把微信插件代码都给改了。 大家谨慎升级吧!做好备份
香蕉Banana tweet media
OpenClaw🦞@openclaw

OpenClaw 2026.3.22 🦞 🏪 ClawHub plugin marketplace 🤖 MiniMax M2.7, GPT-5.4-mini/nano + per-agent reasoning 💬 /btw side questions 🏖️ OpenShell + SSH sandboxes 🌐 Exa, Tavily, Firecrawl search This release is so big it needs its own table of contents. github.com/openclaw/openc…

中文
0
0
0
356
香蕉Banana
香蕉Banana@treydtw·
试用了一下微信推出的openclaw 插件,给我的要给感受是,微信想抓住这个非常重要的通道,但是又有点束手束脚。 很明显的几个问题: 1. 只有手机版能用,电脑版连消息入口也没有,这意味着你没法在电脑上用微信来和龙虾交流 2. 没法直接将其他聊天的消息转发到这里来。你还是得自己手动复制一遍再发过来。导致体验很差 3. 不支持获取用户微信信息、群聊,这个开放程度还是没法做到飞书一样,也能理解,毕竟14亿人都在用。 总体来说,感觉还是得再给一点时间,让他们把这个入口能力再丰富起来,现在更偏向于一个简单的对话窗口了。
香蕉Banana tweet media
中文
0
0
1
476
香蕉Banana
香蕉Banana@treydtw·
官方都在下场给Agent做工具了。 Llama给agent做了一个不用模型的文档解析工具,完全开源免费,看了下官方的测试数据,2s能处理约500页的数据,还是很猛的。 看了下评论区的测评,对比其他解析工具,Agent识别的速度、通过率都非常强。
Jerry Liu@jerryjliu0

Introducing LiteParse - the best model-free document parsing tool for AI agents 💫 ✅ It’s completely open-source and free. ✅ No GPU required, will process ~500 pages in 2 seconds on commodity hardware ✅ More accurate than PyPDF, PyMuPDF, Markdown. Also way more readable - see below for how we parse tables!! ✅ Supports 50+ file formats, from PDFs to Office docs to images ✅ Is designed to plug and play with Claude Code, OpenClaw, and any other AI agent with a one-line skills install. Supports native screenshotting capabilities. We spent years building up LlamaParse by orchestrating state-of-the-art VLMs over the most complex documents. Along the way we realized that you could get quite far on most docs through fast and cheap text parsing. Take a look at the video below. For really complex tables within PDFs, we output them in a spatial grid that’s both AI and human-interpretable. Any other free/light parser light PyPDF will destroy the representation of this table and output a sequential list. This is not a replacement for a VLM-based OCR tool (it requires 0 GPUs and doesn’t use models), but it is shocking how good it is to parse most documents. Huge shoutout to @LoganMarkewich and @itsclelia for all the work here. Come check it out: llamaindex.ai/blog/liteparse… Repo: github.com/run-llama/lite…

中文
0
0
2
397
香蕉Banana
香蕉Banana@treydtw·
@bozhou_ai 看来你被人盯上了,我就不会,压根没人看我的哈哈哈
中文
1
0
1
79
泊舟
泊舟@bozhou_ai·
我也是服了,这搬运的封面都不换
泊舟 tweet media泊舟 tweet media
中文
18
0
6
3.3K
香蕉Banana
香蕉Banana@treydtw·
@Jackywine 害怕被评价。 另外就算你是割韭菜,那比你割的人可能更多,割的更狠。 更何况你并没有割,只是因为不同的人对于割这个词有不同的定义。对于小白如果你帮助了他解决了问题,这是价值交换。
中文
0
0
1
90
Jackywine
Jackywine@Jackywine·
不好意思宣传自己的产品,害怕被人说是割韭菜这是什么原因?
中文
65
1
36
26.1K
香蕉Banana
香蕉Banana@treydtw·
今天正式开始把Notion的内容迁出,转向全面本地化 不过我没想到有38个G这么大😅
香蕉Banana tweet media
中文
0
0
0
521
JesseHHH
JesseHHH@Jessehu69677144·
@treydtw 在哪个入口获取呀 没看到
中文
1
0
0
1.6K