Ehco

2.6K posts

Ehco

Ehco

@Ehco1996

是 ehco 不是 echo 是 typo

home Katılım Ocak 2017
759 Takip Edilen11K Takipçiler
Ehco
Ehco@Ehco1996·
@lcayu 熬吧兄弟, 我这里是娃一岁半之后才明显好起来
中文
0
0
3
670
Lanpice
Lanpice@lcayu·
哎,好累…… 无论做什么,做到什么程度,都会被挑剔,莫名其妙被骂。 我妈今天也崩溃了,说从进这个门开始就小心翼翼,生怕哪里让儿媳不满意了。 触景生情,还跟我说了一些从来没跟我讲过的关于我爸的事情。觉得我很可怜,跟她生我的时候很像,丈夫撒手不管育儿,只管自己,还满是指责。只不过我这角色反过来了。 除了喂奶外,育儿及家务基本都是我和我妈包了。晚上也是两个人两班倒,每天都是睡眠不足的状态。 有时候两个人忙得飞起,突然就被床上起来,心情不好的老婆一顿指责。 原因总是那些:担心这担心那,虽然没干什么活,但是自己心里却一直操心着。有时候觉得她自己仿佛不被关心一样。不是不关心,是当一个嗷嗷大哭的婴儿跟一个在休息的产后妈妈之间,当然会更关心生活不能自理的婴儿些啊。 然后还不能讲理啊, 只要把坐月子、产后抑郁等那套搬出来,那就是真理。 一切都仿佛是我们应该做的,永远达不到满分。只有被指责哪里做得不好的。 虽然她之前说,如果换位思考,她做得不会比我更好。 但即使实际情况并不允许,必须有优先的情况下也不例外。我需要在同一时刻成为一个完美的丈夫、完美的父亲、顺便作为儿子还要考虑我妈的感受。 那种自己所有的付出都被无视,只有那些做得不够完美的地方被数落着的心情,在孩子哇哇大哭等着吃奶那一刻,我终于也是绷不住了,坐在地上也嚎啕大哭了起来……
中文
25
0
36
7.3K
小林酱
小林酱@yeppppp24·
@1greencat 确实,再也不用为了学区房拼搏一生
中文
1
0
2
172
小林酱
小林酱@yeppppp24·
发现杭州落户给好多钱啊,吗的真伤心,落户在上海一分钱都不给还要填一大堆表格还要申述项目对公司的影响,伤心
中文
46
0
141
37.4K
Ehco
Ehco@Ehco1996·
周末尝试一边带娃,一边用 deepseek v4 + claude 写了写代码 差距是肉眼可见的,用的是我平时上班用的 skill + context,所以几乎可以确定就是模型能力的差距
Ehco tweet media
中文
29
3
73
31.2K
cosine
cosine@_cosine_x·
这下真的在惠州万达广场附近租 2k 一月带车位的大豪斯了🥺
cosine tweet mediacosine tweet media
中文
19
1
201
43K
Ehco
Ehco@Ehco1996·
@ziyume_fufu db这种东西生产环境还是推荐买rds
中文
1
0
0
941
云fufu
云fufu@ziyume_fufu·
有没有人用过靠谱点的 pgsql 集群方案,2 台设备,要求是其中一个挂了,另一个能顶上来用(部署平台是 Windows Server......
中文
9
0
10
6.3K
Ehco
Ehco@Ehco1996·
懂了 这就去
Ehco tweet media
中文
0
0
3
784
Ehco
Ehco@Ehco1996·
拉响红色警报了😓 早上写工作计划的时候才发现 居然已经520了,赶紧找补一下 晚上带小辣椒去吃顿好的
中文
1
0
20
2.1K
Ehco retweetledi
Wey Gu 古思为
Wey Gu 古思为@wey_gu·
论文推荐 这个工作和 Nowledge Mem 的观点和设计不谋而合了。 也是 @NowledgeMem 的一个重要的 differentiator 我在之前 build03 和 KCD vllm Meetup 的分享中给出过,我们不可能只通过 Memory Unit 就能得到长期可维护的有效上下文,各种情况都导向一个结论:我们需要保持原始的上下文。 consolidate、evolve 甚至上下文 retrieval 环节都提供按需要回溯原始上下文的能力,才可能在需要 grounding 的时候给出需要的支撑。
Wey Gu 古思为 tweet media
Phoenix Yin@Phoenixyin13

这应该是今天我最重要的信息转发。 我们可能做错了 AI Agent 的长期记忆系统。 最近 arXiv 上的新论文《Useful Memories Become Faulty When Continuously Updated by LLMs》揭露了一个极其残酷的现实: 你让 Agent 越努力去复盘和总结经验,它反而变得越蠢。 现在业界流行让 Agent 在运行中做 Memory Consolidation,把原始日志抽象成通用规则存起来。但实验表明,随着流式更新的深入,LLM 在反复重写记忆时,会不可避免地引入信息失真和错误累积。 最夸张的案例:在 ARC-AGI 任务里,原本没有记忆时模型能 100% 完美解决;但只要让它基于自己完全正确的历史轨迹去连续增量总结,准确率竟然暴跌到 54%!模型在自我反思的过程中,硬生生把自己给绕晕了。 看完论文我的几点工程思考: 1.原始情节记忆(Raw Episodic Memory)被严重低估了。 很多时候,直接把原始交互 Trace 作为 Few-shot 塞给 Prompt,效果完胜那些经过模型精简、看似高大上的规则库。 2.拒绝盲目实时更新。 鲁棒的 Agent 架构应该把原始情节视为第一手铁证,引入显式的门控机制,只有在非必要不整合。 3.异质任务必须隔离。 绝对不要把不同任务的经验混在一个批次里让 LLM 做增量总结,异质数据会加速记忆崩溃。 这篇论文的作者之中,来自@Tsinghua_Uni 交叉信息研究院的Zhengkun Wu是我最好的朋友之一,目前他在UIUC进行春研。我们相识已久,他是个很聪明并且创新性想法很多的人,在我的朋友里,他独特且有个人魅力。和他交流进步,我感到十分荣幸且开心。 祝愿他的科研、学习之路顺利!

中文
3
4
49
9.4K
Ehco
Ehco@Ehco1996·
@yetone dream !!!
English
0
0
0
627
yetone
yetone@yetone·
哈哈,不得不再分享一个我们的 Yansu App 的 aha moment! 事情是这样的,上周我在给 Yansu 的 Memory 系统开发 Dream 功能:就是每天定时清理过期的、重复的、低质量的记忆,保证 Memory 系统里的记忆都是最新鲜和最高质量的。 结果到了周末我猛然发现 Yansu 通过它时刻记录的我的 activities 自动创建了一个叫做 daily-memory-cleanup 的 Automation,这个 Automation 的任务就是每天定时清理过期的记忆,而且已经成功跑了好几天了,重点的是它每次跑完都的确成功清理了过期的记忆,在某些体验上,甚至比我实现的那个 Dream 功能还好,因为它还会报告清理这些记忆的原因是什么。也就是说 Yansu 基于它记录的我的 activities 它自己完全自动地实现了一个可以正常工作的 mini 版本的 Dream 功能! 这也是为什么 Yansu 的 Slogan 是:「Other AIs waits, Yansu ships. 」我们就是要做一个 proactive 的 Agent,我们在一定程度上已经真正实现了我们的愿景。
yetone tweet mediayetone tweet mediayetone tweet media
yetone@yetone

说起我们的 Yansu App 的真实案例,不得不提 Yansu 的 Hand-off 功能,最近发生了两个特别好玩的事情: 首先,我们的 CEO Bo @bozhao 最近在准备旅行,Yansu 看到这个信息之后,主动向 Bo 发出了一个 Hand-off 的消息提醒,说想要帮他去调研目的地的 Airbnb 房源。Bo 点击确认后,它果然给出了一个质量特别高的房源推荐列表。 Bo 是个英文用户,但最后 Yansu 是用中文总结的。Bo 问它:「你为什么用中文总结?」最后发现是因为在它做 Hand-off 之前,Bo 刚跟我们开了一个全中文的会议,所以它就延用了中文进行总结。 这件事情还没完。在这之后 Bo 刷推看到了我现在引用的这条推文,他就想把上面这个案例给分享出来,有意思的是,Yansu 紧接着就发起了一个新的 Hand-off,问道:「是否需要我把 Yansu 的这个案例推文帮你写出来?」,Bo 点击 ok 后,Yansu 一气呵成写出了推文。 这两件事情真的震惊了我们。

中文
8
9
143
32.4K
Ehco
Ehco@Ehco1996·
推上 codex 的声量突然大了起来,一方面效果确实好起来了,但更大的原因可能还是价格战🤔 听说追上来是靠给 codex 成立了专门的部门,也就是 reorg 经历过 reorg 的人应该都能懂对员工来说是种什么体验,尤其是对于 ic,某天早上起床本来在好好的 review 代码,突然发现老板没了😄
中文
2
0
69
14.7K
SilentDepth
SilentDepth@SilentDepthCN·
@Ehco1996 不要无脑轮询。把需要做的事情分成两组,分组依据任意,可以是新旧、长短、缓急、轻重,然后在更重要的一组里选 2-3 件事集中处理,并穿插进另一组的事情。核心在于强迫自己把「负载」分组,主动卸下一部分,让大脑能更有效地处理另一部分。客观事物不以你的期望而转移,有舍才有得。
中文
2
0
9
307
Ehco
Ehco@Ehco1996·
我最近似乎陷入了并发越高并发越低的悖论 有太多事情在零散着并发推进,我没有什么好办法,只能轮询你一个一个来,虽然每一个都在缓慢地往前推进,但总没有一件事能 close,负载就会感觉越来越高。
中文
16
11
100
9.6K
Ehco
Ehco@Ehco1996·
@NekoStranding 复杂不是好处,也不是神奇的地方,但正确性是
中文
1
0
2
69
Ehco
Ehco@Ehco1996·
我现在感觉agent 基于file based 的memory 系统还是太脆弱了 应该有个db based的,这样天然就分布式加可扩展,但是这个事情可能要做到预/后训练里才会有比较好等效果🤔 现在有个折中的办法是基于 db/s3 实现 fake fs ,但还是不够干净
yetone@yetone

最终还是为我的 Remote Agents 写了个 distribution file system 来同步 Memory, Notes, Skills。 现在我的 k8s pod based Agent Remote Computer 的冷启动速度也变得很快了,虽然这所有都是我用力拽着 Harness 实现的,但是之前这么多年的相关经验的积累还是派上了用场。 所以我不知道以后没有技术背景的人能否去做类似的这种架构有些许复杂度且第一天就要保证 Scaling 优先的工程化项目。

中文
20
6
95
38.5K
Ehco
Ehco@Ehco1996·
@Chinese_XU 对 是不是 db 不关键,重点是怎么正确的存取数据的 但是实话说,db 就是用来正确的存取数据的
中文
1
0
2
98
君子中庸
君子中庸@Chinese_XU·
@Ehco1996 关于记忆我研究过 2024年就推出过时间复杂度 O(1) 的上下文技术原型 其实 file or db base 不是问题。要知道 db 最终也是文件系统,核心差异是索引结构。因此有良好索引的文件系统能力大差不差 核心问题是要记什么?用什么格式记? 目前100%都是大力出奇迹模式 自然语言为格式记录的记忆 都不行
中文
2
0
3
184
Ehco
Ehco@Ehco1996·
#胡思乱想 模型只有短 context,加上外挂在 fs/db 上的长 context,各种外挂的 memory 系统可能还是一种 workaround? 类比到人脑的记忆是认知本身,长期看我感觉模型应该自己演化出内化的认知结构,但这个结构一定是结构化的而不是基于文本 但 idea is cheap,怎么搞数据,怎么做实验才是关键😂
Ehco@Ehco1996

我现在感觉agent 基于file based 的memory 系统还是太脆弱了 应该有个db based的,这样天然就分布式加可扩展,但是这个事情可能要做到预/后训练里才会有比较好等效果🤔 现在有个折中的办法是基于 db/s3 实现 fake fs ,但还是不够干净

中文
3
1
13
2.8K
Ehco
Ehco@Ehco1996·
@iml1s 是数据 没有大量的预训练的数据
中文
0
0
1
134
ImL1s
ImL1s@iml1s·
@Ehco1996 你認為 DB-based memory 系統最大的實作挑戰是什麼?是查詢延遲、狀態同步,還是與現有 agent 框架的整合成本?
中文
1
0
2
224
Ehco
Ehco@Ehco1996·
@yetone 我猜是因为模型在训练的时候 环境本身 是一个非常重要决定性因素,然后现在大量的数据集和训练都是 bash 环境➕cli 交互
中文
0
0
1
1.2K
yetone
yetone@yetone·
殊不知我昨天写的那个 distribution filesystem 背后就是 PostgreSQL。拼命实现成一个 filesystem 就是为了方便 LLM 啊。如果大家做过 Coding Agent 开发的话,就知道 LLM 多么喜欢用 Bash,按照我的经验,LLM 喜欢用 Bash 操作文件的意愿比用其他 tool 的意愿大几十倍不止。 我至今忘不了我还在迭代 Avante.nvim 的时候,Claude Sonnet 3.7 出来的那一刻。收到了大量用户的吐槽,说我明明用了 Plan 模式,为什么还在改我的代码呢? 后面发现这个模型,即使你去掉所有的 file tool 只给它一个 Bash tool,然后强烈地在 system prompt 强调只能读文件,不能改文件,最后他还是疯狂地使用 Bash tool 调用 cat + HereDoc 去修改文件。感觉调用 bash tool 操作文件就是 LLM 的膝跳反射。
yetone@yetone

DB base 和 file base,在 harness memory 系统中不是冲突的。只是 firstly 和 secondly 的区别。一切都是为了照顾 LLM 的喜好。至少在 2026 年,LLM 还仍然是个 Bash 爱好者。 这也是为什么大多数当代 Harness 都是多层记忆,我们的 Harness Memory 也是多层的,有基于 embedding db 的记忆,也有基于 file system 记忆。

中文
27
9
219
51.7K
Ehco
Ehco@Ehco1996·
@Nekostve 这些能力我认为最后都会被模型内化,如果模型真的是某种 智能体 的话 当然现在这个阶段工程比较重要,尤其是最佳实践和范式还没杀出来的情况下,谁能先想明白这个事情,谁就开始冲下一波浪了
中文
0
0
1
153