jfanes

331 posts

jfanes banner
jfanes

jfanes

@jfanes2

家在吴门,久作岭南旅

中国 广东 Katılım Mayıs 2021
334 Takip Edilen25 Takipçiler
jfanes
jfanes@jfanes2·
@RobinSeun 那我以前从成都东到上海虹桥15个小时的动车算什么😧
中文
1
0
0
240
RobinSeun_维京黑船
这是真消息,而且这个新闻我就不评论了,我完全搬运原文。 《中国将在长江水下开高铁!从上海一路延伸到成都,串联三大城市群,约2000公里》 “十五五”重大工程——沿江高铁的标志性项目,正在加紧施工。它将从上海一路延伸到成都,串联三大城市群,绵延约2000公里。 沿江高铁总投资超5000亿元,据测算,将带动上下游行业增加值增长近1.5万亿元。
RobinSeun_维京黑船 tweet media
中文
130
15
165
132.6K
jfanes
jfanes@jfanes2·
@AlchainHust 作为千问负责人,林俊旸的文章很有价值 肯定了当下agent的训练方式和趋势,算是给我们做agent应用的用户喂了定心丸😂 读得出来他的思考很深刻,但针对混合思考模式的描述有点干巴 花叔的解读很到位,可能很多媒体没很好理解林俊旸的意思 林俊旸的努力方向不一定不对,但是agent的环境要求确实提高了
中文
1
0
0
1.1K
jfanes
jfanes@jfanes2·
作为千问负责人,林俊旸的文章很有价值 肯定了当下agent的训练方式和趋势,算是给我们做agent应用的用户喂了定心丸😂 读得出来他的思考很深刻,但针对混合思考模式的描述有点干巴 花叔的解读很到位,可能很多媒体没很好理解林俊旸的意思 林俊旸的努力方向不一定不对,但是agent的环境要求确实提高了
花叔@AlchainHust

x.com/i/article/2037…

中文
0
0
0
74
jfanes
jfanes@jfanes2·
@rwayne 我也觉得年轻就不怕 平时也爱熬夜、跑步、做做俯卧撑 有时候通宵完还觉得大脑空空的,就出去跑😂 现在还是要爱护自己的身体才行
jfanes tweet media
中文
0
0
0
932
jfanes
jfanes@jfanes2·
@rwayne 食在广东,味在顺德😂
中文
0
0
1
462
Roland的思考日记
Roland的思考日记@rwayne·
终于知道为什么广东抑郁率全国最低了...
Roland的思考日记 tweet mediaRoland的思考日记 tweet mediaRoland的思考日记 tweet mediaRoland的思考日记 tweet media
中文
10
5
48
23.1K
Soran
Soran@Soranlan·
@jfanes2 好问题,MSA 是优化记忆容量的,也就是你说的优化延长上下文记忆,不是倒推。 它让模型从只能记住一本书变成能记住一整个图书馆, 有博主甚至说是过目不忘, 不仅仅是记住,而是之后还能准确找到需要的那一页, 至于拿这些记忆去做什么推理(包括倒推),那是上层能力的事
中文
1
0
0
52
Soran
Soran@Soranlan·
我想,你大概率刷到过这个故事 一个叫郭航江的 00 后,北邮大四,用 Claude Code 做 Vibe Coding,十天搓出一个叫 MiroFish 的东西 它能生成上千个带独立人格的 AI 智能体,让它们在一个虚拟社会里自由碰撞,然后告诉你: 接下来会发生什么 GitHub Trending 全球第一,34,500+ Star,4,600+ Fork 有人拿它推演红楼梦结局,有人用它做 Polymarket 交易机器人(338 笔交易盈利 $4,266) Brian Roemmele 在一次模拟里跑了 50 万个 Agent 陈天桥看完 Demo,24 小时拍板 3000 万 这件事的后续,大部分人没关注到 郭航江加入了 EverMind,一个专做 AI 记忆基础设施的团队 近期,这个团队放出了第二颗子弹: MSA(Memory Sparse Attention) 如果说 MiroFish 解决的是AI 能不能预测未来, MSA 解决的是一个更底层、更致命的问题: AI 能不能记住过去?
Soran tweet mediaSoran tweet media
Soran@Soranlan

伙伴们,记忆赛道又出新东西了,一个 4B 的小模型,长记忆测试 9 项基准平均分,超过了 KaLMv2 + Qwen3-235B 的顶级 RAG 流水线 参数量差 60 倍(但 5 个单项仍然落后——后面说) EverMind 刚发的 MSA 论文,走了一条跟 RAG、扩窗口、KV 压缩完全不同的路: 不压缩记忆,不外挂检索,让模型自己学会挑重点看 端到端训练,选择机制长在注意力里 更离谱的是,从 16K 训练长度外推到 1 亿 token,精度在 MS MARCO 上只掉不到 9% 大多数方案超过训练长度 8 倍就崩了 MSA 超了 6000 倍还能用

中文
1
2
7
1.4K
jfanes
jfanes@jfanes2·
@crazyox 周末快乐! 新车配美人👍
中文
1
0
1
64
Crazyox
Crazyox@crazyox·
周末快乐~!Night.
Crazyox tweet media
日本語
26
0
48
2.4K
jfanes
jfanes@jfanes2·
hi
jfanes tweet media
1
0
2
30
jfanes
jfanes@jfanes2·
@sunyuchentron minimax真的好用吗? 拿来优化工作流是啥意思
中文
0
0
0
129
jfanes
jfanes@jfanes2·
@nbblock 雪球的社区环境一流 客服也不停在拉群😂 但是我还是喜欢新浪财经一点,雪球给不了独立思考的空间
jfanes tweet media
中文
0
0
3
1.6K
CJ_Blockchain, CFA
CJ_Blockchain, CFA@nbblock·
最近高强度在雪球上学习。 雪球的信息密度和质量都比推特好太多了。 可惜币圈没有雪球这样的平台。 是因为值得聊或者研究的内容太少了吗? 从研究到拿到结果中间的不确定性也很大。 很多时候你分不清是你认知到位了,还是纯粹的运气好。
中文
32
9
191
53.3K
jfanes
jfanes@jfanes2·
@Stanleysobest 南头还有补贴青旅,比这个还便宜😂
中文
0
0
0
382
Stanley
Stanley@Stanleysobest·
深圳湾人才房,15平,租金2000元一个月,可以租3年。。。 对于刚来深圳的青年人才来说,实在是太爽了。
Stanley tweet mediaStanley tweet mediaStanley tweet media
中文
112
26
433
293.7K
jfanes
jfanes@jfanes2·
@geekbb 明天kimi又有人要单飞?😂
中文
0
0
0
1.1K
Geek
Geek@geekbb·
这不是商单吧,Kimi NB。
Geek tweet media
中文
21
2
168
49.9K