记得感恩
2.4K posts

记得感恩 retweetledi

@plantegg 小米在罗福利的带领下做出了mimo大模型
实际体验效果还是很不错的
不管他们说啥
看他们能给出啥最终产品
有的人就是不善于表达
我有个同学你要是听他说话
你会觉得他特别没水平
但一点都不妨碍他牛逼
人家在美国做博士后期间在science上发文章
sci更是发了无数
目前在国内做科研,用他的说法就缺院士了
中文

我的粗浅理解:
1. 利用 PR Action 污染 node_modules 缓存
2. node_modules 缓存全局共享,被主分支 Action 拉取到
3. 恶意代码执行,从 Action Runner 内存偷 Token
维护者没有犯任何错误,但仍然被攻击了。防不胜防啊!
TANSTACK@tan_stack
Our official post mortem on the security issue earlier today: tanstack.com/blog/npm-suppl…
中文

new-api从2023年4月至今,已经有3年有余,支撑了大大小小成百上千个中转站,市面上超过90%都是用这个系统
,而new-api的核心开发者们 @Ion_Mio_ @Seefs_ 则深藏功与名,这篇文章尝试挖掘一下new-api和另一个模型路由器的核心算法。
WquGuru🦀@wquguru
中文

Damn,Redis创始人用一个C文件,干翻了大厂烧几十亿的GPU集群。
Antirez,那个写出Redis的传奇黑客,昨天开源了ds4。
一个专门为DeepSeek V4 Flash写的原生推理引擎,只有几千行C代码。
它做到了一件很多人都觉得不可能的事:
把拥有1M上下文窗口、能跑完整coding agent循环的准前沿模型,完整跑在一台普通的128GB MacBook Pro上。
YC CEO Garry Tan看完直接转发,只说了一句话:
“正在下载… 1M上下文+可用的coding agent能力,全在一台128GB MacBook上,这太疯狂了🤯”
这已经不是一个普通的量化项目那么简单了铁汁们,
属于顶级黑客用极致的系统工程,把闭源实验室烧几十亿才能玩的东西,压到了每个人的笔记本里。
他的三个黑客级操作,每一个都颠覆了行业常识:
1. 不对称2-bit量化:
只对MoE里占90%体积的专家部分做2-bit压缩,所有关键路径保持全精度。
质量损失极小,Antirez本人亲测“coding agent工作良好,能可靠调用工具”。
2. 把KV Cache扔到SSD:
很多人都觉得KV Cache必须放内存,1M上下文会直接炸掉128GB内存。
他直接把KV Cache搬到了苹果的高速SSD上,用磁盘当扩展内存,彻底突破了硬件天花板。
3. 纯Metal原生优化:
没有任何多余的封装,
没有通用框架的开销,
所有代码只为Apple Silicon写,
只为DeepSeek V4 Flash写。
实测性能:M3 Max 128GB上稳定27 tok/s。
不算快,但对本地跑agent循环来说,完全够用了。
你不用再给OpenAI付API费,不用再担心数据泄露,不用再忍受网络延迟。
所有的AI能力,完完全全在你自己的电脑里。
卧槽,这才是真正的革命,
过去AI的权力攥在少数几家大厂手里,他们有GPU集群,定价格,甚至说删就删。
现在,一个黑客用几千行C代码,就把这个权力还给了每一个开发者。
开源AI真的是不可阻挡的,
大厂烧几十亿训练出来的模型,只要权重一开源,
全世界的黑客就会用你想象不到的方式,把它优化到每一个能跑的设备上。
今天是MacBook,明天是手机,后天是手表,太让人兴奋了!
2026年5月9日,AI终于从云端的神坛,落到了每个人的笔记本里。
或许这一天,会被写进历史!
Garry Tan@garrytan
Downloading now... 1M token context window with supposedly usable coding agent capability all on a 128GB Macbook Pro is 🤯
中文

@skywind3000 Bug审阅误报很常见,Codex输出也很容易误报,真实条件下很难出现。Bug #1 是常见问题了,Claude字符集有点Bug特别是标点之类的
中文

















