Darkgt

3.4K posts

Darkgt

Darkgt

@42gt

Katılım Mayıs 2010
388 Takip Edilen184 Takipçiler
Darkgt retweetledi
阿绎 AYi
阿绎 AYi@AYi_AInotes·
喵的太魔幻了,有点 Claude 干翻 Google 的感觉😂 这个程序员老哥 Tom Turney只用7天,就把谷歌砸翻全球内存股的十亿级算法,干成了比官方承诺还快的开源实现, 谷歌只发了颠覆性的KV缓存压缩论文,半行代码都没放出来, Tom Turney啃完论文里的数学公式,打开终端靠着Claude辅助, 7天就走完了大厂几个月的路, 前三天写完核心算法, 搭好141个测试用例, 跑通Python原型, 中间两天直接移植到llama.cpp, 写完Metal GPU内核, 最后两天疯狂优化, 把推理速度从739 tok/s干到了2747 tok/s, 纯工程优化就实现了3.7倍的提速, 他还在谷歌的方案上, 加了三项自己的研究创新, 长上下文跳过90%的value解压, 非对称K/V压缩保留key精度狠压value,老token自动降低精度, 最终成果是35B大模型,在普通MacBook上就能流畅跑,KV缓存直接压缩4.6倍,开源仓库上线一周就拿到613个星标,而谷歌到现在, 都没放出自己的官方代码, 说实话,这才是2026年最真实的写照,一个普通人加AI,就能把大厂攥在手里的核心技术,直接干成人人能用的开源工具,真的牛逼🤙 github 地址评论区自取👇
阿绎 AYi tweet media
BuBBliK@k1rallik

Solo dev reverse-engineered Google's billion-dollar algorithm in 7 days Google published the paper that crashed memory stocks worldwide. Then shipped zero code. Tom Turney read the math, opened his terminal, and built the whole thing with Claude - then made it faster than Google promised. Day 1-3: Core algorithms, 141 tests, Python prototype Day 3-5: C port into llama.cpp, Metal GPU kernels Day 5-7: Speed optimization from 739 to 2747 tok/s That's a 3.7x speedup through pure engineering: > fp32 → fp16 WHT > half4 vectorized butterfly ops > graph-side rotation > block-32 storage layout Then he added his own research on top: > Sparse V: skip 90% of value decompressions at long context > Asymmetric K/V: keep keys precise, compress values harder > Temporal decay: old tokens get lower precision automatically Result: 35B model running on a MacBook with 4.6x compressed cache. 613 GitHub stars in a week. Google still hasn't released their own code.

中文
91
455
2.5K
516.1K
Darkgt retweetledi
Jianyang Gao
Jianyang Gao@gaoj0017·
The TurboQuant paper (ICLR 2026) contains serious issues in how it describes RaBitQ, including incorrect technical claims and misleading theory/experiment comparisons. We flagged these issues to the authors before submission. They acknowledged them, but chose not to fix them. The paper was later accepted and widely promoted by Google, reaching tens of millions of views. We’re speaking up now because once a misleading narrative spreads, it becomes much harder to correct. We’ve written a public comment on openreview (openreview.net/forum?id=tO3AS…). We would greatly appreciate your attention and help in sharing it.
Google Research@GoogleResearch

Introducing TurboQuant: Our new compression algorithm that reduces LLM key-value cache memory by at least 6x and delivers up to 8x speedup, all with zero accuracy loss, redefining AI efficiency. Read the blog to learn how it achieves these results: goo.gle/4bsq2qI

English
98
977
6.5K
1M
Darkgt
Darkgt@42gt·
包里有五张身份证 :/
中文
0
0
0
43
Darkgt
Darkgt@42gt·
@dytsing 中年程序员的日常:老夫又行了
中文
1
0
0
25
杨靖
杨靖@dytsing·
Claude 真的好强。让他帮我 vibe code 一个 Chrome 插件,它一次成型。更强的是,接下来我连着提了十几个需求,改东改西。每次它都能完美完成,一遍成功,没有废话。太完美了!第一次体验到 vibe coding 的上瘾感。
中文
2
0
1
110
Darkgt
Darkgt@42gt·
让人反思否定批判自己所处的环境不是件容易的事 心理上一个人很难客观接受自己的选择是不妥的 认知上多数人只能意识到问题,少数能看透本质,能够修正的人凤毛麟角或者不存在
中文
0
0
1
55
Darkgt
Darkgt@42gt·
人既无法赚到认知以外的钱,也无法build认知以外的product
中文
0
0
1
42
Darkgt
Darkgt@42gt·
又被Etihad免费升舱
Darkgt tweet media
中文
0
0
0
34
Darkgt
Darkgt@42gt·
反向跑毒的我又回来了 就在起飞之后几小时,三哥飞机降落同一机场轮子没了😢
中文
1
0
1
128
Darkgt
Darkgt@42gt·
上飞机后,当天第二次收到导弹警报,机场地面人员开始找掩体往回跑 经历了一次临时疏散,从飞机上撤回航站楼。可以看得出机场工作人员应对此类事件已经很有经验了
中文
1
0
0
139
Darkgt
Darkgt@42gt·
跑毒当天,一个印巴小哥拉我去机场,路上开始响警报,然后小哥指给我看拦截弹发射。拦截爆炸几乎是在头顶上方,AD police立刻封路。心想这要错过航班 小哥人也太好了,开到旁边并一直帮我看什么时候解封
中文
0
0
0
126
Darkgt
Darkgt@42gt·
不知道“有丰富的和印度人argue经验”怎么能体现到简历里
中文
0
0
3
59
Darkgt
Darkgt@42gt·
Too many unfortunately
Darkgt tweet media
English
0
0
0
79
Darkgt
Darkgt@42gt·
同事群里人均3本护照真的是活在不同的世界
日本語
1
0
1
69
Darkgt
Darkgt@42gt·
还好换了护照 阿联酋几十万中国人不知道要撤到哪年
中文
1
0
1
66
Darkgt
Darkgt@42gt·
撤侨了 但我没选择走
中文
2
0
4
123
Darkgt
Darkgt@42gt·
有几个朋友表示,每天晚上不收到几个导弹袭击警报🚨,觉都睡不踏实…
中文
1
0
1
74
Darkgt
Darkgt@42gt·
从阿布扎比跑到迪拜瑟瑟发抖
中文
2
0
0
161
Darkgt
Darkgt@42gt·
@luzhenpeng 很正常,我们的教育体系力从来也没有批判性思维和独立思考的概念
中文
0
0
0
35
Darkgt
Darkgt@42gt·
in university or at university 真的重要吗?在国外这么多年这种介词基本想到哪个用哪个,外国人日常也经常说有语病的话 好想回高中和我英语老师好好掰扯一下这个事…
中文
2
0
0
149