David Maikal

210 posts

David Maikal

David Maikal

@davi99600

Katılım Eylül 2025
7 Takip Edilen4 Takipçiler
Phoenix Yin
Phoenix Yin@Phoenixyin13·
我真想知道,他俩谁能笑到最后。
Phoenix Yin tweet media
中文
39
4
84
22.2K
David Maikal
David Maikal@davi99600·
@TrbimixsQ @quarktalksss 讲实话,你们啥也不懂,我告诉你openrouter上用什么的最多。酒馆。不知道什么是酒馆把?这就对了,你们这群煞笔知道啥啊
中文
0
0
1
307
Trbimixs
Trbimixs@TrbimixsQ·
@quarktalksss 哪个正常人用api不用Openai/anthropic/gemini/azure/vertex/aws,用openrouter这玩意😅 当然openrouter支持加密货币支付,上面的平台不支持,知道什么人用了吧😅
中文
5
0
24
5.1K
夸克说
夸克说@quarktalksss·
用openrouter来赢,实在是绷不住了。但凡您知道openrouter是干嘛的,自己真的调用过api再来吹这个牛逼我都不说啥了。
夸克说 tweet media
中文
104
3
164
52.3K
David Maikal
David Maikal@davi99600·
@namesueface100 @quarktalksss 笑死,那赶紧台独啊,你们到现在为止还以为美伊以是美国打赢了?要是美国打赢了,就应该是中国去美国访问了
中文
1
0
0
35
Superman
Superman@namesueface100·
@quarktalksss 贏不贏,上了戰場就會清楚,活捉馬杜羅沒有打醒,美伊戰爭沒有打醒,鵝烏戰爭還是沒有打醒支那豬,我估計台海戰爭也不會醒
中文
1
0
3
840
David Maikal
David Maikal@davi99600·
@quarktalksss 弱智玩意,这个OPENROUTER使用者70%是美国用户,中国用户不到20%,你的意思是中国人去国外的平台刷TOKEN?我知道有人说都是自己的平台。怎么中国模型自己平台不用都用它?还有第三就是claude,人家有大模型自己的平台也照样用openrouter,这是一个趋势。以前这个平台上可都是国外模型。真他么煞笔
中文
8
0
2
5.4K
杰克船长宏观策略
杰克船长宏观策略@macrotradecn·
2024年12月,碧桂园以20亿元的价格把手里持有的长鑫科技1.56%股权卖给了合肥国资。按照现在2万亿的估值算,那1.56%大约值312亿😅😅😅
中文
37
12
211
100.6K
Warren
Warren@WarrenLau_·
我是真无聊啊,突发奇想,把用了快 3 年的显示器灯带改造了下。 现在已经集成到 Codex , 主要有三种效果: 1、AI 思考中,变成蓝色呼吸灯 (本来是多种颜色,但是太乱了,改成单一颜色,舒服多了) 2、需要人工审核,变成粉色灯光,提示需要审核处理。 3、完成后,变成黄色暖光,长时间不刺眼,更舒服。 以后再也不需要盯着电脑了,语音输入内容后,按回车,就可以离开电脑,愉快的玩其他的去,以后看灯光提示。
中文
126
66
845
155.6K
nini
nini@nini_incrypto_·
都学会的话claude和gpt都得直接调用你了
nini tweet media
中文
126
34
1.9K
125.6K
David Maikal
David Maikal@davi99600·
@yyyole 人家爱本地部署,那就deepseek,kimi,glm啊!你coze,trae不还是没有本地部署?这样还能再赚部署的钱有啥不好
中文
1
0
1
147
沐阳
沐阳@yyyole·
特别明显的感受!! 国字头的B端客户听到OGA这些海外AI模型及工具,就想听到丧钟一样!! 而且,他们特别偏爱本地部署。 所以,想赚国内B端大客户的钱,是不是还是得研究Coze、Trae、Dify、WorkBuddy、KimiCode这些国内AI Agent产品?
中文
67
0
12
15.5K
Bravo
Bravo@Walter10060338·
@follow_clues 中国证监会领导貌似每一任都“进去”了
中文
5
0
140
46.4K
Theclues
Theclues@follow_clues·
因为老虎和长桥在声明“硬刚”中国证监会,导致了更重的铁拳 CEO是不是海外待太久,太自信了
中文
102
8
525
435.8K
David Maikal
David Maikal@davi99600·
@yk_L2020 @0xLogicrw 所以知道了把?这些话说不定都不是她自己的话,那是谁的话呢?好难猜哦
中文
0
0
0
83
ykL
ykL@yk_L2020·
@0xLogicrw 说token太便宜的是她,现在来打价格战也是她
中文
1
0
4
636
思维怪怪
思维怪怪@0xLogicrw·
罗福莉透露,在 API 价格对齐 DeepSeek 后,小米的高负载推理引擎仍能保持盈亏平衡。成本降低主要来自混合注意力架构与层次化 KV 缓存优化。 针对缓存命中(Cache Hit)成本降低 99% 的设计目标,小米推理框架实现了针对滑动窗口注意力 SWA 的层次化 KV 缓存优化。生产测试显示,层次化优化将缓存的 token 容量提升至 5 倍,降低了 80% 的缓存成本。结合全局注意力模块之间的缓存读取重叠(Cache Read Overlap)技术,系统进一步压低了缓存命中的实际开销。 对于基础输入与输出成本削减 60% 至 80% 的原因,罗福莉归功于模型引入的 1:7 层间稀疏比,即全局注意力(GA)与滑动窗口注意力(SWA)的层数比为 1:7 。在长文本预填充(Prefill)阶段,60 层 SWA 仅计算局部滑动窗口,这使得拥有 70 层的 MiMo-V2.5-Pro 模型的整体注意力计算量,仅相当于一个 10 层的传统全局 GQA 模型。超低计算负载降低了原始推理成本,在调价前曾为小米预留了 2 至 3 倍的利润空间。因此,降价属于结构性降本的体现,而非亏本竞争。 罗福莉表示,低成本的推理服务有利于激发终端智能需求。大模型企业应当避免盲目的价格战,通过算法与推理系统的底层协同设计,将实际运行开销控制在盈亏平衡线以下。
Fuli Luo@_LuoFuli

Behind the MiMo API Price Reduction: The deepest price cut, up to 99%, is for Input (Cache Hit). The core reason is our inference framework now supports hierarchical KV cache optimization for SWA. Production inference engine tests show this optimization increases cached token capacity by 5x, equivalent to an 80% reduction in caching costs. Combined with Cache Read Overlap among multiple Full Attention modules in the Hybrid model, actual costs are further reduced. Prices for Input (Cache Miss) and Output are also reduced by 60%-80%. This mainly benefits from the extreme 1:7 Full:SWA sparsity ratio brought by the model architecture (the prefill compute of the 70-layer MiMo-V2.5-Pro roughly equals a 10-layer GQA model). This kept our original inference costs well below the industry average, naturally leaving a 2x-3x profit margin in pricing. This price adjustment simply reflects our decision to pass these structural cost efficiencies directly to developers. Operating at these newly reduced API prices, our production inference engine is running at near full capacity, and we can still essentially break even. We previously advised LLM companies not to "blindly cut prices" precisely because very few model architectures and inference optimizations can keep API costs from running at a loss. If more architectures that save compute and KV cache emerge, along with better inference Infra to drive down API costs, this will form an excellent virtuous cycle in the industry. More crucially, affordable, high-performance model APIs will drive real, sustained, and at-scale inference demand. This upstream demand pulls forward the development of the entire AI infrastructure chain—including chips, servers, optical transceivers, PCBs, liquid cooling, power, energy storage, and data centers—serving as a strategic fulcrum for a systemic revaluation of AI hardware. In the long run, this injects more affordable and accessible compute into both training and inference pipelines, accelerating the parallel evolution of global AGI across multiple regions and technical routes. For more technical details, we will release a detailed Blog post later.

中文
13
0
35
23.9K
关木
关木@ZeroZ_JQ·
x 越来越变成知乎了 timeline 上全是故事会
中文
28
0
36
7.1K
刹车皮
刹车皮@shachepi·
@Raz_09_ 目测不是国产模型就是御三家里面的Gemini才能干出这事
中文
4
0
5
6K
卫斯理
卫斯理@imwsl90·
有了 claude 后,很多东西其实是不用学习的 比如 git, 你让 claude 帮你管理 git 工程就好了 又比如 cli,你让 claude 执行 cli 就好了 还不如 ssh ,你让 claude 管理就好了 我们要把精力放在更重要的事情上
中文
38
2
49
13.3K
Tina缇娜
Tina缇娜@justTinaforu·
一百年过去了,为什么我们还在读保尔柯察金。
中文
110
0
27
8K
David Maikal
David Maikal@davi99600·
@CTracy0803 笑死了,小米我本来很不喜欢的,但是现在人家续费0.01直接送几亿的token,不禁用?你0.01还想用啥?
中文
0
0
0
49
Tracy
Tracy@CTracy0803·
国产大模型又开始炒“降价”热度了,一个接一个降价 但如果你问一圈使用感受 非常统一:虽然降价但是更不禁用了
中文
52
0
17
4.2K
David Maikal
David Maikal@davi99600·
@Wong248388979 @__Inty__ 你不如说美国在台湾丢个十个核弹,中国可能就不要了把。笑死了,这个是政权合法性,两个核弹可不够
中文
0
0
4
231
Cheng W
Cheng W@Wong248388979·
@__Inty__ 如果美國在台灣島上擺上三五顆核彈,那中國大陸收回台灣就有難度甚至是不可能了。
中文
15
0
11
5.5K
Inty News
Inty News@__Inty__·
Anduril创始人帕尔默·拉基谈中国与台海:美国和盟友不需要在产能上压过中国,只要有足够能力,让中国入侵台湾变得不可行就行。 他说,即便中国拥有比美国多100倍的弹道导弹,美国和盟友仍可能有足够能力阻止其进入台湾;一旦台湾被拿下,历史和习近平自己的说法显示,他们很快会转向冲绳、菲律宾一部分,甚至越南一部分。 拉基还提到,习近平声称自己在国家档案中看到650年前琉球群岛曾向中国送礼,并据此称其为朝贡国。这不是因为他爱逛档案馆,而是在构建一种民族叙事,用来说服中国民众从台湾开始,最终指向许多美国太平洋盟友。
中文
77
73
575
131.1K
David Maikal
David Maikal@davi99600·
@ZaynHao Codex 的客户端 UI&UX很好么?我真没觉得哈
中文
0
0
0
41
Zayn Hao
Zayn Hao@ZaynHao·
Claude Code 刚开始流行时,社区中很多 UI 已死,CLI 回来了的声音, 结果现在 Codex 的客户端 UI&UX 就是做的更好,大家就是更喜欢用, 人类终究还是视觉动物。
中文
72
4
240
49.7K
David Maikal
David Maikal@davi99600·
@Sonoficeandsnow @careforme123 我代表谁?我什么时候说我代表别人了?我认识的男的肯定比你一个只有栏13的人要多了,我不能代表你能是把?
中文
0
0
0
9
maybe🍥
maybe🍥@careforme123·
b站已经成了男权大本营了 最搞笑的是,一群十多岁的孩子,还没有谈过恋爱,一天到晚就看着那些个别女生情绪失控,发火,对外国人友好,彩礼,尖叫,开车失误的极端例子,疯狂贬低,讽刺女性 这些娃娃连爱都不懂,为何要以偏概全将另一种性别视为下贱的东西,我就不信在他们的生活中真有这么多神人女
中文
451
80
3.4K
187.3K