David Maikal

210 posts

David Maikal

@davi99600

Katılım Eylül 2025

7 Takip Edilen4 Takipçiler

David Maikal@davi99600·13h

@Phoenixyin13 claude估值低了，现在号称8000亿了

中文

Phoenix Yin@Phoenixyin13·1d

我真想知道，他俩谁能笑到最后。

中文

22.2K

David Maikal@davi99600·13h

@LemonTreeandSea 是的，教出你这么个煞笔

中文

派大星派小萌～🇮🇪@LemonTreeandSea·13h

中国的教育质量是不是全世界最差的？

中文

225

138

37K

David Maikal@davi99600·13h

@TrbimixsQ @quarktalksss 讲实话，你们啥也不懂，我告诉你openrouter上用什么的最多。酒馆。不知道什么是酒馆把？这就对了，你们这群煞笔知道啥啊

中文

307

Trbimixs@TrbimixsQ·14h

@quarktalksss 哪个正常人用api不用Openai/anthropic/gemini/azure/vertex/aws，用openrouter这玩意😅 当然openrouter支持加密货币支付，上面的平台不支持，知道什么人用了吧😅

中文

5.1K

夸克说@quarktalksss·14h

用openrouter来赢，实在是绷不住了。但凡您知道openrouter是干嘛的，自己真的调用过api再来吹这个牛逼我都不说啥了。

中文

104

164

52.3K

David Maikal@davi99600·13h

@namesueface100 @quarktalksss 笑死，那赶紧台独啊，你们到现在为止还以为美伊以是美国打赢了？要是美国打赢了，就应该是中国去美国访问了

中文

Superman@namesueface100·13h

@quarktalksss 贏不贏，上了戰場就會清楚，活捉馬杜羅沒有打醒，美伊戰爭沒有打醒，鵝烏戰爭還是沒有打醒支那豬，我估計台海戰爭也不會醒

中文

840

David Maikal@davi99600·13h

@quarktalksss 弱智玩意，这个OPENROUTER使用者70%是美国用户，中国用户不到20%，你的意思是中国人去国外的平台刷TOKEN？我知道有人说都是自己的平台。怎么中国模型自己平台不用都用它？还有第三就是claude，人家有大模型自己的平台也照样用openrouter，这是一个趋势。以前这个平台上可都是国外模型。真他么煞笔

中文

5.4K

David Maikal@davi99600·13h

@SimonZhaoAI @shachepi @Raz_09_ 我知道啊，但是大部分还是claude

中文

299

SimonZhao@SimonZhaoAI·14h

@davi99600 @shachepi @Raz_09_ claude界面不一定用的claude模型

日本語

347

锅盖盖盖🏳️‍🌈@Raz_09_·21h

这是我被大模型坑得最惨的一次。

中文

186

70K

David Maikal@davi99600·14h

@00002_eth @macrotradecn 留不住啊，当时没钱，也借不到

中文

0002 🔶BNB@00002_eth·1d

@macrotradecn 果然这种房地产的脑子都不太好使

中文

3.8K

杰克船长宏观策略@macrotradecn·1d

2024年12月，碧桂园以20亿元的价格把手里持有的长鑫科技1.56%股权卖给了合肥国资。按照现在2万亿的估值算，那1.56%大约值312亿😅😅😅

中文

211

100.6K

David Maikal@davi99600·14h

@WarrenLau_ 挺好玩的，支持开源

中文

Warren@WarrenLau_·1d

我是真无聊啊，突发奇想，把用了快 3 年的显示器灯带改造了下。现在已经集成到 Codex , 主要有三种效果： 1、AI 思考中，变成蓝色呼吸灯 (本来是多种颜色，但是太乱了，改成单一颜色，舒服多了) 2、需要人工审核，变成粉色灯光，提示需要审核处理。 3、完成后，变成黄色暖光，长时间不刺眼，更舒服。以后再也不需要盯着电脑了，语音输入内容后，按回车，就可以离开电脑，愉快的玩其他的去，以后看灯光提示。

中文

126

845

155.6K

David Maikal@davi99600·15h

@shirumesu @nini_incrypto_ 那就是写github的liuns了

中文

希露梅斯@shirumesu·1d

@nini_incrypto_ 现在我很好奇剩下那0.001%是什么恐怖的存在

中文

4.1K

nini@nini_incrypto_·1d

都学会的话claude和gpt都得直接调用你了

中文

126

1.9K

125.6K

David Maikal@davi99600·15h

@yyyole 人家爱本地部署，那就deepseek,kimi,glm啊！你coze，trae不还是没有本地部署？这样还能再赚部署的钱有啥不好

中文

147

沐阳@yyyole·1d

特别明显的感受！！国字头的B端客户听到OGA这些海外AI模型及工具，就想听到丧钟一样！！而且，他们特别偏爱本地部署。所以，想赚国内B端大客户的钱，是不是还是得研究Coze、Trae、Dify、WorkBuddy、KimiCode这些国内AI Agent产品？

中文

15.5K

David Maikal@davi99600·15h

@Walter10060338 @follow_clues 他进去不妨碍不听证监会的话要挨铁拳啊

中文

2.9K

Bravo@Walter10060338·15h

@follow_clues 中国证监会领导貌似每一任都“进去”了

中文

140

46.4K

Theclues@follow_clues·21h

因为老虎和长桥在声明“硬刚”中国证监会，导致了更重的铁拳 CEO是不是海外待太久，太自信了

中文

102

525

435.8K

David Maikal@davi99600·15h

@yk_L2020 @0xLogicrw 所以知道了把？这些话说不定都不是她自己的话，那是谁的话呢？好难猜哦

中文

ykL@yk_L2020·15h

@0xLogicrw 说token太便宜的是她，现在来打价格战也是她

中文

636

思维怪怪@0xLogicrw·1d

罗福莉透露，在 API 价格对齐 DeepSeek 后，小米的高负载推理引擎仍能保持盈亏平衡。成本降低主要来自混合注意力架构与层次化 KV 缓存优化。针对缓存命中（Cache Hit）成本降低 99% 的设计目标，小米推理框架实现了针对滑动窗口注意力 SWA 的层次化 KV 缓存优化。生产测试显示，层次化优化将缓存的 token 容量提升至 5 倍，降低了 80% 的缓存成本。结合全局注意力模块之间的缓存读取重叠（Cache Read Overlap）技术，系统进一步压低了缓存命中的实际开销。对于基础输入与输出成本削减 60% 至 80% 的原因，罗福莉归功于模型引入的 1:7 层间稀疏比，即全局注意力（GA）与滑动窗口注意力（SWA）的层数比为 1:7 。在长文本预填充（Prefill）阶段，60 层 SWA 仅计算局部滑动窗口，这使得拥有 70 层的 MiMo-V2.5-Pro 模型的整体注意力计算量，仅相当于一个 10 层的传统全局 GQA 模型。超低计算负载降低了原始推理成本，在调价前曾为小米预留了 2 至 3 倍的利润空间。因此，降价属于结构性降本的体现，而非亏本竞争。罗福莉表示，低成本的推理服务有利于激发终端智能需求。大模型企业应当避免盲目的价格战，通过算法与推理系统的底层协同设计，将实际运行开销控制在盈亏平衡线以下。

Fuli Luo@_LuoFuli

Behind the MiMo API Price Reduction: The deepest price cut, up to 99%, is for Input (Cache Hit). The core reason is our inference framework now supports hierarchical KV cache optimization for SWA. Production inference engine tests show this optimization increases cached token capacity by 5x, equivalent to an 80% reduction in caching costs. Combined with Cache Read Overlap among multiple Full Attention modules in the Hybrid model, actual costs are further reduced. Prices for Input (Cache Miss) and Output are also reduced by 60%-80%. This mainly benefits from the extreme 1:7 Full:SWA sparsity ratio brought by the model architecture (the prefill compute of the 70-layer MiMo-V2.5-Pro roughly equals a 10-layer GQA model). This kept our original inference costs well below the industry average, naturally leaving a 2x-3x profit margin in pricing. This price adjustment simply reflects our decision to pass these structural cost efficiencies directly to developers. Operating at these newly reduced API prices, our production inference engine is running at near full capacity, and we can still essentially break even. We previously advised LLM companies not to "blindly cut prices" precisely because very few model architectures and inference optimizations can keep API costs from running at a loss. If more architectures that save compute and KV cache emerge, along with better inference Infra to drive down API costs, this will form an excellent virtuous cycle in the industry. More crucially, affordable, high-performance model APIs will drive real, sustained, and at-scale inference demand. This upstream demand pulls forward the development of the entire AI infrastructure chain—including chips, servers, optical transceivers, PCBs, liquid cooling, power, energy storage, and data centers—serving as a strategic fulcrum for a systemic revaluation of AI hardware. In the long run, this injects more affordable and accessible compute into both training and inference pipelines, accelerating the parallel evolution of global AGI across multiple regions and technical routes. For more technical details, we will release a detailed Blog post later.

中文

23.9K

David Maikal@davi99600·15h

@ZeroZ_JQ 还不如知乎

中文

关木@ZeroZ_JQ·1d

x 越来越变成知乎了 timeline 上全是故事会

中文

7.1K

David Maikal@davi99600·15h

@shachepi @Raz_09_ 明显是claude code的界面，你不会以为claude就不会删库吧

中文

1.4K

刹车皮@shachepi·16h

@Raz_09_ 目测不是国产模型就是御三家里面的Gemini才能干出这事

中文

David Maikal@davi99600·15h

@imwsl90 更重要的事？啥事，再X上吹牛么

日本語

卫斯理@imwsl90·1d

有了 claude 后，很多东西其实是不用学习的比如 git, 你让 claude 帮你管理 git 工程就好了又比如 cli，你让 claude 执行 cli 就好了还不如 ssh ，你让 claude 管理就好了我们要把精力放在更重要的事情上

中文

13.3K

David Maikal@davi99600·15h

@justTinaforu 你还要看啥是币呀呢，经典的东西就是经典啊。

中文

Tina缇娜@justTinaforu·1d

一百年过去了，为什么我们还在读保尔柯察金。

中文

110

David Maikal@davi99600·15h

@CTracy0803 笑死了，小米我本来很不喜欢的，但是现在人家续费0.01直接送几亿的token，不禁用？你0.01还想用啥？

中文

Tracy@CTracy0803·1d

国产大模型又开始炒“降价”热度了，一个接一个降价但如果你问一圈使用感受非常统一：虽然降价但是更不禁用了

中文

4.2K

David Maikal@davi99600·15h

@Wong248388979 @__Inty__ 你不如说美国在台湾丢个十个核弹，中国可能就不要了把。笑死了，这个是政权合法性，两个核弹可不够

中文

231

Cheng W@Wong248388979·1d

@__Inty__ 如果美國在台灣島上擺上三五顆核彈，那中國大陸收回台灣就有難度甚至是不可能了。

中文

5.5K

Inty News@__Inty__·1d

Anduril创始人帕尔默·拉基谈中国与台海：美国和盟友不需要在产能上压过中国，只要有足够能力，让中国入侵台湾变得不可行就行。他说，即便中国拥有比美国多100倍的弹道导弹，美国和盟友仍可能有足够能力阻止其进入台湾；一旦台湾被拿下，历史和习近平自己的说法显示，他们很快会转向冲绳、菲律宾一部分，甚至越南一部分。拉基还提到，习近平声称自己在国家档案中看到650年前琉球群岛曾向中国送礼，并据此称其为朝贡国。这不是因为他爱逛档案馆，而是在构建一种民族叙事，用来说服中国民众从台湾开始，最终指向许多美国太平洋盟友。