JessiWanderlust

42 posts

JessiWanderlust banner
JessiWanderlust

JessiWanderlust

@MPonkan8

Katılım Haziran 2024
23 Takip Edilen1 Takipçiler
JessiWanderlust
JessiWanderlust@MPonkan8·
@echeeeego 笨的不行,还有人吹性价比。谈论性价比的前提是能力在及格线上,2.7完全是不合格模型
中文
0
0
0
10
ichigo🍟
ichigo🍟@echeeeego·
minimax简直笨到没边,完全比不过deepseek
中文
1
0
0
27
JessiWanderlust
JessiWanderlust@MPonkan8·
@Mayhem4Markets 不会,m3模型有两个版本,即将发布的应该是500b参数左右的,另外一个1T以上参数的版本应该在六七月发布
中文
0
0
0
30
Markets & Mayhem
Markets & Mayhem@Mayhem4Markets·
Hearing MiniMax-M3 may be as large as 1T parameters.
English
7
1
17
5.1K
Jiayuan (JY) Zhang
Jiayuan (JY) Zhang@jiayuan_jy·
MiniMax M3 即将发布,想邀请一些中文开源社区的 contributor 来评测,阿岛 @SkylerMiao7 建了一个飞书群,可以第一时间体验到! 另外希望申请者有一些开源项目的贡献经验(贡献过开源项目或者有自己的开源项目),在验证信息里面注明就行。
Jiayuan (JY) Zhang tweet mediaJiayuan (JY) Zhang tweet media
中文
38
17
258
51.7K
tears lee 绿柚子
tears lee 绿柚子@tears_lee·
为啥我用Trae IDE调用mimo v2.5 pro 缓存命中这么差?问了一个问题,没解决什么实际工程问题,就消耗了我15%的额度。跟deepseek体验比起来差多了 #mimo
tears lee 绿柚子 tweet mediatears lee 绿柚子 tweet media
中文
1
0
0
56
JessiWanderlust
JessiWanderlust@MPonkan8·
minimax 要降本增效,小参数打大参数,要多模态 1m 上下文。要速度快 token 便宜,要 coding 场景不虚 opus ,要搞多 agents 蜂群,总之是什么都要,什么都不行
中文
0
0
2
49
JessiWanderlust
JessiWanderlust@MPonkan8·
@AiProxAi @_naiVe_2 你搞错了,一分钱续费不是bug。小米的续费逻辑是,未使用的积分会折算成优惠,因为重置了额度+续费有折扣,所以是0元续费+补偿积分,且小米的续费是旧套餐失效,新套餐立即生效,并非在原有基础上又加了一个月
中文
0
0
0
13
AiProx|
AiProx|@AiProxAi·
@_naiVe_2 一分钱如果只是事故,很快会过去;如果它让开发者形成新预期,后面所有模型厂商都会被迫回答一个问题:高频小任务到底该卖多便宜。
中文
1
0
0
43
夸克说
夸克说@quarktalksss·
用openrouter来赢,实在是绷不住了。但凡您知道openrouter是干嘛的,自己真的调用过api再来吹这个牛逼我都不说啥了。
夸克说 tweet media
中文
111
3
183
56.4K
yi xun
yi xun@wentumixinan·
@MikaStars39 没有万亿参数,现在真的还能跻身前列吗?虽然参数不能说明一切,但就目前来看小参数模型真没竞争优势
中文
2
0
1
345
MikaStars★
MikaStars★@MikaStars39·
Summarization (you can get all of them on the internet, not insider information): - M3 - No more M2.x, e.g., no M2.8 - MoE, 1M context - Larger than M2 (200~B model) - MSA, aka MiniMax Sparse Attention architecture - For MSA, 9.7x prefill speedup, 15.6x decoding speedup - Will be released in a few days - Will be open-sourced
elie@eliebakouch

new minimax sparse attention compared to deepseek v3.2 (DSA) and v4 (CSA) main changes: - based on GQA not MLA - block level selection like in CSA but attention is done on the real KV, not in the compressed dimension

English
36
32
450
68.3K
金尘马
金尘马@jinchenma_ai·
美国有 ChatGPT、Claude、Gemeni 中国有 豆包、千问、元宝 美国有 Codex、Claude Code 那中国对应的产品是?
中文
132
2
103
135K
Sofy ✨
Sofy ✨@SofySerene·
¿Qué le hace falta a este desayuno?
Sofy ✨ tweet media
Español
3.5K
255
3.2K
262.8K
vitor
vitor@borvior·
Qual turno de trabalho você preferiria pegar? • 5h às 13h • 7h às 15h • 9h às 17h • 15h às 23h • 22h às 6h
Português
2.4K
198
18.3K
4.3M
シネチク
シネチク@touma_skyline·
シンプルに中国語ヤバすぎる 文字として意味は拾えるのに書けないし読めない
日本語
12
0
41
3.9K
Max For AI
Max For AI@MaxForAI·
昨天见了一个非常牛逼的Agent团队,我敢说在国内绝对是T0的级别(之前DPSK还找他们搞了点Agent数据) 刚好聊到了这两天推上吵得非常热闹的AI产品(Agent)要不要用Python的话题 他们Founder说的很直接:SB才在Agent项目里用Python🤣 TS适合100%Agent项目,主要有几个原因: 第一,Agent最终大多时候会在产品里。 不管你做的是Chat界面、工作流面板、浏览器插件、Copilot,还是IDE扩展、Slack/Discord/网页工具,TS天然离这些更近。 前端是TS,后端也是TS,中间的tool schema、事件流、UI状态都能共用一套类型。 如果你用Python那就会变成: 模型服务在Py、后端在Node、前端在TS 一份schema要复制三份 如果某个字段名大小写错了,你的Agent马上就给死给你看。 第二,Agent很依赖异步和事件流。 Agent不是一次请求一次回答这么简单。 它要边想边输出,边调用工具,边等用户确认,边更新UI,边处理取消、重试、超时、恢复。 TS/Node在事件驱动、stream、WebSocket、server-sent events这些场景里很顺。 Python当然也能做,但你会更容易感受到「这东西本来不是为这类Web产品链路长出来的」。 第三,类型系统对Agent很重要。 Agent真正容易炸的地方不是「模型不会说话」,而是工具参数错、返回结构错、状态字段错、上下文对象变形。 TS可以把很多东西提前卡住: tool input/output、agent state、message format、UI事件、workflow node、permission object、external API response 这对Agent很关键,因为Agent系统里有大量JSON对象在飞来飞去。 第四,TS更适合做「Agent runtime」。 如果你做的是一个Agent框架、SDK、运行时、插件系统,TS优势更明显。 因为使用者往往要把它接进: 网页、后台服务、Electron、浏览器插件、VS Code插件、API route、serverless、edge runtime 这些地方TS生态更统一。 所以很多Agent infra选TS,不是因为Python不行,是因为它们要服务的使用场景更接近Web开发者和产品团队。 第五,AI应用现在其实是拼系统。 早期大家用Python,是因为AI=模型。 现在很多AI产品已经演化到包含LLM API、tool calling、database、vector store、browser automation、workflow、UI、billing、auth、analytics 这已经不是研究工程了,是产品工程。 互联网产品工程的主语长期就是JS/TS。 很无聊,但世界就是这么没品😮‍💨 但他也表示Python不会消失。 更合理的分工其实是: Python做模型层、数据层、eval、embedding pipeline、离线任务、实验脚本。 TS做产品层、Agent编排层、前端交互层、插件层、用户可见的runtime。 所以你如果做一个Agent产品,你最好: MVP前端+Agent orchestrator用TS。 涉及模型训练、数据处理、复杂检索、评测系统,再上Python。 聊了一下午,真的学了太多了 才知道自己之前对于Agent的认知到底有多浅薄🧎
中文
155
155
1K
273.8K
yemre
yemre@agenticn3rd·
@XiaomiMiMo how on earth does "hello" consume 9 million tokens?!?!?!?!?!?!?
yemre tweet media
English
8
0
42
8.9K
Xiaomi MiMo
Xiaomi MiMo@XiaomiMiMo·
🚀 Better inference efficiency, lower costs, broader access. MiMo-V2.5 Series API pricing is now permanently reduced — by up to 99% compared to previous pricing. ✨ Unified pricing across all context lengths. MiMo Token Plans have also been upgraded: • 5–8× more usable tokens at the same price • Simpler and more transparent billing rules 🎁 As a thank-you to current users, all current Token Plan credits will be fully reset. 🎧 MiMo-V2.5-TTS remains free for a limited time. ⏰ Effective May 26 at 6:00 PM PDT. These improvements are powered by continued inference optimization and serving efficiency upgrades across the MiMo stack. 🛠️ We’ll also publish a detailed technical blog on the inference optimizations later — stay tuned.
Xiaomi MiMo tweet mediaXiaomi MiMo tweet media
English
297
514
4.2K
1M
Yaosis
Yaosis@yaosiscom·
买个token还要实名认证 我艹尼玛... 我没骂小米
Yaosis tweet media
中文
43
0
20
32.4K
Sanjin
Sanjin@EqbymCi·
预测一手 MiniMax M3水平?最近官方开始宣发了
中文
1
0
0
582
Sanjin
Sanjin@EqbymCi·
如何在一天内用掉小米的 820 亿
Sanjin tweet media
中文
1
0
0
26
JessiWanderlust
JessiWanderlust@MPonkan8·
@shuiwenzy 感觉是为了防止一个人多账户的白嫖套餐0.01续费刷新时间
中文
0
0
0
6