DataLearner

1.2K posts

DataLearner banner
DataLearner

DataLearner

@DataLearnerAI

关注数据科学 关注科技行业 关注人工智能 关注一切促进人类生活美好的新技术 业界主流大模型列表:https://t.co/H4FUDd7Gfb 国产开源大模型生态现状:https://t.co/q5KU9WhPuE

Hefei, China Katılım Mart 2023
823 Takip Edilen549 Takipçiler
Sabitlenmiş Tweet
DataLearner
DataLearner@DataLearnerAI·
要是单看gemini 3.5和前代gemini 3的价格对比,那是翻了3倍了,但是如果和sonnet 4.6对比的话,从评测结果看是有优势的,而价格方面也是低于 sonnet 4.6的。估计背后模型的规模可能是变大了不少,没准和上代Gemini 3.1 Pro差不多。不过谷歌的模型都是已发布很惊艳,用着用着就不对劲了。
DataLearner tweet mediaDataLearner tweet mediaDataLearner tweet media
中文
1
0
0
140
DataLearner
DataLearner@DataLearnerAI·
Anthropic说Opus 4.8的默认思考模式是high,效果和成本的最佳均衡。从OS-World-Verified看,比Opus 4.7的Max模式少一点tokens,比Opus 4.7 xhigh高一点tokens就能有更好的效果。但是实际体验上不知道是不是5h限额缩小的原因,做了2从信息搜索任务并生成md和接口请求,单次都是消耗5小时限额的10%!
DataLearner tweet mediaDataLearner tweet media
中文
0
0
0
147
RyanLee
RyanLee@RyanLeeMiniMax·
Recently, we took time to consolidate all of the work behind M2 and published it here: our M2 paper on arXiv It’s been just over six months since we first open-sourced M2 on December 23 last year. During that time, a number of our ideas and systems have been broadly adopted by the open-source community — including CISPO, Forge RL System, Self-Evolution. Over the past six months, we’ve felt incredible enthusiasm from the open-source community. Nearly every model release reached the #1 spot on the Hugging Face leaderboard. Now it’s time for a new chapter. We’re getting ready for M3. MSA paper is on the road. arxiv.org/abs/2605.26494
RyanLee tweet media
English
32
87
667
181.8K
DataLearner
DataLearner@DataLearnerAI·
感觉大模型语种可能真的不再是一个障碍,Claude非常奇怪的表现是即使用中文输入,思考过程和回复很多时候都是英文,甚至答案还会引用输入的中文,记得曾经Anthropic发过一个研究说大模型内部大概率是一种非人类语言思考,但是能迁移其它语种的知识。所以输出支持小语种表示这种简单能力也就够了。
DataLearner tweet media
中文
0
0
0
79
DataLearner
DataLearner@DataLearnerAI·
OpenAI的Codex工程负责人表示OpenAI的产品流量中有5%的流量来自Pi,还有5%左右来自OpenCode,也就是这些人在上述两个产品中使用ChatGPT的账户里面的GPT的额度。曾经觉得OpenAI有点落后且封闭,现在对比一下Anthropic,OpenAI反倒显得更Open一点了
Tibo@thsottiaux

A little secret. About 5% of our production traffic is on the Pi harness, about another 5% is on OpenCode. Reminder you can use your ChatGPT account in a flourishing set of other tools. We’ll continue to make Codex awesome, but you have options.

中文
0
0
0
190
DataLearner
DataLearner@DataLearnerAI·
@lewangx 这个是自己做的网页对接本地模型?
中文
1
0
0
235
DataLearner
DataLearner@DataLearnerAI·
3.5 Flash 的输出速度超过每秒 280 个 token,是 GPT-5.5 和 Opus 4.7(约 60–70 token/秒)的四倍。这个速度差距在实时交互场景和高并发 Agent 调度中具有实际价值,还是可以的,详情:datalearner.com/ai-models/pret…
中文
0
0
0
30
DataLearner
DataLearner@DataLearnerAI·
要是单看gemini 3.5和前代gemini 3的价格对比,那是翻了3倍了,但是如果和sonnet 4.6对比的话,从评测结果看是有优势的,而价格方面也是低于 sonnet 4.6的。估计背后模型的规模可能是变大了不少,没准和上代Gemini 3.1 Pro差不多。不过谷歌的模型都是已发布很惊艳,用着用着就不对劲了。
DataLearner tweet mediaDataLearner tweet mediaDataLearner tweet media
中文
1
0
0
140