Omen

120 posts

Omen

Omen

@AtmoOmen

中华人民共和国 Katılım Mart 2020
339 Takip Edilen0 Takipçiler
Omen
Omen@AtmoOmen·
@teortaxesTex 所以我还是非常期待 4.1 或者 4.2 的后训练版本的,4 在明显缺乏后训练的前提下还能做到如今的表现真的让人很欣喜与激动
中文
0
0
0
148
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Many are saying V4 (speaking purely of Pro) is strange. It is often unreliable (hallucinates, falls apart) and often rock solid. At its best, it's way more "Frontier" than other 1T class Chinese open models. And yes, *good* at debugging. It's like something not fully merged.
Michael Anti@mranti

因为小米的API赠送,我尝试着用mimo-v2.5-pro接Claude Code了几天,体验总结是:能干基本的活和编程,但要debug的时候,就不如Deepseek V4 pro了(我现在把这个模型当成了benchmark)。所以,我还是切换回Deepseek了。

English
14
1
125
12.5K
Omen
Omen@AtmoOmen·
@Elaina43114880 grok 几乎只剩一个搜索能力值得说道了,其他都是全方位落后
中文
0
0
0
27
Elaina
Elaina@Elaina43114880·
Some people may say that Grok 4.3 is “only” a 500B model, and that its performance is already very impressive for that size. First of all, Grok 4.x is not open-source, and xAI has not open-sourced a flagship model for a long time. For users, a closed model, whether it is 50B or 5000B, is ultimately just an API endpoint. Second, Kimi K2.6 uses a native INT4 quantization method. This means that even with 1.1T parameters, the total size of all its weight files is still under 600GB. In other words, Grok 4.3 would need to use a native INT8 quantization scheme and keep its total weight size in the 500GB+ range to be comparable to Kimi K2.6. Otherwise, if it uses a traditional BF16 format, its total weight size would be nearly twice that of K2.6. Where Grok 4.3 is better than Kimi K2.6 is its tighter integration with the X/Twitter ecosystem, which allows it to access more timely information, as well as its more favorable API output price ($2.5 < $4.0) and larger context window (1M > 256K). So simply emphasizing that Grok 4.x is a 500B model is basically meaningless.
Lisan al Gaib@scaling01

Grok-4.3 still behind chinese open-source

English
28
6
244
30.9K
Chris McGuire
Chris McGuire@ChrisRMcGuire·
After China's cancellation of Meta's purchase of Manus, why would any founder start an AI company in China if they had a choice? In China you have access to less compute, less capital, and salaries are lower than in the West. And if you are so successful that a non-Chinese firm tries to acquire you for billions of dollars, the Chinese government will lure you back to Beijing, ban you from leaving the country, and take your profits by canceling the acquisition. Manus did everything right. They even moved their entire business to Singapore to comply with U.S. outbound investment restrictions. Their only mistake was that they originally founded the company in China. It's not even clear what it means for China to force Meta to unwind the transaction. Is it going to force Manus's researchers to return to China and place exit bans on them too? Is it going to force Manus's founders and shareholders to pay back $2 billion to Meta? This is what happens when you regulate by fiat rather than rule of law. Ultimately, this is a much larger defeat for the Chinese AI ecosystem than for the United States. Meta will be fine without Manus. But Chinese nationals looking to found AI companies will increasingly just start them overseas. The message from the Chinese government here is that every AI company founded in China will forever remain subject to Chinese government regulatory pressure and manipulation, regardless of its legal status or location. Lastly, given the Chinese government clearly believes that the US and Chinese AI ecosystems should be completely separate, we should stop helping their ecosystem succeed! China's AI companies remain extremely reliant on US compute, AI models, and chipmaking tools. If we tighten the screws on China's access to US tech, the Chinese ecosystem will be even less attractive to founders, and more will just start companies overseas.
English
386
145
703
372.5K
嘉禾博
嘉禾博@Withjackirich·
夜游 6
嘉禾博 tweet media
日本語
12
65
1.4K
29.2K
Omen
Omen@AtmoOmen·
@Damon09102 @xhyctf 一个官方一个黑灰产来的价格不能这样比啊
中文
1
0
0
109
Damon
Damon@Damon09102·
@xhyctf 我想做一个播放器,用claude cli接v4pro的api,第一版编译出来了不能播放,用gpt5.5的codex cli,第一版就能正常工作,后续调整一下就完美实现目标了,v4pro降价前真的一般,中转站gpt5.5太便宜了。
中文
2
0
0
2.7K
永雏塔菲
永雏塔菲@xhyctf·
v4pro的百万tokens输入(缓存命中)已经变成0.025人民币,这跟不要钱有什么区别
中文
31
4
313
105.3K
Omen
Omen@AtmoOmen·
@xhyctf 开盘幻方量化狠狠收割一波市场赚一下服务器钱
中文
0
0
0
2.6K
Omen
Omen@AtmoOmen·
@tphuang i'm looking forward to V4.2
English
0
0
0
217
tphuang
tphuang@tphuang·
My experience today w/ Kimi 2.6 vs DS V4. Yes, K2.6 gives better result, but it requires far more compute resource & mostly offline. V4-Pro to me seems like very under-trained. Rolled out like R1-preview. Recall that R1 came out a month after & then R1-0528 came another 4 months after that. Based on HW/Ascend team comment, 950DT/Atlas-950 will give DS team the ability to train more & do faster inference.
tphuang tweet mediatphuang tweet media
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)@teortaxesTex

So what are the correct next steps for DeepSeek? - they need to do an IPO - Get more compute for RL and just data generation - V4.1: "Kimi K2.5 to K2.6" uplift, actual xhigh mode, maybe steal agent swarm; around July - vision mode for Flash - subscriptions - work on refactoring this insane architecture - V4.2 + Engram (August?) - complete their Inner Mongolia datacenters, proceed to train a simplified, larger V5 with 100T+ tokens I expect something like this

English
5
8
153
13.6K
Omen
Omen@AtmoOmen·
@teortaxesTex 我个人还是感觉到很幽默的。他看到了与自己想象中截然相反的繁荣景象,就开始臆想“肯定是地方和中央意志相左”,进而开始虚假共情“我们每个人都在用力地活着”。实在是太好笑了。
中文
0
0
0
7
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Hilarious A Japanese guy goes on a business trip to China, expects to be treated badly (because of economy or whatever?), they don't even seem to understand his perspective. Japanese seem to be pretty neurotic and prone to overthink small stuff.
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞) tweet media
藤井 充@mitsurufujii

今、中国の東莞市に来ています。 とあるプロジェクトの進捗確認のため。 中国の景気後退のニュースを見聞きしていたので、さぞかしヤバい事になっているのでは? 日本人が歩いていたら殴られるんじゃないか? と心の中でビビりつつの渡航でした。 (全く気乗りしないけど仕方ない) んで、行ってみると拍子抜けしました。 取引先工場は前年比60%増の受注でご多忙な様子で、 「フヂイさんに頼まれた部品、もうちょっと時間もらえないですか?頑張って作ります!」てな具合。 工場も手狭になり、人も足りないから次の手を考えているとか、仰っていました。 「日本のニュースで見聞きしている中国とはずいぶんと違いますね」と取引先の社長に言うと、 「確かに不動産系企業はダメージ受けていますね。でも、ものづくり系は力強く成長を続けているところも多いですよ!」と。 その理由は、特殊製品や高付加価値製品、国際認証が必要な製品、そういったプロダクトは、トランプ関税やイラン戦争の影響で向かい風であったとしても、そう簡単に生産拠点をベトナムとか新興国に移す事が出来ないのだとか。 確かにそうですね。 ものづくりはエコシステム、サプライチェーンが機能している場所じゃないと上手く行きません。チタンやカーボンの特殊な素材や加工、表面処理がすぐに手に入る環境が構築されている深セン、東莞はとっても便利です。 例えば医療機器で国際認証が必要な製品だと、新製品の申請から認証まで3年かかるそうです。(そのルールメイクをしたのは西側先進国) 東莞には、その製品を作る為の素材業者、加工業者、認証機関それぞれが揃っているので、全てが効率的なわけです。 それらの工程を他国に移すには、起案から手続きで3年は掛かってしまう、そしてものづくりのエコシステムも不十分、その間に彼らは技術投資をしてトライ&エラーを重ね、より競争力のある製品を作ってしまう。そう簡単には負けませんよ、という中国の生産現場の人たち。たくましい。 おそらく深センや東莞の人たちは、北京の政策に対して、色々と思うところはあるのでしょう。 しかし、自分たちのビジネス、ファミリーがより繁栄出来るように、知恵を絞り機会を最大化をするだけ、とシンプルです。 相変わらず「やってみようぜ」の精神でグイグイと前に進み続けている印象を受けました。 まぁ、私が見たのは全体の中のほんの一部分ですから、その小さな視点から全体を語るのは危険です。 しかし、日本のニュースを見て中国の全体を知った気になるのも危険だと感じました。 このバカでかい国ですから、上手く行っている人たちもいれば、谷底に転落しつつある人たちもいる。 そして、そのデカさゆえに、一部分と言えど巨大なパワーを持っている。 日本に観光に来て迷惑を撒き散らす成り金中国人もいれば、 100年先の一族の繁栄の為に高度な精神性と思考をもって世界を相手にビジネスを展開する超絶賢い中国人もいる。 それを肌身で体感出来たのは収穫でした。 あと、私の体験の範疇ですが、街は安全でしたよ。 香港から東莞へ行く新幹線に乗り込んだ際に、私は大きな荷物を持っていて、ドコに置くかな?と困っていたところ、座席に座っていた若者が立ち上がって自分の荷物を動かして「ここに置いたらどうですか?」と言ってくれた、と思う。 (中国語ワカラナイ) とか、タクシーで「日本人か?」と聞かれて(あ、ヤベ、降ろされるかな?)と思ったけど、「そうかそうか」と鼻歌まじりで運転してくれたり、この短い滞在で危険を感じたり不快な思いをする事はありませんでした。 (まぁ、中国語で「バーカ!バーカ!」と言われていても判らないけど(笑)) というワケで、海外出張する度に日本の新興没落ぶりが確認できて、生粋の日本人としては多少、気分が落ち込むといういつものヤツです。(苦笑) 取引先の社長も 「日系企業からの仕事は減り続けています。中国工場を撤退した日系企業もあります。代わりに米国とドイツが増えていますね。」と仰っていました。 はぁー。 私がやっているのは日本でものづくり、という普通に考えたらオワコンな取り組みですが、 超絶賢い中国の方々に学んで、 与えられた環境を分析し、最も効果的な戦略を練り、機会を最大化して行こう! と思います。

English
14
2
189
22.4K
温某_
温某_@Wenmou_0220·
这集神了
温某_ tweet media温某_ tweet media温某_ tweet media
中文
15
13
539
29K
Omen
Omen@AtmoOmen·
@teortaxesTex 推特中文圈没几个正常人,不用在意
中文
0
0
0
4
温某_
温某_@Wenmou_0220·
初试STOUCH甲面杯 颜值与体验双封神!机甲萌系外观,手感软糯舒服,包裹感十足,力度恰到好处,解压又治愈,又萌又爽! #STOUCH #ST甲面杯
中文
21
458
5.8K
188.1K
Omen
Omen@AtmoOmen·
@XXLWOOFIA 如果不喜欢这种肉壮画风麻烦去找下一个符合你审美的游戏,而不是逼着游戏朝着你的审美做
中文
0
0
8
1.2K
XXL 猛漢町
XXL 猛漢町@XXLWOOFIA·
【猛漢檔案 - 巴德】 「咕…別一直盯著我的胸膛看…是在動什麼歪腦筋嗎?!」 稀有度:XXL 身高:164 cm #礦工工頭 #黑兔獸人 #性格豪邁 #深愛孩子 「嗚呃…別毛手毛腳的,會影響到我工作!」 #XXL猛漢町 #XXLWOOFIA #Gay #Bears #GayGame
中文
124
101
1.5K
149.8K
Alice
Alice@jChangwei_·
@XXLWOOFIA 能不能少点这种群p淫趴剧情🙄
中文
5
0
7
5.8K
Omen retweetledi
Boss♂Light
Boss♂Light@BossLight_FFXIV·
(3/4)🎬Let's cheer! This is Clive's SUPER SEX SHOW! This is the hero of another world!🎬(part.3)
English
3
116
602
48.4K
Omen retweetledi
emyu: よく喋るバイオリン弾き。
拡散希望 読める方いらっしゃいませんか? 1945年8月15日 玉音放送を生で聞いた大正生まれの祖母が記した日記が遺品から見つかりました。 が、大事なことが書いてあるはずなのに昔の字なので読め苦戦しています。 寮生静粛、起立、初めて接する玉音、かん激、子々孫々まで…? #終戦の日 #終戦記念日
emyu: よく喋るバイオリン弾き。 tweet media
日本語
950
19.4K
137.1K
30.8M
Omen retweetledi
小白天
小白天@TIANDANHUISHI·
禁锢的少年🔒😋
小白天 tweet media
日本語
18
692
5.9K
329.8K