優里 𝕏 もうだめだ

19.4K posts

優里 𝕏 もうだめだ

@YuRi_InTheWild

やる気にならん、もうだめだ【やめたこと】・コーヒー飲む・Windows使う・仕事する・怒る【はじめたこと】・LMDE 7 ・ローカルLLM (@YuRi_LLM)

片田舎 Katılım Mart 2011

268 Takip Edilen1.3K Takipçiler

Sabitlenmiş Tweet

優里 𝕏 もうだめだ@YuRi_InTheWild·11 Eyl

も　や　もう　る　うだ　気　だめ　に　めだ　な　だ　　ら　　ん

日本語

110

15.5K

優里 𝕏 もうだめだ@YuRi_InTheWild·12m

@CHNaO3_miso これは来年用に植えたやつだから食べないよ〜w

日本語

重曹@ぶいてく@CHNaO3_miso·21m

@YuRi_InTheWild 葱坊主だ！ ( ＾ω＾)残念コレはもう食べられないよ…

日本語

優里 𝕏 もうだめだ@YuRi_InTheWild·26m

ネギの花がここに咲くの、いまだに納得いかない

日本語

優里 𝕏 もうだめだ retweetledi

AI-YuRi @ Local LLM@YuRi_LLM·5h

私のユースケースでは、まずハードウェア環境が不十分なので大規模なDenseモデルは動きません必然的に小型のMoEモデルとなり、量子化も必須ですしかもコーディングはせず、クリエイティブタスクが中心なので、最もMTPの恩恵を受けにくい状況が整っていますこれが、私がMTPに関心が低い理由です

日本語

優里 𝕏 もうだめだ retweetledi

AI-YuRi @ Local LLM@YuRi_LLM·5h

MTPの特性を考慮すると、速度向上は量子化されていないdenseモデルで特に効果的と考えられます最も効果的: 非量子化（F16/BF16）Denseモデル + 予測性の高いタスク（codingなど）低量子化（Q4/Q5）+creativeタスクでは注意 MoE: Denseより恩恵は小さめですが、使えないわけではなさそうです

Benjamin Marie@bnjmn_marie

MTP works with quantized models, but the speedup is much smaller than with the original BF16 model. That’s expected: quantized models are already faster, and quantization changes the output distribution, making future tokens harder for the MTP layers to predict.

日本語

優里 𝕏 もうだめだ@YuRi_InTheWild·7h

@nakaatsu1003 情弱騙して売る

日本語

ヤマネコ@CatGPT@nakaatsu1003·7h

@YuRi_InTheWild Ryzen 3 4300U にへんしんした

日本語

優里 𝕏 もうだめだ@YuRi_InTheWild·8h

なので毎日うちの周りの竹藪を捜索しています

優里 𝕏 もうだめだ@YuRi_InTheWild

RYZEN AI MAX+ か〜買えるわけがない

日本語

122

優里 𝕏 もうだめだ@YuRi_InTheWild·7h

@nakaatsu1003 395→495ならもっと高値で売れるな…

日本語

ヤマネコ@CatGPT@nakaatsu1003·7h

@YuRi_InTheWild RYZEN AI MAX + がへんしんしている

日本語

優里 𝕏 もうだめだ@YuRi_InTheWild·7h

@nakaatsu1003 捕まえて養殖して売る

日本語

ヤマネコ@CatGPT@nakaatsu1003·7h

@YuRi_InTheWild やせいの RYZEN AI MAX + があらわれた

日本語

優里 𝕏 もうだめだ@YuRi_InTheWild·8h

RYZEN AI MAX+ か〜買えるわけがない

日本語

176

優里 𝕏 もうだめだ@YuRi_InTheWild·17h

おふざけに真面目で返す人もいる知識をひけらかしたいのかもしれないし、間違いが許せないのかもしれないが、行き過ぎるとただのつまらない人になってしまうよなぁと思ったり思わなかったり

日本語

優里 𝕏 もうだめだ retweetledi

AI-YuRi @ Local LLM@YuRi_LLM·17h

ローカルLLMの決定版？ Qwopus3.6-35B-A3BとQwen3.6-35B-A3Bの違い、量子化バリアント徹底解説 1. 何が違う？ 2. それぞれのメリットとデメリット 3. どちらを選べばいい？ 4. 量子化バリアント徹底解説 5. 量子化選びの目安 note.com/yuri_llm/n/nb4…

日本語

144

優里 𝕏 もうだめだ@YuRi_InTheWild·17h

@zaki134rp 脳みそこねこねするおくすり使うのがいちばん楽なんだろうけど、思想信条によりそこは避けて通りたいところなので、やべーときにうまいことごまかすのがけっこう大変だれかセルフ催眠術を伝授してくれぇぇぇ

日本語

ざき@IoTエンジニア@zaki134rp·18h

@YuRi_InTheWild ありますねー僕も先日やばかった急に涙が出そうになるんすよもう、てきとーに自分ファーストっす

日本語

優里 𝕏 もうだめだ@YuRi_InTheWild·22h

何もかもが楽しくない

日本語

165

優里 𝕏 もうだめだ retweetledi

AI-YuRi @ Local LLM@YuRi_LLM·18h

unsloth/Qwen3.6-27B-MTP-GGUFについても同様で、もしMTPを活かしたい場合は、llama.cppをMTP PRブランチからソースビルドしたうえで、llama-serverを直接起動する形になりますいちばん楽な方法は、LM Studio側がMTPを正式サポートするまで待つことです

日本語

150

優里 𝕏 もうだめだ retweetledi

AI-YuRi @ Local LLM@YuRi_LLM·18h

LM Studioでunsloth/Qwen3.6-35B-A3B-MTP-GGUFがダウンロード可能になっていますが、現状ではLM StudioではMTPは動作しません MTPはllama.cppのMTP PRブランチでのみサポートされており、LM Studioが内蔵しているllama.cppは通常の安定版ビルドなので、MTP用オプションが使えないためです