CopenDeCamp (@lvlinf) - Twitter Profili | Zamantika Mersobahis Locabet

@BIG3_PEAK_ADAPT ローカルLLMを自分でホストできるならSuperpowersプラグインいれてCodexはSpecとPlanの記述だけさせる実際のコーディング出力はローカルLLMにやらせるとトークン出力を節約できます Planの中に仕様を満たすコードがほとんど出力されてるからCodex単体でやると損

日本語

1

0

16

1.4K

ENO@個人アプリ開発•筋トレ@BIG3_PEAK_ADAPT·1d

codex使ってみましたがこれとんでもなく金食い虫じゃないですか？ 20ドルが一瞬で消し飛んだ。。。指示の仕方が悪いんでしょうか?

日本語

14

3

133

25.1K

CopenDeCamp@lvlinf·18h

@gosrum RTX6000x2でNVFP4量子化かつTensorParallelとかじゃないとだめですね... 一般人には無理かな...

日本語

0

1

14

金のニワトリ@gosrum·2d

Mistral-Medium-3.5-128Bの推論速度をllama-benchで測定＠ Mac Studio（M2 Ultra）・prefill：〜57.5tps ・decode速度は〜6.5 tps この時点でts-benchの評価をするには遅すぎるので断念コンテキストサイズも128kはいけたが、200kだとOOMでハングしてしまったやはり128B-denseモデルはローカルで動かすものではなさそう

金のニワトリ@gosrum

お！Mistral-Medium-3.5-128BのGGUFのウェイトがずっと消されてたけど、今見たらアップロードされている huggingface.co/unsloth/Mistra…

日本語

1

0

17

2.2K

CopenDeCamp@lvlinf·21h

@gosrum AMD的にはCUDA資産に対抗するつもりはないように思える ROCmをOSSにしたら有志が勝手にある程度やってくれるだろ？&GPUのIO叩く部分だけは非公開コードあるからLinuxで協力すんぜってスタンスな気が

日本語

0

4

424

金のニワトリ@gosrum·1d

>ROCmのCUDA互換性やその開発速度が劇的に上がらなかったこれ本当にそのとおりで、AMDがこのチャンスを活かしてもっと頑張っていればここまで差が開かなかったと思う。成長性を感じさせてほしかった

posi_posi@posi_posi8

EVO-X2は、GPT-OSSが公開された当初は、画期的なデバイスだったと思う。同等のモデルを動かすためにRTX Pro6000Blackwellや、Mac Studioが必要であり、それがローカルで25万円で購入できる唯一の選択肢だった。ただ個人的に唯一誤算だったのは、生成AI恩恵も受けたのに、ROCmのCUDA互換性やその開発速度が劇的に上がらなかったこと。

日本語

3

16

65

15.8K

CopenDeCamp@lvlinf·22h

@gosrum 噂ですね MedusaHalo LPDDR6で検索するとRedditで議論されているかとただ発売が2027年後半だった気が

日本語

0

1

153

金のニワトリ@gosrum·22h

@lvlinf もしそうならちょっと話が変わってきそうですねどこに記載がありましたか？

日本語

1

0

1

502

金のニワトリ@gosrum·1d

CPU、GPU性能向上はわずかで大きな変更点はメモリを192GBにできるようになったことか EVO-X2買ったは良いのだが、AI性能はNVIDIA GPUやMacに劣るのでローカルAI用途としては使っていない。そういう意味でメモリ増やしても使いみちあるのかな？200BのLLMがローカルで動いた！（2tpsで）とかになりそう

ギャズログ | Gaz:Log@gazlog_blog

Ryzen AI Max+ 495のベンチマークが登場 CPU性能はMax+ 395から10%増もGPU性能は同等一方でメモリの最大サポート容量は128GBから192GBへ大幅拡大 AI向け用途を想定 gazlog.jp/entry/ryzen-ai…

日本語

9

118

59.7K

CopenDeCamp@lvlinf·22h

@posi_posi8 @gosrum llama.cpp比で1.5倍ぐらいはtps出せるっぽいです (RX 7900 XTXでの計測)

日本語

0

5

250

posi_posi@posi_posi8·23h

@lvlinf @gosrum そうなんですね。誤算といいつつも、自分が開発しているわけでもないので、ありがたく発展を待っています。

日本語

1

0

3

1.2K

posi_posi@posi_posi8·1d

EVO-X2は、GPT-OSSが公開された当初は、画期的なデバイスだったと思う。同等のモデルを動かすためにRTX Pro6000Blackwellや、Mac Studioが必要であり、それがローカルで25万円で購入できる唯一の選択肢だった。ただ個人的に唯一誤算だったのは、生成AI恩恵も受けたのに、ROCmのCUDA互換性やその開発速度が劇的に上がらなかったこと。

金のニワトリ@gosrum

CPU、GPU性能向上はわずかで大きな変更点はメモリを192GBにできるようになったことか EVO-X2買ったは良いのだが、AI性能はNVIDIA GPUやMacに劣るのでローカルAI用途としては使っていない。そういう意味でメモリ増やしても使いみちあるのかな？200BのLLMがローカルで動いた！（2tpsで）とかになりそう

日本語

1

8

80

23.2K

CopenDeCamp@lvlinf·2d

@LottoLabs PCビデオゲーマー(16GB)ぐらいで使えるサイズ感じゃないとローカルLLMそのものが普及しないと思うよ

日本語

0

1

20

CopenDeCamp@lvlinf·2d

@LottoLabs 投機しない推論の場合、Qwen3.6 27Bでも、今現在新品で買えるコンシューマーGPUという選択肢だと、5090ぐらいしか実用的なtps超えられないから厳しくないかな？そりゃDenseが賢いのは分かるけど

日本語

2

0

2

76

Lotto@LottoLabs·2d

We need a really good dense 40b model

English

23

2

127

6.8K

CopenDeCamp@lvlinf·2d

@shirasu_sann @whitesikarud 実はそんな変わらんです最新OSSだとハードウェアを使いこなせてないだけってことが結構判明してきてますまあ雑にやっても早いのは3090ですけどね

日本語

0

119

しらす@shirasu_sann·2d

@lvlinf @whitesikarud メモリ帯域幅が640gb/sでrtx3090の2/3程度なので、メモリ速度に準速になりがちな、LLM推論においては、やはり3090に軍杯が上がりますね….

日本語

1

0

121

シカルド✨️3748.8Lの水がある鹿@whitesikarud·2d

海外だとLLM界隈で大変人気があるRTX3090 安い、早い、VRAMあり、最終技術のフィードバックもよいと揃ってしまってるやつ、複数乗っければ安価に高速なトークン生成機として使えるやつ

日本語

2

4

29

2.6K

CopenDeCamp@lvlinf·2d

@leftcurvedev_ CMOEでもCPUがそこそこいいのだったら23tpsは出せるよん RyzenAIMax+でCMOEしたら32スレッドが頑張ってMoEルーティングしてくれてそれぐらいだった

日本語

0

1

114

left curve dev@leftcurvedev_·2d

Two friends asked for help with their setups One with an RTX 3070 Ti (8GB) One with an RTX 5070 (12GB) A lot of people are stuck in this annoying 8-12GB VRAM range. If you want full GPU offload, the only real option is Qwen3.5 9B… but let’s be honest, I can’t do that to my bros. So we’ll be trying to squeeze Qwen3.6 35B A3B with CPU offload on both cards + playing with the --ncmoe llama.cpp flag. Will also test other forks to push performance as much as possible. Curious to see what we can do with an RTX 3070 Ti I’ll report back the numbers with the server flags 👍

English

48

9

335

26.5K

CopenDeCamp@lvlinf·2d

@ren_bocchi3 なんかメモリスロットの片側だけに挿してない？ ASRockだと思うけど確かデュアルチャンネルだとNone8GNone8Gになってたような...

日本語

1

0

1

206

れな💚IT系志望女子🍓@ren_bocchi3·2d

で、起動しなくなったんですけど…。電源が腐っているのかしら…。

日本語

8

1

39

2.8K

CopenDeCamp@lvlinf·2d

@nepenta_magic @mmkikeru @hikaruganji まあ関西は神戸・大阪・京都・大阪公立と賢い公立の総合大学結構選択肢あるから早慶レベルの私学なくても困らないかも

日本語

0

25

ねぺん太★Gone with the Waves@nepenta_magic·3d

@mmkikeru @lvlinf @hikaruganji 西日本には関関同立を上回る私立の総合大学が無いので「その地域での上位◯校」という視点なら「関西の早慶上智」とも言えるレベルではMARCHあたりでしょうが

日本語

1

0

103

光源氏🇯🇵@hikaruganji·4d

採用する企業側も、大学生の時は金髪で陽キャの子が将来的にもたらすリスクを考えてから採用しないと、こうなると言う典型的な例ですね。。。西日本シティ銀行。

日本語

582

1.1K

14K

4.2M

CopenDeCamp@lvlinf·2d

@electlone 解像度高いな

日本語

0

152

不対電子@electlone·3d

今の平均的な陰キャ大学生のSNS事情・Discord→必須・Twitter→6割くらいやってる。無くても耐え・LINE→必須だがディスコで事足りる。親しい人以外はあまり交換しない・Instagram→垢持ってるだけで投稿してない。推しを見るために使ってる人多数・BeReal→やってる奴ガチで存在するの？？

ぶる🐰@61ve_kkmn

今の平均的な大学生のSNS事情・Instagram→必須・BeReal→6割くらいやってる。無くても耐え・LINE→必須だがインスタで事足りる。親しい人以外はあまり交換しない・Twitter→# 春から○○大とかでしか使わない。推しを見るために使ってる人多数・TikTok→殆ど入れてる。よく見てる

日本語

31

499

4.8K

418K

CopenDeCamp@lvlinf·2d

@xy_ip99 Powershell使いにくすぎるよ...

日本語

0

1