LLM with Mac studio M3 Ultra

204 posts

LLM with Mac studio M3 Ultra banner
LLM with Mac studio M3 Ultra

LLM with Mac studio M3 Ultra

@HikoMSP

東京都在住 ソフトウェアエンジニア AWS プログラミング 機械学習 BeatSaber テックリード LLM

東京都 Katılım Ağustos 2016
66 Takip Edilen73 Takipçiler
LLM with Mac studio M3 Ultra retweetledi
941 / kushii
941 / kushii@941·
カケハシのオフィスで定期開催している KAKEHASHI Tech Encounter #kkhs_tech も第6回となりました。 第6回は3名のエンジニアが、入社前後のギャップ・これまで乗り越えてきた歴史の話・これからのMusubi開発のリアルな課題についてクロストークを実施します。ぜひ! kakehashi-dev.connpass.com/event/386863/
日本語
0
6
11
1.5K
LLM with Mac studio M3 Ultra retweetledi
青龍聖者
青龍聖者@bdsqlsz·
it is coming.
青龍聖者 tweet media
English
109
151
1.6K
518.9K
LLM with Mac studio M3 Ultra
claude codeを使ってたら、localLLMでも同じ使い方をしてすぐにコンテキスト長を食い潰すようになってしまった。llama.cppだとyarnでqwen3.5を1Mまでコンテキスト長増やせるのでは?と思い、勉強・実験中
日本語
0
0
1
102
LLM with Mac studio M3 Ultra
unslothのqwen3.5 35b-a3b は考えすぎる時もあるけど(5kトークン分ぐらい)エージェンティックな動作は安定していた。プロンプトテンプレート変えたらanthropic互換apiでも問題なく動いた。言語の問題も今のところ大丈夫なのでminimax m2.5より使うことになりそう
日本語
0
1
1
211
LLM with Mac studio M3 Ultra
lmstudioでllama.cppランタイムが更新され、qwen3.5でkvキャッシュの再利用がされるようになった!どのモデルが実用できそうか試していこう
日本語
0
1
3
150
LLM with Mac studio M3 Ultra
qwen 3.5はllama.cppだと今はkvキャッシュをリクエスト間で再利用できていないみたいだな・・ reddit.com/r/LocalLLaMA/c… これが治ったら、コーディングエージェントでも使いやすくなりそう
日本語
0
1
1
167
LLM with Mac studio M3 Ultra
qwen3.5 27b。opencodeでエージェンティックに動作するか確認中。今のところいい感じ。122b,397bだとちょっと時間かかりすぎるので、この辺りが使えると助かるのだが・・ tpsはminimax m2.5よりは時間がかかっている。
LLM with Mac studio M3 Ultra tweet media
日本語
0
0
3
323
LLM with Mac studio M3 Ultra
opencodeとqwen 3.5 35b-a3b の組み合わせ、エージェンティックな動作難しいかも?と思ったけど、プロンプトテンプレート変更したからか、指示を明確にしたからか、ちゃんと動いてくれている。もうちょっと試行錯誤してみよう。
日本語
0
0
0
170
LLM with Mac studio M3 Ultra
qwen 3.5の35b a3b gguf Q8_0 を動かしてみた。爆速。ただ opencodeエージェントとしての動作は397bの時と同様うまくいかず
LLM with Mac studio M3 Ultra tweet media
日本語
0
1
2
475
LLM with Mac studio M3 Ultra
qwen3-14b-claude-4.5-opus-high-reasoning-distill はopencodeでそこそこエージェントとして動いた。コンテキスト長が40kとやや短いのと、Q4_K_M だとコーディングさせるとツール呼び出しに失敗してしまった
LLM with Mac studio M3 Ultra tweet media
日本語
0
0
0
264
LLM with Mac studio M3 Ultra
minimax m2.5が 日本語の伸ばし棒`ー`を理解してくれない。仮想通貨の確定申告のためのプログラムを作らせているが、ステーキングが`ステキング`として処理される。素敵でない
日本語
0
0
2
132
LLM with Mac studio M3 Ultra
glm-5のQ2_K_XLは、ちょっと長いタスクをさせると、途中でループに入ることがあった。opencodeのglm-5の無料版を使っていてもそれは起きないから、量子化の影響か・・
日本語
0
0
1
110