Someone

732 posts

Someone

Someone

@TooTiredToSnore

Katılım Mayıs 2022
189 Takip Edilen6 Takipçiler
divyansh tiwari
divyansh tiwari@DivyanshT91162·
Local LLMs just hit a whole new level 🤯 This Hugging Face release is actually insane: "gpt-oss-20b-tq3" An official 20B+ parameter MoE model from OpenAI… quantized to 3-bit with TurboQuant + optimized with MLX… …and now it runs smoothly on a normal 16GB MacBook. 💻 No server. No cloud bill. No internet needed. Everything stays fully local. A few months ago this would’ve needed a high-end GPU setup. Now an M-series Mac can handle it. • 131K context window • Fully offline + private • Great for chat, writing, and coding • 60–80 tok/s decoding speed • No monthly subscription Running top-tier open-source LLMs directly on a laptop doesn’t even feel real anymore.
divyansh tiwari tweet media
English
12
37
265
22.9K
Leo Rafa
Leo Rafa@leorafacosta·
@fla_da_opressao Falando em cavalo.. Neymar me lembra muito o bojack horseman A cara de tristeza.. a quantidade de polêmica que ele entra.. a frustração por não ser mais o jogador que era antes
Leo Rafa tweet media
Português
7
7
200
6.8K
FLA DA OPRESSÃO
FLA DA OPRESSÃO@fla_da_opressao·
A questão do Neymar é bem simples Você tem um cavalo Um q já foi o seu melhor cavalo ganhou varias provas com ele,mas teve várias lesões e tá comprometido,não é nem 1% doq já foi,quase sendo sacrifícado Do outro lado vc tem um cavalo novo vigor físico da porra um monstro,pedindo passagem Qual você escolhe?
FLA DA OPRESSÃO tweet mediaFLA DA OPRESSÃO tweet media
Português
297
47
1.7K
157.1K
Brutus™ ⭕
Brutus™ ⭕@MarciojBrito·
@blognaointendo Mano, esse filme é superestimado por pessoas que não entendem absolutamente nada de astrologia, mas infelizmente nenhum de vocês está preparado pra essa conversa!
GIF
Português
79
0
242
51.7K
Não Intendo
Não Intendo@blognaointendo·
Quando você vai assaltar uma casa e os moradores estão assistindo Interestelar
Português
352
4.5K
58K
3.5M
panda
panda@pandaa·
Deleting in 24 hrs, whoever Iikes and says “hi”, we’ll send you a surprise dm! 🐼
English
1.4K
82
1.8K
121K
Seally tales
Seally tales@ment4lfortress·
@cyber__razz No: cd ls clear clear clear cd ls clear ls clear ls clear... till I remember why I came here in the first place
English
6
11
393
12.9K
senshi
senshi@senshi_real·
amigos qual a combinação de comida mais estranha que vcs gostam? eu: batata frita com ovomaltine
senshi tweet media
Português
106
9
268
10K
senshi
senshi@senshi_real·
eai?
senshi tweet media
1.6K
71
4K
143.2K
Andrew Sousa
Andrew Sousa@salvedrew·
Gente… será?
Português
28
0
409
61.2K
Someone
Someone@TooTiredToSnore·
@GarotodePograma Aopa! Logo logo tu pega o jeito! Eu não sei se valeria de muito meu conselho, mas acho que talvez, seja melhor você tentar se acostumar com uma linguagem (C, por exemplo) Portugal acaba atrapalhando um pouco no decorrer do aprendizado (ao menos no meu caso foi assim haha)
Português
1
0
3
152
garoto de pograma com c# 💻
garoto de pograma com c# 💻@GarotodePograma·
12/100 dias de codigo estou apanhando tanto pra vetores que me deixa genuinamente muito desanimado, acho que vou ter que ver outras aulas para tentar entender melhor, pq nossa, que confusão (sem contar que eu sonhei com essa bomba duas vezes hoje)
garoto de pograma com c# 💻 tweet mediagaroto de pograma com c# 💻 tweet media
Português
14
0
83
3.1K
left curve dev
left curve dev@leftcurvedev_·
@TooTiredToSnore @pupposandro You are in the vram hell But you can try to run Qwen3.6 35B with offloading, use the flags I talked about in this tweet. Try to run UD-IQ3_XXS huggingface.co/unsloth/Qwen3.… x.com/leftcurvedev_/…
left curve dev@leftcurvedev_

@hardalldayy I would try --ncmoe 99, see the speeds then I would keep lowering and keep testing until I find the sweet spot Maybe try to play with --fit-target tag I'll let you know the results on my end

English
1
0
1
316
left curve dev
left curve dev@leftcurvedev_·
Okay lads, you know what day it is 🔧 Setup Sunday Tell me your hardware and I'll tell you the best model you can run on it. Found anything cool this week? Drop it in the comments. Let's help each other out 🫡 Hottest topic of the week is definitely PFlash by @pupposandro (achieved 10x prefill speedup at 128K ctx on an RTX 3090 with llama.cpp). I highly recommend giving the man a follow, 3k followers for this level of work is straight-up criminal On my side, here are my stats on an RTX 5080 (16GB) with Qwen3.6 35B A3B, full GPU offload. Running it with these llama.cpp flags: -ngl 99 \ -np 1 \ --flash-attn on \ --cache-type-k q8_0 \ --cache-type-v q8_0 \ --ctx-size 131072 Running at 150 tok/s then slows as context fills. I'm using 35B as main driver these days and I switch to 27B whenever 35B can't handle the task. Works well for me on this single GPU setup. Feel free to drop your hardware, model, speeds or any optimization wizardries you've pulled off. It will be super helpful to others!
English
35
1
70
6.7K
Leandro Firmino
Leandro Firmino@Firmino1984·
@fandofux Ela não trata como pedra preciosa não, pq usa maçarico e joga a massa direto nele! Para essa merda era melhor comprar um minas padrão!
Português
2
0
7
5.1K
Someone
Someone@TooTiredToSnore·
@luksamuk Caraca! Eu tou batendo a mesma coisa em uma 4060! Qual sua mágica? Você ta usando TomTom ou buun pra rodar TurboQuant?
Português
0
0
0
32
Lucas
Lucas@luksamuk·
Até agora, o coding champion aqui, numa RTX 3050 com 6GB de VRAM foi o Qwen 3.6 35B-A3B. Quantização: UD-Q3_K_L. Arquitetura MoE ajuda com velocidade; qualidade inigualável; bom tradeoff com velocidade. Não duvido que o 27B faça coisa melhor, mas é lento que dói (limitação minha)
Português
18
2
63
3.5K
Someone
Someone@TooTiredToSnore·
@MrBeast Let's see the bots take action
English
0
0
0
11
MrBeast
MrBeast@MrBeast·
If this tweet has exactly 1 like in 24 hours I’ll give that person $1,000,000
English
261.3K
30.7K
1.1M
70.6M