Nicolas GORALSKI

15.8K posts

Nicolas GORALSKI

Nicolas GORALSKI

@ngoralski

Sysadmin, Husband, Father, computer geek, fan of TV Shows. Not specially in this order. Opinions are my own and not the views of my employer. vote @partipirate

Katılım Şubat 2010
1.2K Takip Edilen366 Takipçiler
Nicolas GORALSKI retweetledi
ハカセ アイ(Ai-Hakase)🐾最新トレンドAIのためのX 🐾
Llama.cppがついにMTP対応!ローカルAIの生成速度が異次元へ 🚀 Llama.cppに待望の「Multi-Token Prediction(MTP)」ベータ版サポートが追加されました!複数の単語を一度に予測することで、ローカルLLMの動作が驚くほど高速化します。 🌟 注目ポイント ・生成速度が最大1.5〜2.0倍に爆上がり ・QwenやDeepSeek V3などの最新鋭モデルに対応 ・サーバー向け高速エンジンに匹敵するパフォーマンスを実現 動作には追加で約3GBのVRAMが必要ですが、手元のPCでクラウド級のスピードを体感できる神アップデートです。爆速コーディングや大量の文書処理がさらに快適になりますね!✨ #Llamacpp #ローカルLLM
ハカセ アイ(Ai-Hakase)🐾最新トレンドAIのためのX 🐾 tweet media
日本語
4
24
207
11.2K
Nicolas GORALSKI retweetledi
AJ
AJ@ItsmeAjayKV·
Qwen3.6-35B-A3B (TQ3_4S ~4bpw) on RTX 3060 (12GB) via llama.cpp-tq3 (TurboQuant): • ~619 t/s prompt (4K ctx) • ~60 t/s generation (128K ctx) • fits in ~12.4GB VRAM 128K context with usable decode speed on a single 3060 is kind of wild
AJ tweet media
English
39
52
574
56.3K
Nicolas GORALSKI retweetledi
witcheer ☯︎
witcheer ☯︎@witcheer·
a 27B model on a single RTX 3090 now runs a full autonomous coding loop. the setup from @sudoingX: ~~~ llama-server \ -m Qwen3.5-27B-Q4_K_M.gguf \ -ngl 99 -c 262144 -fa on \ --cache-type-k q4_0 \ --cache-type-v q4_0 ~~~ pair with hermes agent. the model writes multi-file code, runs tests, fixes its own bugs, serves the result. all on 24GB VRAM. if you want to try it, use q4_0 for KV cache, not q8_0. q8_0 drops speed to 10 t/s. q4_0 has zero speed penalty at 262K context. >> with a RTX 4060 Ti with 8GB VRAM: same workflow works with qwen3.5-9B at full offload. smaller model, shorter context, but the loop is identical. >> for a RTX 3060 with 12GB: sudoingX ran qwen3.5-9B on one, wrote 3,263 lines across 13 files, debugged its own code, and served a working game. 50 t/s baseline, 30-45 under agent load. the models are open. you can copy-paste the configs and use the GPU you bought for gaming to run a coding agent now.
English
19
27
348
18.9K
Nicolas GORALSKI retweetledi
International Cyber Digest
International Cyber Digest@IntCyberDigest·
❗️🚨 Microsoft Edge keeps every saved password in process memory as cleartext from the moment it launches. Microsoft's responsed when reported: "by design." All of them. Including credentials for sites you won't open this session. Researcher @L1v1ng0ffTh3L4N tested every major Chromium browser. Edge is the only one that behaves this way. Chrome decrypts credentials on demand, and App-Bound Encryption locks the keys to an authenticated Chrome process so other processes can't reuse them. In Chrome, plaintext surfaces only during autofill or when a password is viewed, making memory scraping far less useful. What makes this extra weird is that Edge still demands re-authentication before revealing those passwords in its Password Manager UI, while the same browser process already holds every one of them in plaintext. In shared environments, this turns into a credential harvest. On a terminal server, an attacker with admin rights can read the memory of every logged-on user process. In the published PoC video, a compromised admin account lifts stored credentials from two other logged-on (and even disconnected) users with Edge running. Microsoft's official response when notified: "by design." The finding was disclosed April 29 at BigBiteOfTech by PaloAltoNtwks Norway, alongside a small educational tool that lets anyone verify the cleartext storage for themselves.
International Cyber Digest tweet mediaInternational Cyber Digest tweet media
English
220
2.1K
8K
1.1M
Nicolas GORALSKI retweetledi
Harrison Ford
Harrison Ford@HarrisonFordLA·
May the fourth be with you
GIF
English
2.9K
51.6K
219.4K
6.5M
Nicolas GORALSKI retweetledi
AboveSpec
AboveSpec@above_spec·
RTX 5060 Ti 16GB. $429 GPU. Last night I got 128 t/s on Qwen3.6-35B using ik_llama.cpp's R4 quant format. Crushing performance. Faster than the 5070 Ti on mainline llama.cpp. Performance stays consistent from 0 to 139k context and no speculative decoding used!🤯 Special thanks to @MakJoris for sharing ik_llama.cpp with us! Today I wanted to know if it's actually *useful* at that speed. So I gave it a coding agent and 4 creative challenges. Here's what it built. 🧵
AboveSpec tweet media
English
34
48
523
27.8K
Nicolas GORALSKI retweetledi
Maor Ai
Maor Ai@Maor_Elkarat·
Stop buying more VRAM. Everyone’s posting Qwen 3.6 configs running insanely fast on 12GB cards. But do you actually understand the flags making it possible? Weights are only half the story. KV cache is eating your VRAM alive. The secret isn’t just 4-bit weights it’s the KV cache sorcery everyone’s missing. Here’s the annotated command & real tricks explained: @elonmusk @grok #Ai
Maor Ai tweet media
English
33
150
1.4K
90.1K
Nicolas GORALSKI retweetledi
⛩ Ryo Saeba | Japon XYZ ⛩
Certains restaurants japonais commencent à installer des "panneaux traducteurs" pour communiquer avec les touristes étrangers. Un système futuriste qui affiche automatiquement les échanges dans plusieurs langues #Japon
Français
33
131
803
48.6K
Nicolas GORALSKI retweetledi
AboveSpec
AboveSpec@above_spec·
"You need a 24 GB GPU for serious local LLMs in 2026." Everyone repeats this. It's not true anymore. Just ran a 35B-parameter model on an RTX 4060 Ti 8 GB: • 41 tok/s at 16k context • 24 tok/s at 200k context Recipe + benchmarks below 🧵
AboveSpec tweet media
English
134
233
2.8K
273.3K
Nicolas GORALSKI retweetledi
Shanmukha Vishnu
Shanmukha Vishnu@iam_shanmukha·
Just achieved 60 tokens/sec with Qwen3.6-35B-A3B (35B MoE) on RTX 4070 12GB Full 128k context + Q4_K_M + running agents daily. Here’s the complete step-by-step from scratch
Shanmukha Vishnu tweet mediaShanmukha Vishnu tweet media
English
26
57
665
58.9K
Nicolas GORALSKI retweetledi
Christophe Boutry
Christophe Boutry@Ced_haurus·
🚨 Alerte Cyber - CPANEL Une faille d'authentification critique a été découverte dans cPanel, permettant à des attaquants de se connecter sans autorisation aux interfaces cPanel et WHM (autrement dit, ils peuvent accéder à des panneaux d'administration de serveurs web sans connaître les identifiants légitimes.) Un patch a été publié pour les versions supportées. La mise à jour se fait avec une seule commande : 👉bash/scripts/upcp Si la mise à jour est impossible ➡️ bloquer les ports via le pare-feu
o2switch@o2switch

Bonjour, cPanel a publié une alerte de sécurité critique ce Mardi 28/04/2026, à 22h environ. heure Française. support.cpanel.net/hc/en-us/artic… Afin de prévenir tout incident de sécurité, nous avons coupé cPanel sur tous nos serveurs. Cette opération a eu lieu en même temps / peu avant la publication par cPanel. Nous suivons l'évolution de la situation. Malheureusement, l'accès à vos interfaces cPanel est donc impossible tant que l'incident ne sera pas terminé. Cela concerne cPanel au sens large : l'interface technique, les webmails, les webdisks. Dès mise à disposition d'un patch d'urgence par l'éditeur, nous déploierons sur l'intégralité de l'infrastructure. Les accès reviendront alors au fur et à mesure. Il n'est pas nécessaire de contacter le support. Un rétablissement est planifié entre minuit et 1h du matin. Après cette période, le support est à disposition. Equipe technique.

Français
3
14
71
20.8K
Nicolas GORALSKI retweetledi
Алёна Попова
Алёна Попова@alyonapopova·
Путин радуется снижению числа безработных в России. Говорит, что это благодаря развитию «гибких, платформенных видов занятости». Число безработных в России Февраль 2022: 3 071 000 чел Февраль 2026: 1 636 000 чел Потери России в Украине: 1 400 000 чел Ну так совпало
Русский
400
1.8K
11.9K
460.5K
Nicolas GORALSKI retweetledi
Olivier Poncet 🦝
Olivier Poncet 🦝@ponceto91·
Pour celles et ceux qui veulent se mettre à Claude code, voici un dépôt qui pourra vous y aider, en partant des concepts de bases et en allant crescendo ⬇️ github.com/luongnv89/clau…
Français
1
36
164
9.5K
Nicolas GORALSKI retweetledi
José Creadores Libres
José Creadores Libres@ZPotxolin·
Tu hijo no tiene ansiedad. Lo que tiene es falta de hambre. Y la culpa es tuya. Ayer despedí a un chico de 22 años a los diez minutos de empezar su periodo de prueba. ¿El motivo? Me preguntó cuántas pausas para el café tenía y si el trabajo era "presencial obligatorio" porque le generaba estrés el transporte público. Le di su mochila y le abrí la puerta. Sin drama. Sin explicaciones. Estamos en 2026 y hemos creado un monstruo: el profesional de cristal. Gente que cree que el sueldo es un derecho de nacimiento y que el esfuerzo es "explotación". Me dicen: —"Es que los tiempos han cambiado, ahora priorizamos el bienestar". Mentira. Priorizáis la mediocridad. Priorizáis el camino fácil mientras el resto del mundo os pasa por la derecha sin pedir permiso. El éxito no es apto para gente que necesita un "espacio seguro" cada vez que recibe una crítica. El dinero no fluye hacia los que esperan que la empresa se adapte a sus traumas infantiles. Si te ofende este texto, felicidades: eres parte del problema. Eres de los que piensan que "ser amable" es más importante que ser eficiente. Eres de los que confunden tener una opinión con tener resultados. He visto a padres arruinarse pagando carreras privadas para que sus hijos terminen llorando en un hilo de X porque su jefe les ha pedido que lleguen puntuales. ¿Quieres ayudar a tu hijo? Deja de protegerlo de la realidad. Deja de validar sus excusas. Enséñale que el mundo es un lugar hostil que desayuna gente con "potencial" y merienda gente con "títulos". La verdadera salud mental es ser capaz de sostener tu vida sobre tus propios hombros sin pedirle a los demás que carguen con tu peso. Aquel chico se fue llamándome "boomer". Yo me volví a mi mesa a trabajar con gente que sabe que, en el barro, las etiquetas de cristal no sirven para nada. El mundo no te debe nada. Aceptarlo es el primer paso para dejar de ser un estorbo.
Español
1.4K
8.5K
25.1K
1.1M
Nicolas GORALSKI retweetledi
Eric ⚡️ Building...
Eric ⚡️ Building...@outsource_·
My 4090 went from 26 -> 154 tok/s Qwen 3.6 27B🤯 Same GPU. Same Q4_K_M . No FP8, no extra quant. The unlock: ik_llama.cpp + speculative decoding using Qwen3-1.7B as the draft model. 85% acceptance rate. Full config + benchmarks 👇🏻
Eric ⚡️ Building... tweet media
English
79
155
1.7K
125.2K