Gnihton
4.7K posts


Qwen 3.6 is here, and open-source! Run it locally with improved agentic coding capabilities. Try it with Claude Code: ollama launch claude --model qwen3.6 Try it with OpenClaw: ollama launch openclaw --model qwen3.6 Run it: ollama run qwen3.6







Introducing Gemini 3.1 Flash TTS 🗣️, our latest text to speech model with scene direction, speaker level specificity, audio tags, more natural + expressive voices, and support for 70 different languages. Available via our new audio playground in AI Studio and in the Gemini API!























We forked the leaked Claude Code source and made it work with ANY LLM: GPT, DeepSeek, Gemini, Llama, MiniMax. Open source. The name is OpenCode

Biz de aynı paper üzerinden (TurboQuant, arXiv:2504.19874), aynı günlerde başladık. tq-kv sıfırdan Pure Rust standalone library + inference engine. Çoğu implementasyon llama.cpp fork'u olarak yazılıyor, sadece llama.cpp kullananlar faydalanabiliyor. Biz bağımsız kütüphane yaptık. cargo add tq-kv ile projene eklersin. Rust, C, Python fark etmez. GGUF quantized modellerde herkes patladı biliyorsunuz. Modeli sıkıştırıp küçültünce KV cache compression da üstüne binince çıktı çöp oluyor. 3-Fix framework'ü tam bunun için yazdık. Model sıkıştırılmış halde bile anlamlı cevap veriyor, +17% PPL ile coherent output alıyoruz. Hız: projection 115x, attention 8.9x. 102 test, CUDA + CPU. crates.io'da v0.5.0 yayında. github.com/onur-gokyildiz…












