
Used Codex Cli to profiled Qwen 3.5 9B Dense (Unsloth's UD-IQ3_XXS via llama.cpp) for Hermes Agent Tuning: > context length > batch size > tokens/sec > peak memory To squeeze every last drop out of an 8GB VRAM card
Bahaa / 博瀚
13.2K posts


Used Codex Cli to profiled Qwen 3.5 9B Dense (Unsloth's UD-IQ3_XXS via llama.cpp) for Hermes Agent Tuning: > context length > batch size > tokens/sec > peak memory To squeeze every last drop out of an 8GB VRAM card




$Nasdaq What if my -/+2 σ Regression Model Channel is trying to tell me something?

Introducing TurboQuant: Our new compression algorithm that reduces LLM key-value cache memory by at least 6x and delivers up to 8x speedup, all with zero accuracy loss, redefining AI efficiency. Read the blog to learn how it achieves these results: goo.gle/4bsq2qI









اتيح لحضراتكم من تقرير المواد الخام الاسبوعي في مخبر برو الجزء المتعلق بوضع الدهب والفضة للاستفادة لأصحاب الاهداف قصيرة الاجل والباحثين عن نقاط سعرية افضل…. **الاشارات الفنية ترجيح محتمل، ولا تعني الجزم بحدوث الشيء ولكن تساعد في استنتاج مقاربة قابلة للتطبيق الاستثماري ** mokhbirpro.com

في الإجازات فرص ذهبية للتعلم 26 محاضرة في الاقتصاد "الكلي والجزئي" والاقتصاد السلوكي بالمجان من جامعة MIT العريقة