
santos
946 posts







We’ve partnered with @nebiusai to bridge the gap between open-source models and production-scale deployment.🤝 Scaling architectures like MoE or sparse attention often pulls teams into weeks of “plumbing” — GPU orchestration, latency tuning, manual scheduling — work that adds zero core product value. We’re now putting optimized versions of models like DeepSeek, Qwen, and Llama directly into Token Factory. ⚙️ So teams don’t have to rebuild the whole stack every time. Focus on the product, not the infra. 👉Read the full case study: eigenai.com/blog/2026-03-1… #AI #LLMs #AIInfrastructure #Inference #Builders












Bugün $NBIS hakkında birçok haber yayınlandı. Crowdstrike partnerliği, convertible notes duyurusu, startup ekosistemi destekleri vb. Fakat benim için en önemli duyuru bu olabilir: Nebius ve Eigen AI, Token Factory'de sunulan açık-kaynaklı modellerin çıktı hızını arttırmak için işbirliği kurdukları açıklandı. Bu yatırımcılar için ne demek, kısaca anlatayım: Nebius'un Token Factory platformundaki en büyük problem, AI modellerini çalıştırırken çıktı hızında geride kalması. Görseldeki Kimi 2.5 modelinde görebileceğiniz üzere, $NBIS modeli daha ucuzdan sağlayabilse de, "Speed" ve "End-to-End Response Time" parametrelerinde geride kalıyor. FireworksAI, TogetherAI gibi rakipler daha pahalıya da olsa çok daha hızlı modeli çalıştırabiliyorlar. Fakat Eigen AI ile olan işbirliği bu problemi ortadan kaldırıyor. Görselde görebileceğiniz üzere, hız parametrelerinde ilk 2'ye giren platform Eigen AI. Nebius'un işbirliği yaptığı isim. Eigen AI'ın optimize edilmiş ve daha hızlı modelleri, Token Factory'ye eklenecek. Böylelikle $NBIS'in platformunda Eigen AI sayesinde çok hızlı çalışan fakat (tahminimce) biraz daha pahalı olan modeller bulunacak. Muhtemelen (spekülasyon) EigenAI'ın sağladığı daha hızlı modeller, base modellere göre daha pahalı olacak. Bu pahalılık, EigenAI'ın aldığı kâr payından kaynaklı (benim tahminim). Böylece müşteriler "daha ucuz fakat daha yavaş" vs. "daha pahalı fakat daha hızlı" modeller arasında seçim yapabilecek. Burada önemli bir avantaj daha var. Eigen AI'ın optimize edilmiş modelleri aynı çıktı (cevap) için daha az GPU kapasitesi, elektrik, hafıza kullanıyor. Bu da Nebius için "çıktı-başına-maliyet" yani unit economics'i düşürüp, brüt marjların iyileşmesini sağlıyor. Bu sayede, EigenAI'ın modellerini çalıştırmak, Nebius için belki daha da kârlı olabilir. EigenAI'ın bu denklemden nasıl ve ne kadar kazandığına göre bu değişebilir. EigenAI'ın kâr marjını Nebius yerine müşteri (premium fiyat ödeme yoluyla) karşılıyorsa, bu tahmin çok olası. Kısaca, EigenAI'ın çok hızlı AI modelleri, Nebius Token Factory'ye eklenerek, müşterilerin seçim özgürlüğünü arttırıyor. Kullanıcı, strateji/bütçe/işyükü'ne göre "pahalı + hızlı" ve "ucuz + yavaş" modeller arasında seçim yapabiliyor. Aynı zamanda Nebius'un unit economics'ini de iyileştirme potansiyeline sahip.












Open models are improving fast. Running them efficiently in production is still hard. @nebiustf × @Eigen_AI_Labs are partnering to bring optimized frontier open models to Token Factory. DeepSeek, GPT-OSS, Kimi, Qwen, Llama, GLM and more, optimized for speed and efficiency at scale. High-performance open model inference without building the optimization stack yourself. Read more: nebius.com/blog/posts/neb…


Open models are improving fast. Running them efficiently in production is still hard. @nebiustf × @Eigen_AI_Labs are partnering to bring optimized frontier open models to Token Factory. DeepSeek, GPT-OSS, Kimi, Qwen, Llama, GLM and more, optimized for speed and efficiency at scale. High-performance open model inference without building the optimization stack yourself. Read more: nebius.com/blog/posts/neb…






