Aydın Han

3

478

Aydın Han@aydinhan·26 Eki

@AlicanKiraz0 Elinize sağlık.

Türkçe

0

2

780

Alican Kiraz@AlicanKiraz0·26 Eki

Selamlar Dostlar 🧡🙏🏻 Türkçe model projemin ilk fazında gelişmiş ve yüksek reasoning ile 100-120GB'lik Türkçe crawling datasetim'den RAG ve model distill ile ürettiğim Türkçe SFT Datasetin ilk versiyonunu yayınladım. Bu versiyonda 30 Milyon tokenlik veri bulunuyor, bu veriler kompleks soru ve yanıtları içeren bir yapıda yer alıyor. 🙏 Yüksek muhakeme modunda çalıştırılan birden fazla state-of-art modelden sentezlendi (yaklaşık paylar): ➕ xAI Grok 4 — %25 ➕ Anthropic Claude Opus 4.1 — %10 ➕ Anthropic Claude Sonnet 4.5 — %20 ➕ OpenAI gpt-oss-120b (reasoning high) — %30 ➕ TogetherAPI — Kimi-K2-0905 (non‑reasoning) — %15 Ek olarak, toplam verinin %30’u gpt-oss-120b ile lokalde; ~100–120 GB’lik Türkçe crawling veri gövdesi üzerinde RAG + distill yaklaşımlarıyla üretilmiştir. Bu bölüm, Türkçe bağlam çeşitliliğini ve gerçekçi görev formülasyonlarını artırmayı hedefler. İçerik 12 ana yetkinlik ailesini kapsar: ➕ Aritmetik & Kısa Adımlı Muhakeme ➕ Talimat İzleme / Biçim Dayatması ➕ Çok-Tur Bellek & Çekirdek Başvuru ➕ Dürüstlük/Halüsinasyon & Güvenli Ret ➕ Türkçe Dil Kenar Durumları ➕ Kod ve Mini Debug ➕ Uzun-Bağlam Disiplin & Hedefli Çıkarım ➕ Araç Kullanımı Bilinci ➕ Talimat Takip Disiplini; Çoklu Kısıtlama, Format Dayatma, Sıralı İşlemler, Çelişkili Talimatlar, Format İhlali Puanlama ➕ Mantık ve Tutarlılık; Çelişki Kontrolü, Geçişlilik, Sayma Paradoksları, Kendine Referans, Klasik Mantık Hataları, Multi-Hop Reasoning, Tutarsızlık Tespiti ➕ Güvenlik ve Dürüstlük Bilgi Sınırı Testleri, Halüsinasyon Tuzakları Zararlı İçerik Reddi, Bilgi Doğrulama, Etik Sınır Testleri, Politik/Hassas Konular, Manipülasyon Testleri, vb. ➕ Yaratıcı Dönüşüm ve Transfer; Stil Transferi, Analoji Üretimi, Format Dönüşümleri, Ters Problem Çözme huggingface.co/datasets/Alica…

Türkçe

30

22

462

71.3K

Aydın Han@aydinhan·16 Eki

@denizoktar @refiksaydaam Tabi, bu tip önerilere açığız. Örneğin bir süredir Boğaziçi ile bazı projelerde işbirliği yapıyoruz. Başka üniversitelerle de çalışabiliriz. Bana özelden veya Linkedin’den ulaşabilirsiniz.

Türkçe

0

1

119

Deniz OKTAR@denizoktar·16 Eki

@refiksaydaam Selamlar, tabii. Üniversitelerle birlikte epey çalışma yaptık. @aydinhan

Türkçe

2

0

2

186

Deniz OKTAR@denizoktar·15 Eki

Sanirim simdi anladim problemi. Ekteki gorselde kamuya acik sekilde paylasilan derken acik kaynak olarak paylasimimizi kastediyorduk. Kamu deyince, halk sekilde anlasildi sanirim. Yayinda kelimesi de benzer, hugginface den bahsediyorduk. Kucuk bir kaza yapmisiz :)

Türkçe

20

0

105

16.2K

Aydın Han@aydinhan·16 Eki

@AlicanKiraz0 Elinize sağlık, merakla bekliyoruz.

Türkçe

Alican Kiraz@AlicanKiraz0

0

2

265

Alican Kiraz@AlicanKiraz0·15 Eki

Testler için ilk olarak bir Türkçe benchmark dizayn etmeye başladım. Benchmark’da 3 farklı Tier olacak. Her Tier’da farklı yetenekleri sınayacağım. Bütçemide ayarladım; 15 açık kaynak, 10’a yakın ticari modeli test edeceğim; - Claude: Opus 4.1, Claude 4.5 - Openai: GPT-5-nonthinking GPT-5 Thinking-low, GPT-5 Thinking-hard - Gemini: Gemini 2.5-Pro, Gemini 2.5-flash - Grok: Grok-4 - Manus: Agent, Chat Diğer benchmark’lardan farklı olarak HF’de hem Leaderboard hemde test için space ortamı oluşturacağım.

Kumru’nın misyonu beni çok mutlu etti. O nedenle naçizane bir katkım olsun istedim. Kumru 2B-Base modelini basit’ten zora doğru şaşırtmalı türkçe soru setleri ile test etmeye ve modelin giriş çıkış katmanları, CoT yetenekleri ile context bağlam sorunlarını analiz etmeye başladım. Ardından en uygun dataseti hazırlayıp hem CPT hemde SFT ile train edeceğim. Hazırladığım dataset ve model çıktılarını huggingface’imde paylaşıyor olacağım. 🙏🏻🧡 Lokalimdeki kendi geliştirdiğim LLM Distill odaklı Otonom RLHF (SEAL benzeri bir kurgu kullandım) ile de state-of-art modellere değerlendirmeler yaptırarak yoğun bir pekiştirmeli eğitim vereceğim. Bence Kumru’nun asıl misyonuda buydu. Billion seviyelerindeki eşiği türkçe dataset ile sıfırdan eğiterek aşıp, bizlerle paylaşarak hepimizin destekleriyle iyi bir noktaya gelmesini sağlamak. Baktığımızda zaten llama2’lerden Kimi-K2’lere kadar uzanan open-source’un gücüde bize bunu gösteriyor. Umarım katma değerli işler çıkar. Ben şahsen 2x5090’ı birkaç hafta Kumru’ya odaklayacağım. 🔥

Türkçe

4

1

72

13.5K

Aydın Han@aydinhan·14 Eki

Kumru kullanımı dün azalır diye bekliyorduk ama aksine 3 katına çıkmış. Pazartesi günü toplam 510 bin diyalog yapılmış. 2,3 milyon mesaj atılmış.

Aydın Han@aydinhan

Günü 160.000 ile kapattık. Bunun 60.000’i son 3 saatte yapıldı.

Türkçe

5

1

50

13.4K

Aydın Han@aydinhan·13 Eki

Kumru 2B modelin ilk gerçek kullanım senaryosu gelmiş

Said Sürücü@yapayzekahocasi

Huggingface'teki Kumru 2B modelini denedim. 1+1 sordum bilemedi gibi yorumlardan siz de bıktıysanız LLM'lerin gerçek kullanım amacı ve gerçek bir kullanım senaryosunda durum ne anlatayım. Legal tech projem için lokal olarak hukuki doküman redakte edecek bir sistem üzerinde çalışıyordum. Daha önce ne Huggingface'teki Türkçe NER modelleri ne de multilingual 7B parametreli modeller ile istediğim sonucu alamadım. İstediğim sonucu almak için multilingual LLM'ler ile 12-14B parametreye kadar çıkmam gerekiyordu ama Kumru 2B istediğim verileri redakte etmeyi başardı. Üstelik gayet makul bir VRAM kullanımı ile. Teşekkürler @VNGRS.

Türkçe

20

3K

Aydın Han@aydinhan·13 Eki

@avsKoroglu @sengpt Not aldım, inceleyeceğim.

Türkçe

1

429

Samet Köroğlu@avsKoroglu·13 Eki

@aydinhan @sengpt io.net gibi servisleri incelemenizi öneririm, çok daha ucuz

Türkçe

0

1

456

sengpt@sengpt·12 Eki

Kumru 250 bin dolara mal olmuş. Kurucusunun da şöyle bir tweetine denk geldim: “kumru bir yan ürün, kar etmesi olası değil” Bu durumda kar etmeyecek yan bir ürün için 250k harcamış bir şirket var karşımızda: O zaman burada strateji: - 250k ile hem dünyada hem Türkiye’de ilk Türkçe LLM alanında isim yapmış olmak. Kısa vadede getirisi yok, uzun vadede olabilir. Ama sonu mistral gibi de olabilir zira bir sonraki aşamaya geçmek daha çok maliyet gerektirir, ya da onu da ilk Türk LLM olmanın verdiği prestijle fon toplayarak yapabilirler. - LLM alanında adlarını duyurmuş oldular bu reklam onlara 250kdan daha fazlasını getirebilir - eldeki boşta bekleyen h100 makineleri boşa yakmasın bari bişeler yapsın diye kullanmış olabilirler Burada iyi kötü tartışmasına hiç girmedim. Elbette çok iyi bir ilk adım. Kötü diyenler zaten bu işten anlamıyordur. Bu ülke Google’ı customize edip yerli ve milli arama motoru diye pazarlayanlar gördü. Kumru en azından öyle bir şey değil. Arkasında emek ve para olan güzel bir başlangıç projesi gibi duruyor.

Türkçe

31

19

680

139.4K

Aydın Han@aydinhan·13 Eki

@Umut3002_ @sengpt Çünkü daha küçük bir yatırımla çözebileceğimiz bir ihtiyacı hedefledik. Son kullanıcıya yönelmek ve yerli ChatGPT yapmak çok daha büyük yatırım gerektirir. Bizim gibi bir şirketin imkanlarını çok aşar.

Türkçe

2

364

Tumu@tumuvay·13 Eki

@aydinhan @sengpt Hocam, biliyorum muhtemelen cevap vermeyeceksiniz ama yine de sormak istedim. Neden kurum içi bir model geliştirmeyi tercih ettiniz? Türkiye’de hala ChatGPT gibi yerli bir yapay zeka geliştirilemedi. Kurum içi modelden vazgeçip kullanıcı odaklı bir yapıya yönelme planınız var mı?

Türkçe

0

399

Aydın Han@aydinhan·13 Eki

@sengpt Çok teşekkürler.

Türkçe

2.5K

sengpt@sengpt·13 Eki

@aydinhan Eyvallah. Elinize sağlık güzel bir başlangıç olmuş.

Türkçe

0

14

10.9K

Aydın Han@aydinhan·13 Eki

@oguzergin Çok teşekkürler.

Türkçe

225

Oğuz Ergin@oguzergin·12 Eki

Denedim, çabayı da adını da beğendim. Bir sonraki sürümün adı tantuni olsun ;)

Öncelikle Kumru’ya gösterdiğiniz yoğun ilgi için çok teşekkür ederiz. Biz de bu kadarını beklemiyorduk, çok mutlu olduk. Ek olarak Kumru ile ilgili daha detaylı bilgi vermek ve bazı noktaları netleştirmek istedik. Öncelikle Kumru bir ChatGPT alternatifi değil. Kumru’yu son kullanıcıya yönelik değil kurum içi senaryolar için geliştirmeye devam ediyoruz. Henüz versiyon 0.2.1 ve şu an için yetkinlikleri sınırlı. Web sayfası Kumru’yu sadece denemek için hazırlanmış bir arayüz, ürünün kendisi değil. Bu sebeple lütfen Kumru’dan ChatGPT’nin yaptığı şeyleri beklemeyin, yetkinlikleri ve yapım amaçları farklı. Kumru’nun matematiğinin zayıf olması konusuna da değinmek isteriz 🙃 Kumru Türkçe yetkinlik için geliştiriliyor, henüz matematiksel işlem ve karar vermek gibi fonksiyonel işlemler için eğitilmedi. Dolayısıyla bu bağlamda da ChatGPT/Gemini alternatifi değil. Altta Kumru’yla ilgili en çok merak edilenleri cevapladık, buyrun flood’ımıza 🐦

Türkçe

3

1

105

13.1K

Aydın Han@aydinhan·13 Eki

@buraksu42 Çok teşekkürler.

Türkçe

1

190

Aydın Han@aydinhan·13 Eki

@celikturgay Makaleyi yazma planımız var ama henüz sıra gelmedi. Sadece blog post yayınladık şimdilik.

Türkçe

1

85

Turgay Çelik@celikturgay·12 Eki

Başka tweet’te maliyetimiz 250K dolar demişler, bu paraya dedikleri gibi Mistral’i sadece mimari olarak kullanan 7B parametreli bir modeli sıfırdan eğitmek mümkün mü emin değilim. Spekülasyona yer vermemek için deepseek’in yaptığı gibi makalesini yayınlasalar iyi olurmuş.

Sıfırdan geliştirilen model ne demek?  Daha önce hiçbir veriye maruz kalmamış bir yapay zeka modelinin sıfırdan inşa edilip tüm eğitim süreçlerinden geçirilip eğitilmesi anlamına geliyor. Yani boş bir arsa alıp üstüne kaba mimari planı olan bir binayı, istediğiniz malzemeyi kullanarak, detay tasarım kararlarını vererek sıfırdan inşa etmeye benziyor. Bunun alternatifi; LLaMA, Gemma, Qwen gibi aynı anda pek çok dilde eğitilmiş modelleri alıp istenen dilde ya da alanda bir miktar daha eğitmek ve ince ayar yapmak. Bu da hazır bir binayı alıp renove etmeye benzetilebilir, ancak bunun da dezavantajları var ve biz de bu sebeple ilkini seçtik.

Türkçe

0

2

479

Aydın Han@aydinhan·13 Eki

Günü 160.000 ile kapattık. Bunun 60.000’i son 3 saatte yapıldı.

Deniz OKTAR@denizoktar

Bugün Kumru 100.000 diyalog yapmış.

Türkçe

3

0

20

13.9K

Aydın Han@aydinhan·12 Eki

@aykuterdemml Çok teşekkürler.

Türkçe

100

Aykut Erdem@aykuterdemml·10 Eki

Emeklerinize sağlık!

🕊️ Kumru şimdi yayında! Türkçe için sıfırdan eğitilmiş ve kamuya açık şekilde paylaşılan ilk büyük dil modeli Kumru LLM ile tanışın! Kumru, Türkçe doğal dil işleme alanında güçlü, verimli ve özelleştirilebilir bir çözüm sunarak yerelleştirilmiş yapay zekâ deneyiminde yeni bir dönem başlatıyor. 7.4 milyar parametreye sahip model, tamamen Türkçe için eğitilen tokenizer’ı sayesinde çok dilli modellere göre %90’a kadar daha verimli çalışıyor. 300 milyar token ve 500 GB veriden oluşan eğitim setiyle Kumru, Türkçeyi sadece bilmekle kalmıyor, dilin doğal akışını da anlıyor. Araştırmadan kurumsal uygulamalara kadar geniş bir kullanım alanı sunan Kumru; RAG tabanlı chatbot sistemlerinden doküman özetlemeye, çağrı merkezi analitiğinden sosyal medya içerik üretimine kadar pek çok senaryoya kolayca entegre edilebiliyor. 🌐 Kumru’yu keşfedin: kumru.ai 📄 Teknik detaylar: medium.com/vngrs/kumru-ll… ve huggingface.co/vngrs-ai/Kumru… 📩 Kurum içi dağıtım, özel entegrasyonlar veya fine-tuning ihtiyaçları için bizimle iletişime geçebilirsiniz: info@vngrs.com Kumru ile Türkçede yapay zekâ artık daha akıllı, daha hızlı, daha güçlü. @denizoktar @aydinhan @meliksah_turker #Kumru #LLM #TürkçeLLM #YapayZeka #VNGRS

Türkçe

0

13

1.3K

Aydın Han@aydinhan·12 Eki

@eokayakca Teşekkürler.

Türkçe

1.3K

Aydın Han retweetledi

VNGRS@VNGRS·12 Eki

Öncelikle Kumru’ya gösterdiğiniz yoğun ilgi için çok teşekkür ederiz. Biz de bu kadarını beklemiyorduk, çok mutlu olduk. Ek olarak Kumru ile ilgili daha detaylı bilgi vermek ve bazı noktaları netleştirmek istedik. Öncelikle Kumru bir ChatGPT alternatifi değil. Kumru’yu son kullanıcıya yönelik değil kurum içi senaryolar için geliştirmeye devam ediyoruz. Henüz versiyon 0.2.1 ve şu an için yetkinlikleri sınırlı. Web sayfası Kumru’yu sadece denemek için hazırlanmış bir arayüz, ürünün kendisi değil. Bu sebeple lütfen Kumru’dan ChatGPT’nin yaptığı şeyleri beklemeyin, yetkinlikleri ve yapım amaçları farklı. Kumru’nun matematiğinin zayıf olması konusuna da değinmek isteriz 🙃 Kumru Türkçe yetkinlik için geliştiriliyor, henüz matematiksel işlem ve karar vermek gibi fonksiyonel işlemler için eğitilmedi. Dolayısıyla bu bağlamda da ChatGPT/Gemini alternatifi değil. Altta Kumru’yla ilgili en çok merak edilenleri cevapladık, buyrun flood’ımıza 🐦

Türkçe

94

907

190.7K

Aydın Han@aydinhan·11 Eki

@legacy_of_zero @VNGRS Hayır, fine-tune etmedik. Mimariyi kullanmak ile hazır modeli fine-tune etmek farklı şeyler. Bu gibi merak edilen noktalar için Sıkça Sorulan Sorular kısmı ekledik. Orada daha fazla detay bulabilirsiniz: kumru.ai/hakkinda

Türkçe

1

248

Legacy@legacy_of_zero·11 Eki

@VNGRS Hazır modeli fine tune ettiniz yani. Neden qwen kullanmadınız

Türkçe

0

1

851

VNGRS@VNGRS·9 Eki

🕊️ Kumru şimdi yayında! Türkçe için sıfırdan eğitilmiş ve kamuya açık şekilde paylaşılan ilk büyük dil modeli Kumru LLM ile tanışın! Kumru, Türkçe doğal dil işleme alanında güçlü, verimli ve özelleştirilebilir bir çözüm sunarak yerelleştirilmiş yapay zekâ deneyiminde yeni bir dönem başlatıyor. 7.4 milyar parametreye sahip model, tamamen Türkçe için eğitilen tokenizer’ı sayesinde çok dilli modellere göre %90’a kadar daha verimli çalışıyor. 300 milyar token ve 500 GB veriden oluşan eğitim setiyle Kumru, Türkçeyi sadece bilmekle kalmıyor, dilin doğal akışını da anlıyor. Araştırmadan kurumsal uygulamalara kadar geniş bir kullanım alanı sunan Kumru; RAG tabanlı chatbot sistemlerinden doküman özetlemeye, çağrı merkezi analitiğinden sosyal medya içerik üretimine kadar pek çok senaryoya kolayca entegre edilebiliyor. 🌐 Kumru’yu keşfedin: kumru.ai 📄 Teknik detaylar: medium.com/vngrs/kumru-ll… ve huggingface.co/vngrs-ai/Kumru… 📩 Kurum içi dağıtım, özel entegrasyonlar veya fine-tuning ihtiyaçları için bizimle iletişime geçebilirsiniz: info@vngrs.com Kumru ile Türkçede yapay zekâ artık daha akıllı, daha hızlı, daha güçlü. @denizoktar @aydinhan @meliksah_turker #Kumru #LLM #TürkçeLLM #YapayZeka #VNGRS

Türkçe

117

130

894

700.8K

Aydın Han retweetledi

merve@mervenoyann·11 Eki

Kumru-2B, base ve instruct olarak eğitildiği web corpus'uyla birlikte @huggingface'te trending ilk sayfada 👏 7B ve multimodal da geliyor çok büyük gurur kaynağı 🇹🇷🦜