Yapay Zekâda Yerli Atılım: Türkçe Dil Modeli 'Kumru' Tanıtıldı
Türkiye'nin yazılım ve yapay zekâ ekosisteminde önemli bir gelişme yaşandı.
Kumru’nun Geliştirilme Süreci: 500 GB Veri ve 300 Milyar Token
VNGRS tarafından yapılan açıklamaya göre, Kumru’nun ön eğitim süreci NVIDIA’nın H100 ve H200 GPU’ları kullanılarak gerçekleştirildi. Model, 45 günlük bir eğitim sürecinde 500 GB’lık veri üzerinde eğitildi.
Yapay zekâ modelinin temelinde Mistral-v0.3 mimarisi yer alırken, ek olarak Meta’nın LLaMA-3 altyapısından da yararlanıldı. Eğitim aşamasının sonunda model, yaklaşık 300 milyar token ile doğal dil işleme konusunda derin bir kapasite kazandı.
Daha sonra Kumru, 1 milyon örnekle yapılan ince ayar (fine-tuning) sürecine alındı. Bu aşama sayesinde, modelin Türkçe dil yapısına, deyimlere ve günlük konuşma kalıplarına daha duyarlı hale gelmesi sağlandı. Böylece hem yazılı hem sözlü iletişimde daha insana yakın tepkiler verebilen bir sistem geliştirildi.
Yerel Bilgisayarlarda Çalışabilen Türkçe Yapay Zekâ
Kumru’yu benzerlerinden ayıran en dikkat çekici özelliklerden biri, bulut bağlantısına ihtiyaç duymadan çalışabilmesi. VNGRS, modeli optimize ederek sıradan dizüstü ve masaüstü bilgisayarlarda bile yerel olarak kullanılabilir hale getirdi.
Bu özellik, özellikle veri gizliliği ve güvenliği açısından büyük önem taşıyor. Kullanıcılar, verilerini bulut sunuculara aktarmadan kendi cihazlarında işlem yapabilecek. Böylelikle hem kişisel bilgiler hem de kurumsal veriler korunmuş olacak.
VNGRS yetkilileri, Kumru’nun bu yönüyle yalnızca bir yapay zekâ modeli değil, aynı zamanda Türkiye’nin dijital bağımsızlığına katkı sağlayacak stratejik bir proje olduğunu vurguluyor.
Yapay Zekâda Türkçe’nin Gücü Artıyor
Yapay zekâ modellerinin büyük çoğunluğu İngilizce veya çok dilli veri setleriyle eğitildiği için Türkçe, uzun süre bu alanda geri planda kalmıştı. Kumru, bu açığı kapatmayı hedefleyen en kapsamlı Türkçe dil modeli olarak öne çıkıyor.
Model, metin üretimi, özetleme, soru-cevap, duygu analizi, çeviri ve bilgi çıkarımı gibi birçok alanda test edildi. İlk sonuçlara göre Kumru, Türkçe’nin dil yapısına uygun cümle kurma ve bağlamı doğru anlama konusunda yüksek doğruluk oranı sergiledi.
VNGRS ekibi, Kumru’nun sadece Türk kullanıcılar için değil, Türkçe ile çalışan uluslararası şirketler ve araştırma kurumları için de önemli bir kaynak olacağını belirtiyor. Şirket ayrıca modelin açık kaynak sürümünü paylaşarak, akademisyenlerin ve bağımsız geliştiricilerin katkı sağlamasını teşvik etmeyi planlıyor.
Türkiye’nin Yapay Zekâ Ekosistemine Yeni Soluk
Kumru’nun geliştirilmesi, Türkiye’nin yapay zekâ alanındaki yerli girişimlerinin geldiği noktayı göstermesi açısından büyük önem taşıyor. Projenin arkasındaki VNGRS ekibi, modelin ilerleyen dönemlerde görsel analiz, konuşma tanıma ve çok modlu yapay zekâ yetenekleriyle genişletileceğini açıkladı.
Ayrıca Kumru’nun kamu kurumlarında belge yönetimi, çağrı merkezlerinde müşteri desteği, medya kuruluşlarında içerik üretimi ve eğitim teknolojilerinde kişiselleştirilmiş öğrenme çözümleri gibi farklı alanlarda kullanılabileceği belirtiliyor.
Türkçe diline özgü yapısı ve yerli altyapısı sayesinde Kumru, yalnızca teknolojik değil, kültürel bir yapay zekâ adımı olarak değerlendiriliyor.
Kaynak: Zeki Ersin Yıldırım
Bakmadan Geçme