Yerli teknoloji girişimi VNGRS, yapay zeka alanında dikkat çeken yeni bir adım attı. Şirket, tamamen Türkçe odaklı büyük dil modeli “Kumru”yu tanıttı. Henüz erken geliştirme aşamasında olmasına rağmen Kumru, sahip olduğu teknik özelliklerle büyük ilgi uyandırdı.
45 günlük eğitim süreci
Kumru, 45 gün süren ön eğitim aşamasında NVIDIA H100 ve H200 GPU’ları üzerinde 500 GB’lık veri ile eğitildi. Modelin temeli Mistral-v0.3 üzerine kuruldu ve Meta’nın LLaMA-3 modelinden de faydalanıldı. Bu süreçte 300 milyar token üzerinden ön eğitim yapıldı, ardından 1 milyon örnek ile ince ayar süreci tamamlandı. Böylece Kumru’nun yüksek doğruluk ve dil anlama kapasitesine ulaşması sağlandı.
Düşük donanımda çalışabilen Türkçe yapay zeka
Kumru’nun en dikkat çekici yanı, yalnızca 16 GB VRAM kapasitesine sahip ekran kartlarında bile yerel olarak çalışabilmesi. Bu özellik sayesinde kurumlar, yapay zekayı kendi sunucularında düşük maliyetle kullanabilecek.
Örneğin; LLaMA-3.3’ün 70 milyar parametreli versiyonunu çalıştırmak için yaklaşık 140 GB VRAM gerekirken, Kumru yalnızca RTX A4000 veya RTX 3090 gibi bir GPU ile çalışabiliyor. Bu da maliyetin 60 bin dolardan yaklaşık 2 bin dolara düşmesi anlamına geliyor.
Performans ve yetenekler
Kumru, tıpkı ChatGPT gibi metin tabanlı bir yapay zeka modeli.
Metin yazma, araştırma yapma, belge özetleme, soru-cevap ve kodlama gibi görevlerde kullanılabiliyor. VNGRS, modelin özellikle belge işleme ve özetleme alanlarında güçlü sonuçlar verdiğini belirtiyor.
Kumru, 8.192 Türkçe token desteğiyle ortalama 20 sayfalık A4 belgeyi tek seferde işleyebiliyor. İngilizce metinleri de anlayan model, çok dilli içerik üretimi ve analizinde avantaj sağlıyor.
Test sonuçlarında rakiplerini geçti
Kumru, Türkçe dil modelleri için oluşturulan performans testi Cetvel’de 26 farklı kategoride değerlendirildi.
Bu testler; dil bilgisi düzeltme, belge özetleme, metin sınıflandırması, doğal dil çıkarımı, çeviri ve soru-cevap gibi alanları kapsıyor.
Sonuçlara göre Kumru, ortalama puanlarda rakip modellerin önüne geçti. Henüz erken aşamada olmasına rağmen bu performans, modelin gelişim potansiyelini ortaya koyuyor.
Kumru’nun hafif versiyonu: Kumru-2B
VNGRS, Kumru’nun daha küçük bir versiyonunu da geliştirdi: Kumru-2B.
Bu model, Kumru-7B ile aynı eğitim sürecinden geçti ancak çok daha düşük donanım gereksinimiyle dikkat çekiyor.
Yalnızca 4,8 GB bellek ihtiyacı duyan Kumru-2B, mobil cihazlarda bile çalışabiliyor. Model, şu anda HuggingFace platformunda erişime açık durumda.
Kumru, Türkçe doğal dil işleme alanında önemli bir dönüm noktası olabilir. Düşük donanım gereksinimi, yerli geliştirme süreci ve erken aşamada gösterdiği yüksek performans, Türkiye’nin yapay zeka ekosisteminde rekabet gücünü artırma potansiyeline işaret ediyor.