DeepSeek-V3-0324 resmen tanıtıldı! İşte tüm yenilikler
Çin merkezli yapay zeka teşebbüsü DeepSeek, MIT lisansı ile yayınladığı yeni büyük lisan modeli DeepSeek-V3-0324’ü kullanıcıların erişimine açtı. Model, Hugging Face platformunda fiyatsız olarak indirilebiliyor ve ticari kullanım için de büsbütün açık …

Çin merkezli yapay zeka teşebbüsü DeepSeek, MIT lisansı ile yayınladığı yeni büyük lisan modeli DeepSeek-V3-0324’ü kullanıcıların erişimine açtı.
Model, Hugging Face platformunda fiyatsız olarak indirilebiliyor ve ticari kullanım için de büsbütün açık durumda.
Yeni DeepSeek-V3-0324 görücüye çıktı
641 gigabayt boyutundaki model, bilhassa tüketici sınıfı donanımlarda çalışabilir olmasıyla dikkat çekiyor.
Apple’ın M3 Ultra çipine sahip Mac Studio aygıtlarında bile meselesiz halde çalıştığı belirtilen teknoloji, 685 milyar parametreli bir yapıya sahip.
Türkiye’de listeler yapılıp kardeş kardeşle uğraşırken; Amerika’nın yapay zeka üstünlüğüne yenilmek istemeyen Çin, DeepSeek-V3-0324’ü duyurdu!
Yeni sürüm; daha güçlü akıl yürütme, etkileyici ön yüz geliştirme ve gelişmiş araç kullanımı ile MMLU-Pro’da %81.2, AIME’de %59.4 gibi… pic.twitter.com/LrOaoLmgRC
— Hakkı Alkan (@hakki_alkan) March 25, 2025
Yapay zeka araştırmacısı Xeophon, bu modelin Anthropic’in Claude Sonnet 3.5 modeline önemli bir rakip olabileceğini belirtiyor.
Bilhassa Sonnet’in abonelikle sunulmasının bilakis, DeepSeek-V3-0324’ün büsbütün fiyatsız bir halde erişilebilir olması büyük fark yaratacak.

ChatGPT kullanmak yalnızlık hissini artırıyor!
Pekala neden?
Yapılan bir araştırmaya nazaran, ChatGPT kullanmak kimi şahıslarda yalnızlık hissini artırıyor.
Bu durum, birçok tasaya yol açtı.
Model, Mixture of Experts (MoE) mimarisine dayanıyor.
Klâsik büyük lisan modellerinin bilakis, DeepSeek-V3-0324 sırf en gerekli parametreleri aktifleştiriyor. 685 milyar parametreden sadece yaklaşık 37 milyarı etkin hale getiriliyor.
Bu yaklaşım, hesaplama müddetini önemli halde azaltırken performanstan da ödün vermiyor.
Performans testlerinde, daha büyük ve daha ağır aktifleştirme yapan modellerle epey benzeri sonuçlar elde edildi.
DeepSeek-V3-0324 ayrıyeten Multi-Head Latent Attention (MLA) ve Multi-Token Prediction (MTP) üzere iki değerli yenilik içeriyor.
MLA, uzun metinler ortasında bağlamı muhafaza yeteneğini geliştirirken, MTP her adımda birden fazla token üretme imkanı sağlıyor.
Bu teknolojiler, modelin çıktı suratını yaklaşık yüzde 80 oranında artıracak.
Apple araştırma kümesinden Awni Hannun, modeli Mac Studio üzerinde test ederek saniyede yaklaşık 20 token suratında çıktı ürettiklerini açıkladı.
Kullanıcılar, modelin irtibat şeklinde evvelki sürümlere kıyasla bariz bir değişiklik olduğunu belirtiyor.
Daha evvel insan gibisi ve konuşkan bir tona sahip olan DeepSeek modellerinin bilakis, V3-0324 daha resmi ve teknik bir üsluba sahip.
DeepSeek’in bu atılımı, büyük lisan modelleri ortasındaki rekabeti yeni bir boyuta taşıdı.
Pekala siz bu mevzu hakkında ne düşünüyorsunuz?
Görüşlerinizi aşağıdaki yorumlar kısmından bizimle paylaşabilirsiniz.