Çinli girişim DeepSeek, halihazırda için için yanan uluslararası silahlanma yarışına devasa iki yeni yapay zeka modelini rahat bir tavırla piyasaya “fırlattı”: Gündelik akıl yürütme için inşa edilmiş DeepSeek-V3.2 ve seçkin matematik ve kodlama yarışmalarında önde gelen Amerikan modellerinden daha iyi performans gösterdiği iddia edilen yüksek oktanlı bir varyant olan DeepSeek-V3.2-Speciale. Sadece bununla da kalmayıp, modelleri açık kaynak lisansı altında yayınladılar.
Söz konusu hamleyi dikkate değer kılan sadece modeller ve yetenekleri değil, aynı zamanda nasıl yayınlandıklarıdır. OpenAI ve Google gibi Amerikan firmaları, genellikle pahalı olan, özel API’lere ve en son teknoloji modeller için kırmızı takım (red-team) testlerine dayanan güçlü modellere bel bağlamaktadır. DeepSeek ise açıklığı bir silah haline getirdi.
DeepSeek-V3.2‘nin, kapsamlı mantık yürütme, araç kullanımı ve Uluslararası Matematik Olimpiyatı ile ICPC Dünya Finalleri gibi yarışmalar dahil olmak üzere yoğun problem çözme konularında GPT-5 ve Gemini 3 Pro ile eşleştiği veya onları yendiği bildiriliyor. “Speciale” versiyonu, Harvard-MIT Matematik Turnuvası’nda yüzde 99,2, yazılım hatası düzeltmede yüzde 73 puan aldı ve internet erişimi veya harici araçlar olmadan bile birçok uluslararası kıyaslamada altın madalya sonuçları elde etti.
Bahsi geçen performansın arkasındaki numara, “DeepSeek Sparse Attention” veya DSA adı verilen zekice bir mimari hiledir. Geleneksel transformer modelleri bağlam uzunluğu arttıkça hesaplama açısından şişer ve bir belgedeki her kelimeyi diğer her kelimeye göre değerlendirmek zorunda kalır. DSA, girdinin yalnızca en alakalı kısımlarına odaklanarak, aslında her kelimeyi okumak yerine göz gezdirerek maliyetleri düşürür. Tek başına ilgili yöntem, uzun belgeler için maliyetleri yüzde 70‘e kadar azaltarak modeli nispeten ucuz hale getirir.
Maliyet yapay zeka dağıtımında her şey olduğu için gelişme gerçek insanlar adına önem arz ediyor. Bugün çoğu öncü model ödeme duvarlarının arkasında sıkışıp kalmış durumda ve erişimleri kısıtlı fakat DeepSeek‘in en son modelleri ve onların 128.000 tokenlik bağlam pencerelerini indirmek ve değiştirmek ücretsiz. Tek bir geliştirici veya öğrenci ekibi, sadece birkaç ay önce bir laboratuvar ve devasa bir bulut bütçesi gerektirecek sistemlerle artık denemeler yapabilir.
DeepSeek‘in “thinking in tool-use” (araç kullanımında düşünme) atılımı özellikle dikkat çekicidir. Çoğu yapay zeka ajanı birden fazla aracı idare etmekte zorlanır çünkü her eylem içsel akıl yürütmelerini sıfırlar. DeepSeek, araçlar arasında hafızayı koruyarak sorunu çözdü. Şirket, modeli gerçek web tarayıcıları ve kodlama ortamları gibi araçlarla çalışır hale getirmek için 85.000‘den fazla karmaşık sentetik talimat kullanarak eğitti.
Mevcut sohbet botlarının çoğunun basitçe inşa edilmediği bir gerçek dünya görevi hazırlığı seviyesi söz konusudur. Bir yemek tarifini özetlemek bir şeydir; kod parçacıklarını test ederken ve döviz kurlarını kontrol ederken, birbirine bağlı konaklama ve yemek kısıtlamalarıyla sıkı bir bütçe altında çok günlük bir tatil planlamak başka bir şeydir.
Uluslararası Yapay Zeka Rekabeti
Lisans kurulumu daha da yıkıcı olabilir. DeepSeek, MIT açık kaynak lisansını kullanarak herkesin modellerini kopyalamasını, yeniden düzenlemesini veya ticarileştirmesini yasal olarak mümkün kıldı. Hamle, güvenlik, kötüye kullanım riski ve kurumsal gizliliği gerekçe göstererek model ağırlıklarını fikri mülkiyet olarak koruma yönündeki mevcut eğilime doğrudan ters düşmekte ama açıklık, şeffaflık anlamına gelmez. İşte tam da bu nedenle Alman düzenleyiciler veri aktarımı endişeleri nedeniyle DeepSeek‘i engellemeye çalıştı. İtalya uygulamayı bu yılın başlarında yasakladı ve ABD yasa yapıcıları uygulamanın hükümet cihazlarından tamamen kaldırılmasını istiyor. DeepSeek Çinli bir şirket ve jeopolitik bağlam büyük önem taşıyor ancak DeepSeek‘in modellerinin gerçekten de maliyetin çok altında öncü bir performans sunduğunu ve jeopolitik yükü önemsemediğinizi varsayalım. Amerikan firmaları fiyat farkına değecek tam olarak ne sunuyor?
Şimdilik, DeepSeek‘in “Speciale” varyantı yalnızca geçici bir API aracılığıyla kullanılabilir durumda ancak aralık ortasına kadar daha geniş V3.2 sürümüyle birleştirilecek ve herkesin erişimine açılacak. Küresel yapay zeka yarışı artık sadece özelliklerle ilgili değil; erişim, maliyet ve kontrolle ilgili.
Kaynak: https://www.techradar.com/ai-platforms-assistants/gemini/deepseek-just-gave-away-an-ai-model-that-rivals-gpt-5-and-it-could-change-everything
