1. Anasayfa
  2. Yapay Zeka

Kimi K2.7 Code Tanıtıldı: GPT-5.5 ve Claude’dan 12 Kata Kadar Daha Ucuz

Kimi K2.7 Code Tanıtıldı: GPT-5.5 ve Claude’dan 12 Kata Kadar Daha Ucuz
0

Moonshot AI, programlama görevleri ve ajan tabanlı kodlama iş akışları için özel olarak geliştirilmiş yeni bir yapay zeka modeli olan Kimi K2.7 Code‘u piyasaya sürdü. Selefi olan Kimi K2.6‘nın üzerine inşa edilen bu model, Hugging Face üzerinde açık ağırlıklı bir sürüm olarak erişime açıldı.

Moonshot AI’a göre K2.7 Code, uzun soluklu ve karmaşık yazılım mühendisliği görevlerinde önceki modeli geride bırakacak şekilde tasarlandı. Şirket, kodlama dışındaki genel görevler için ise hâlâ K2.6 modelini öneriyor. Kimi aynı zamanda kodlama aracı sağlayıcısı Cursor’ın değiştirerek yeniden sattığı model. 

K2.6’ya Göre Kazançlar Sağlasa da Liderlerin Hâlâ Gerisinde

Moonshot’ın kendi bünyesindeki Kimi Code Bench v2 testinde performans 50,9’dan 62,0’ye yükseliyor. Modelin performansı Program Bench testinde 48,3’ten 53,6’ya, MLS Bench Lite testinde ise 26,7’den 35,1’e çıkıyor. K2.7 Code, ajan tabanlı performans testlerinde de gelişim göstererek MCP Atlas testinde 76,0’ya (69,4’ten yükselerek) ve MCPMark Verified testinde 81,1’e (72,8’den yükselerek) ulaşıyor.

Buna karşın, GPT-5.5 ve Claude Opus 4.8 ile yapılan doğrudan karşılaştırmalarda K2.7 Code, kodlama testlerinin çoğunda geride kalıyor. Program Bench testinde GPT-5.5 69,1 puan alırken, K2.7 Code 53,6 puanda kalıyor. Kimi Code Bench v2 testinde ise skorlar sırasıyla 69,0 ve 62,0 olarak ölçülüyor. Program Bench özellikle zorlu bir test çünkü buradaki yapay zeka ajanlarının, kaynak koduna erişim, kaynak koda dönüştürme veya internet bağlantısı olmadan, yalnızca derlenmiş bir ikili dosya ve bunun dokümantasyonunu kullanarak bir programın davranışını yeniden üretmesi gerekiyor.

Bu tablonun tek bir istisnası var: Yapay zeka ajanlarını Notion, GitHub, dosya sistemleri, Postgres veritabanları ve Playwright aracılığıyla tarayıcı otomasyonu dahil olmak üzere beş gerçek dünya yazılım ortamında test eden MCPMark Verified testi. K2.7 Code, bu testte Claude Opus 4.8‘i 81,1’e karşı 76,4 puanla geride bırakıyor; ancak 92,9 puan alan GPT-5.5’in oldukça gerisinde kalıyor. Her zaman olduğu gibi, test sonuçları ile gerçek dünya performansının birbirinden farklılaşabileceğini unutmamak gerekiyor.

Bir Trilyon Parametreli ancak Aynı Anda Yalnızca 32 Milyarı Aktif

Model kartına göre K2.7 Code, toplamda bir trilyon parametreye sahip bir Mixture-of-Experts (MoE) mimarisi kullanıyor ancak token başına bu parametrelerin yalnızca 32 milyarı aktif olarak çalışıyor. Toplam 384 uzmana sahip olan modelde, token başına sekiz uzman seçiliyor. Modelin bağlam penceresi uzunluğu ise 256.000 token.

Çok modlu olan model, metnin yanı sıra görselleri ve videoları da işleyebiliyor. Model, MoonViT adı verilen 400 milyon parametreli özel bir görsel kodlayıcı kullanıyor. Mimarisi K2.5 ve K2.6 ile tamamen aynı olduğu için mevcut dağıtım konfigürasyonları doğrudan yeniden kullanıbenziyor.

Moonshot AI‘a göre en önemli iyileştirmelerden biri, daha verimli muhakeme yeteneği. K2.7 Code, K2.6’ya kıyasla yaklaşık yüzde 30 daha az düşünme token’ı kullanıyor. Bu da daha az “aşırı düşünme” anlamına geliyor. Model, ajan tabanlı kodlama senaryolarında performansı artırmak amacıyla, düşünme modunu ve çoklu konuşma turları boyunca tüm muhakeme içeriğini koruyan bir “preserve_thinking” modunu zorunlu kılıyor.

Moonshot AI, yakında gelecek olan bir “6x High-Speed Mode” özelliğini de duyurdu. Modele Kimi API, Kimi Code CLI ile vLLM ve SGLang gibi çıkarım motorları üzerinden erişilebiliyor. Yerleşik bir INT4 kuantizasyonu da sunuluyor. Model ağırlıkları Hugging Face üzerinden indirilebiliyor. Ayrıca yerleşik bir INT4 kuantizasyonu seçeneği de mevcut olup, bu durum modelin daha az güçlü veya daha ucuz donanımlarda çalıştırılmasını mümkün kılıyor.

Batılı Rakiplerinden Çok Daha Ucuz 

K2.7 Code için API fiyatlandırması, bir milyon girdi tokenı başına 0,95 dolar ve bir milyon çıktı tokenı başına 4,00 dolar olarak belirlenmiş. Önbellek isabetleri, girdi fiyatını bir milyon token başına 0,19 dolara kadar düşürüyor. Bu durum, K2.7 Code’u önceki modeli K2.6 ile aynı girdi fiyat seviyesinde (0,95 dolar / 4,00 dolar, önbellek 0,16 dolar) tutuyor.

Rakipleriyle karşılaştırıldığında K2.7 Code çarpıcı biçimde daha ucuz. GPT-5.5’in maliyeti bir milyon girdi token’ı başına 5,00 dolar ve bir milyon çıktı token’ı başına 30,00 dolarken, Claude Opus 4.8 modelinde bu fiyatlar 5,00 dolar / 25,00 dolar seviyesinde seyrediyor. Anthropic‘in en yeni ve şu anda askıya alınmış olan en tepe modeli Claude Fable 5 ise milyon token başına 10,00 dolar / 50,00 dolar talep ediyor. Yalnızca çıkış fiyatına bakıldığında bile Fable 5, K2.7 Code’dan 12 kattan fazla daha pahalı

K2.7 Code, bazı performans testlerinde Batılı modellerin gerisinde kalsa bile, aynı bütçeyle modeli çok daha fazla kez çalıştırmanıza olanak tanıyor. Bu nedenle asıl soru, genel olarak en iyi model olup olmadığı değil, yapılacak görev için yeterince iyi olup olmadığı. 

Sorunun cevabı ise ancak kendi görevinize özel performans testlerinizle vaka bazında verilebilir. Aradaki fiyat farkı göz önüne alındığında, yoğun kullanımda bu tür değerlendirmeler maliyetini hızla amorti ediyor. Token başına maliyet, ham model kalitesi kadar önemli bir rekabet faktörü haline geliyor ve bu durum, gelişmekte olan bir token ekonomisinin bir başka işareti olarak öne çıkıyor.

Büyük Müşterilere Yönelik Bir Madde İçeren Değiştirilmiş MIT Lisansı 

Model; ücretsiz kullanıma, üzerinde değişiklik yapılmasına ve yeniden dağıtılmasına izin veren değiştirilmiş bir MIT lisansı altında sunuluyor. K2.7 Code’u veya türevlerini aylık 100 milyondan fazla aktif kullanıcıya veya aylık 20 milyon dolardan fazla gelire sahip ticari ürünlerde kullanan herkesin, kullanıcı arayüzünde görünür bir şekilde “Kimi K2.7 Code” ibaresini göstermesi gerekiyor.

Kaynak: https://the-decoder.com/moonshots-open-model-kimi-k2-7-code-undercuts-gpt-5-5-and-claude-by-up-to-12x-on-price-per-token/
Bu Yazıya Tepkiniz Ne Oldu?
  • 0
    be_endim
    Beğendim
  • 0
    alk_l_yorum
    Alkışlıyorum
  • 0
    e_lendim
    Eğlendim
  • 0
    d_nceliyim
    Düşünceliyim
  • 0
    _rendim
    İğrendim
  • 0
    sevdim
    Sevdim
  • 0
    _ok_k_zd_m
    Çok Kızdım

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir