Yapay Zeka

24/3/2025

Jack Ma Destekli Ant Group, Çin Çipleriyle Yapay Zeka Eğitiminde Atılım Yaptı

Jack Ma destekli Ant Group, Çin yapımı yarı iletkenleri kullanarak büyük dil modellerini (LLM) eğitme sürecinde maliyeti %20 oranında düşüren yeni yöntemler geliştirdi. Konuya yakın kaynaklara göre, şirket Alibaba Group ve Huawei Technologies tarafından üretilen yerli çiplerle, "Uzman Karışımı" (Mixture of Experts - MoE) makine öğrenimi yaklaşımıyla yapay zeka modelleri eğitti. Alınan sonuçların, Nvidia’nın H800 gibi gelişmiş çipleriyle elde edilenlerle benzer olduğu ifade edildi.

Şirket halen Nvidia çiplerini kullanmaya devam ediyor ancak en son modellerini geliştirirken ağırlıklı olarak AMD ve Çin menşeli alternatiflere yönelmiş durumda.

Yeni Nesil YZ İçin Yerli Alternatifler

Ant’ın geliştirdiği modeller, Çinli ve Amerikalı şirketler arasında hızla büyüyen YZ rekabetine katıldığını gösteriyor. Özellikle DeepSeek’in, milyarlarca dolarlık yatırım gerektiren sistemler yerine daha düşük maliyetli modeller geliştirme başarısı, pazarda büyük etki yaratmıştı. Ant’ın kullandığı yöntem, Çinli şirketlerin Nvidia’nın ileri düzey çipleri yerine yerel alternatiflere yöneldiğini gösteriyor.

Ant, yayınladığı araştırma makalesinde, geliştirdiği modellerin bazı kriterlerde Meta Platforms’un sistemlerinden daha iyi performans gösterdiğini ileri sürdü. Bloomberg bu verileri henüz bağımsız olarak doğrulamadı. Eğer doğruysa, Ant’ın platformları YZ hizmetlerini destekleyen altyapının maliyetini ciddi ölçüde düşürebilir.

MoE Modeli ve Verimlilik Arayışı

Google ve DeepSeek gibi şirketler tarafından da kullanılan MoE (Uzman Karışımı) modelleri, görevleri parçalara ayırarak verimliliği artıran bir yapıya sahip ancak modellerin eğitimi genellikle yüksek performanslı Nvidia grafik işlemcilerine dayanıyor ve bu da küçük ölçekli şirketler için maliyetleri artırıyor.

Ant, söz konusu kısıtı aşmak için premium GPU’lar olmadan büyük modelleri ölçekleyebilecek yöntemler geliştirmeye odaklandı. Yayınlanan makalede, "üst düzey GPU’lar olmadan ölçeklenebilir model" geliştirme hedefi açıkça belirtiliyor.

Nvidia CEO’su Jensen Huang, daha verimli modeller geliştirilse bile işlem gücüne olan talebin artacağını savunarak, büyük ve güçlü GPU’ların gerekli olduğunu ileri sürüyor. Huang, daha fazla çekirdek, transistör ve bellek kapasitesine sahip büyük GPU’lara odaklanmayı sürdürüyor.

Bloomberg Intelligence Yorumu

Bloomberg analisti Robert Lea, "Ant Group’un çalışması Çin’in YZ alanındaki yenilik hızını ve teknolojik ilerlemesini gözler önüne seriyor. İddia doğrulanırsa, Çin’in kendi kendine yeten bir YZ gücü olma yolunda önemli bir adım attığını gösterir." dedi.

Ant, yüksek performanslı donanım ile 1 trilyon token’lık eğitim sürecinin yaklaşık 6,35 milyon yuan (880.000 dolar) maliyetle gerçekleştiğini ancak optimize edilmiş yeni yöntemin aynı işlemi 5,1 milyon yuan (yaklaşık 710.000 dolar) seviyesine indirdiğini belirtti.

Şirket, geliştirdiği Ling-Plus ve Ling-Lite adlı modelleri, sağlık ve finans gibi endüstriyel YZ çözümlerinde kullanmayı planlıyor. Bu yıl Haodf.com adlı Çin merkezli sağlık platformunu satın alan Ant, 290.000 doktoru destekleyecek YZ Doktor Asistanını hayata geçirdiğini açıkladı. Ayrıca Zhixiaobao adlı yaşam asistanı uygulaması ve Maxiaocai adında bir finans danışmanı YZ hizmeti de bulunuyor.

Ant, İngilizce dil anlama testlerinde Ling-Lite modelinin Meta’nın Llama modelinden daha iyi sonuçlar verdiğini ifade etti. Hem Ling-Lite hem de Ling-Plus modelleri, Çince kriterlerde DeepSeek’in eşdeğer modellerinden üstün performans gösterdi.

Shengshang Tech CTO’su Robin Yu, gerçek dünya uygulamalarının önemini şu sözlerle vurguladı: “Dünyanın en iyi kung fu ustasını yenmek için tek bir zayıf nokta bulmak yeterlidir. Bu yüzden gerçek dünyadaki uygulama çok önemli.”

Ant, Ling modellerini açık kaynak olarak yayımladı. Ling-Lite modeli 16,8 milyar parametre, Ling-Plus ise 290 milyar parametre içeriyor. Karşılaştırma açısından, uzmanlar GPT-4.5 modelinin yaklaşık 1,8 trilyon parametreye sahip olduğunu, DeepSeek-R1’in ise 671 milyar parametre içerdiğini belirtiyor.

Ant, model eğitimi sırasında bazı zorluklarla karşılaştığını da belirtti. Donanım veya model yapısındaki küçük değişikliklerin, hata oranlarında sıçramalara neden olduğunu ifade etti.

Şirket, sağlık odaklı büyük modeller geliştirerek Pekin ve Şanghay dahil yedi şehirdeki sağlık kuruluşlarında kullanıma sundu. Modeller DeepSeek R1, Alibaba’nın Qwen modeli ve Ant’ın kendi LLM sistemlerini içeriyor. Ayrıca, Angel ve Yibaoer adlı iki tıbbi YZ ajanı geliştirildi. Angel şu ana kadar 1.000’den fazla sağlık kuruluşuna hizmet verirken, Yibaoer sağlık sigortası hizmetlerini destekliyor. Geçtiğimiz eylül ayında, ödeme uygulaması Alipay içinde YZ Sağlık Yöneticisi hizmeti de başlatıldı.






Kaynak: https://www.bloomberg.com/news/articles/2025-03-24/jack-ma-backed-ant-touts-ai-breakthrough-built-on-chinese-chips