Çinli yapay zeka geliştiricisi DeepSeek, akıl yürütmeye odaklı R1 modelinin eğitim maliyetini 294.000 dolar olarak açıkladı ve bunun için 512 Nvidia H800 çipi kullandığını belirtti. ABD’li rakiplerin yüz milyonlarca dolar harcadığı düşünüldüğünde düşük maliyet dikkat çekerken, şirketin ilk kez A100 çiplerine sahip olduğunu ve geliştirme sürecinin hazırlık aşamalarında bunları kullandığını kabul etmesi de öne çıktı. Reuters, DeepSeek’in Çin’de A100 süperbilgisayar kümesi işleten az sayıdaki firmadan biri olduğunu bildirdi. Şirket ayrıca, modellerinde Meta’nın Llama modelinden yararlanarak distilasyon yöntemini kullandığını ve bazı eğitim verilerinin OpenAI tarafından üretilmiş cevapları içerdiğini kabul etti ancak bunun “kasıtlı değil, tesadüfi” olduğunu vurguladı.