Yapay Zeka
21/2/2025
Figure AI’ın kurucusu ve CEO’su Brett Adcock, perşembe günü insansı robotlar için yeni bir makine öğrenimi modeli geliştirdiklerini duyurdu. Açıklama, Adcock’un OpenAI ile olan iş birliğini sonlandırdığını duyurmasının üzerinden iki hafta geçmeden geldi. Şirketin geliştirdiği yeni sistem, Helix adı verilen genel amaçlı Görüntü-Dil-Eylem (VLA) modeli üzerine kurulu.
VLA modelleri, görsel ve dil tabanlı komutları işleyerek robotlara gerçek zamanlı kontrol sağlayan yeni bir teknoloji dalgasını temsil ediyor. Bu kategorideki en tanınmış örneklerden biri, Google DeepMind’in RT-2 modeli olup, robotları video ve büyük dil modelleri (LLM) ile eğitiyor. Helix de benzer bir yaklaşım benimseyerek, görsel verileri ve dil istemlerini birleştirerek robotları yönetiyor.
Figure AI, Helix modelinin yeteneklerini şu şekilde tanımlıyor: "Helix, nesneleri güçlü bir şekilde genelleştirme yeteneğine sahiptir ve eğitim sürecinde hiç karşılaşmadığı, farklı şekil, boyut, renk ve malzeme özelliklerine sahip binlerce ev eşyasını sadece doğal dilde verilen komutlarla kaldırabilir."
İdeal senaryoda, bir robota yalnızca sözel bir komut verildiğinde bunu gerçekleştirebilmesi beklenir. Helix’in temel amacı da tam olarak görsel ve dil işleme arasındaki boşluğu doldurmaktır. Model, sesli komut aldıktan sonra çevresini analiz eder ve belirlenen görevi yerine getirir.
Şirket, Helix’in yeteneklerini şu örneklerle açıklıyor: “Sağındaki robota kurabiye paketini ver.” veya “Solundaki robottan kurabiye paketini al ve açık çekmeceye yerleştir.” Bu komutlar, Helix’in iki robotu aynı anda kontrol edebildiğini ve iş bölümü yaparak çalışabildiğini gösteriyor.
Figure AI, bu modeli özellikle ev ortamında test etmek için geliştirdiği 02 insansı robotu ile tanıtıyor. Evler, robotlar için fabrikalar ve depolar gibi yapılandırılmış alanlara kıyasla çok daha karmaşık ve öngörülemez ortamlardır. Bu durum, insansı robotların öğrenme ve kontrol yetenekleri açısından büyük zorluklar oluşturuyor. Aynı zamanda, robotik sistemlerin yüksek maliyetleri nedeniyle, birçok şirket öncelikle endüstriyel müşterilere odaklanarak güvenilirliği artırmayı ve maliyetleri düşürmeyi amaçlıyor.
2024 yılında TechCrunch ekibi, Figure’ın Bay Area ofislerini ziyaret ettiğinde, Adcock ekibinin insansı robotları ev ortamında test ettiğini gösterdi ancak o dönemde şirketin önceliğinin fabrika ve endüstriyel pilot projeler olduğu görülmüştü. Helix duyurusu ile birlikte, ev robotlarının da kendi başına bir öncelik haline gelmesi gerektiğini net bir şekilde vurgulanıyor.
Şirket, robotların gerçek dünya ortamlarında akıllı yeni davranışlar sergileyebilmesi için yüksek düzeyde eğitilmesi gerektiğini belirtiyor. "Ev robotlarının, daha önce hiç görmedikleri nesnelerle bile anında akıllı davranışlar oluşturabilmesi gerekir." diyen Figure AI, günümüzde robotlara tek bir yeni davranış öğretmenin bile büyük çaba gerektirdiğini ifade ediyor. Bunun için ya uzun saatler süren manuel programlama ya da binlerce tekrar içeren gösterim süreçleri gerekiyor.
Manuel programlamanın ev kullanımı için ölçeklenebilir olmadığı belirtilirken, mutfaklar, oturma odaları ve banyoların büyük farklılıklar göstermesi, mobilyaların yer değiştirmesi ve ışıklandırma koşullarının değişken olması gibi faktörlerin robot eğitim sürecini zorlaştırdığı vurgulanıyor. Bu nedenle, robotların çok fazla veriyle eğitilmesi gerektiği ve bu sürecin yüksek maliyetli olmasına rağmen kaçınılmaz olduğu belirtiliyor.
Helix, insansı robotik alanındaki birçok yenilik gibi henüz erken bir aşamada. Şirketin yayımladığı kısa, profesyonel videolar genellikle perde arkasında çok büyük miktarda eğitim sürecinin ürünü olarak değerlendirilse de, bu duyuru aynı zamanda projeye daha fazla mühendis çekmek için bir işe alım stratejisi olarak da görülüyor.