Yapay Zeka

13/3/2025

Google DeepMind’ın Yeni Yapay Zeka Modelleriyle Robotlar Eğitim Almadan Bile Fiziksel Görevleri Yerine Getirebiliyor

Google DeepMind, robotların daha önce hiç olmadığı kadar geniş bir yelpazede fiziksel görevleri yerine getirmesini sağlamak amacıyla iki yeni yapay zeka modeli geliştirdiğini duyurdu. Modellerden ilki olan Gemini Robotics, yeni durumları anlama yeteneğine sahip bir görsel-dil-eylem modeli olarak tanımlanıyor ve eğitim almamış olsa bile bilinmeyen senaryoları çözme yeteneğine sahip.

Google’ın amiral gemisi yapay zeka modeli Gemini 2.0 temel alınarak geliştirilen Gemini Robotics hakkında bilgi veren Google DeepMind Kıdemli Direktörü ve Robotik Bölüm Başkanı Carolina Parada, "Gemini Robotics, Gemini’nin çok modlu dünya anlayışını fiziksel hareketleri yeni bir modalite olarak ekleyerek gerçek dünyaya aktarıyor." dedi.

Google DeepMind, genellik, etkileşim ve çeviklik olmak üzere üç ana alanda ilerleme kaydettiğini vurguluyor. Gemini Robotics, yeni durumlara uyum sağlama yeteneğini geliştirirken, insanlarla ve çevresiyle daha iyi etkileşim kurabiliyor. Aynı zamanda bir kağıdı katlamak veya bir şişe kapağını çıkarmak gibi daha hassas fiziksel görevleri gerçekleştirebiliyor.

Parada, "Daha önce genel robotik alanında bu alanlardan her birinde bireysel ilerlemeler kaydetmiştik ancak şimdi tek bir modelle performansı dramatik şekilde artırıyoruz." diyerek yeni modelin robotları daha yetenekli, çevresine duyarlı ve değişikliklere karşı daha dayanıklı hale getirdiğini belirtti.

DeepMind ayrıca, robotların fiziksel dünyayı daha iyi anlamasını sağlayan Gemini Robotics-ER (Embodied Reasoning) adlı gelişmiş bir görsel dil modeli de geliştirdi. Bu model, robotların karmaşık ve dinamik dünyayı anlamalarına yardımcı olacak şekilde tasarlandı.

Parada, modelin gerçek dünyadaki görevleri nasıl yerine getirdiğini şu örnekle açıkladı: "Bir öğle yemeği kutusunu hazırlarken, masadaki nesnelerin nerede olduğunu, kutunun nasıl açılacağını, öğeleri nasıl kavrayıp nereye yerleştirileceğini bilmeniz gerekir. İşte Gemini Robotics-ER’in yapması beklenen türden bir akıl yürütme süreci bu."

Google DeepMind, robotların güvenliğini sağlamak için katmanlı bir güvenlik yaklaşımı geliştirdiğini belirtti. DeepMind araştırmacısı Vikas Sindhwani, Gemini Robotics-ER modellerinin "bir eylemin belirli bir senaryoda güvenli olup olmadığını değerlendirmek için eğitildiğini" açıkladı. Şirket ayrıca, yapay zeka güvenliği üzerine daha fazla araştırma yapılmasını teşvik etmek amacıyla yeni kıyaslama testleri ve çerçeveler yayımladı.

DeepMind, geçtiğimiz yıl robotlarının Isaac Asimov’un ünlü "Robot Yasaları"ndan esinlenerek oluşturulan "Robot Anayasası" çerçevesinde hareket etmesini sağlayan bir dizi kural tanımlamıştı.

DeepMind, Apptronik ile birlikte yeni nesil insansı robotlar geliştirmek için çalışmalar yürütüyor. Şirket ayrıca, Agile Robots, Agility Robotics, Boston Dynamics ve Enchanted Tools gibi sektör liderleriyle iş birliği yaparak Gemini Robotics-ER modelini güvenilir test kullanıcılarına açtı.

Parada, "Fiziksel dünyayı anlayabilecek ve bu dünyada hareket edebilecek bir zeka geliştirme konusunda odaklanmış durumdayız." diyerek, teknolojiyi farklı robot türlerine ve geniş bir uygulama yelpazesine entegre etmeyi hedeflediklerini belirtti.

Kaynak: https://deepmind.google/discover/blog/gemini-robotics-brings-ai-into-the-physical-world/?utm_source=semafor

https://www.theverge.com/news/628021/google-deepmind-gemini-robotics-ai-models