NVIDIA Artık Sıfırdan Genom Oluşturabiliyor:Tüm Canlılar Alemini Modelleyen Biyolojik YZ “Evo2”

Dünyanın en büyük biyolojik yapay zeka modeli Evo 2, Şubat 19, 2025 tarihinde Arc Institute ve NVIDIA tarafından, Stanford Üniversitesi, UC Berkeley ve UC San Francisco'nun da katılımıyla duyuruldu. Evo 2, 100.000'den fazla türden elde edilen DNA verisi üzerine eğitildi ve yalnızca insan genomundaki mutasyonları belirlemekle kalmayıp sıfırdan yeni genetik dizilimler tasarlayabiliyor. Model, NVIDIA BioNeMo platformuna entegre edilerek bilimsel araştırmaları hızlandırmayı amaçlıyor. Ayrıca, Goodfire AI araştırma laboratuvarıyla birlikte geliştirilen mekanistik yorumlama aracı sayesinde Evo 2'nin genomik verilerde tanımladığı motifler ve özellikler incelenebiliyor. Takım, Evo 2'nin şu ana kadar geliştirilmiş en genis çapta açık kaynak biyolojik YZ modeli olduğunu belirtiyor.

DNA'nın Dili Okunuyor ve Yazılıyor

Evo 2, birçok türden 128.000 tam genom içeren 9.3 trilyon nükleotitlik bir veri seti üzerinde eğitildi. Bu sayede bakteri, arkeler, fajlar, bitkiler, insanlar ve diğer tek hücreli ve çok hücreli canlıların genetik kodlarını anlamada çok yönlü bir yetkinlik kazandı. Arc Institute Kurucu Ortağı ve UC Berkeley Biyomühendislik Bölümü öğretim üyesi Patrick Hsu, "Evo 1 ve Evo 2'nin geliştirilmesi, makinelerin nükleotitlerin diliyle okumasını, yazmasını ve düşünmesini sağlayan çığır açıcı bir adımdır." dedi. Evo 2'nin, hastalığa neden olan mutasyonları belirleme veya yapay biyolojik kodlar oluşturma gibi çok çeşitli görevler için kullanılabileceğini vurgulayan Hsu, "Bu temel modelin üzerinde neler inşa edileceğini görmek için sabırsızlanıyoruz." dedi.

Stanford Üniversitesi Kimya Mühendisliği Bölümü öğretim üyesi ve Arc Institute Yenilik Araştırmacısı Brian Hie ise "Evrim, DNA ve RNA'ya gizli sinyaller yerleştirdi ve Evo 2 bu örüntüleri algılayabiliyor." diyerek, internetin dili nasıl belirli kalıpları taşıyorsa, evrimin de biyolojik dizilimlerde benzer izler bıraktığını belirtti. Hie, bu konudaki bulgularını Mayıs 2025'te San Jose'deki SynBioBeta 2025 konferansında sunacak.

Evo 2'nin Teknik Altyapısı

Evo 2, NVIDIA DGX Cloud AI sistemlerinde, 2.000'den fazla NVIDIA H100 GPU kullanarak AWS altyapısında eğitildi. Modelin şekillendirilmesi için aylarca hesaplama yapıldı. 1 milyon nükleotidi tek seferde analiz edebilecek kapasiteye sahip bu model, genomik bölgeler arasında uzun menzilli bağlantılar kurabilmesiyle standart derin öğrenme modellerinin ötesine geçiyor. OpenAI Kurucu Ortağı ve Başkanı Greg Brockman da izinli olduğu bir dönemde StripedHyena 2 adı verilen yeni bir YZ mimarisi geliştirerek bu projeye katkıda bulundu. Sonuç olarak, Evo 2, önceki sürümü Evo 1'e göre 30 kat daha fazla veri üzerinde eğitildi ve sekiz kat daha uzun dizilimleri analiz edebiliyor.

Genetik Keşfetme ve Dizilim Tasarlama

Evo 2, hastalık mutasyonlarını tespit edebilirken, aynı zamanda yeni biyolojik yapılar da tasarlayabiliyor. BRCA1 genindeki mutasyonlar üzerinde yapılan testlerde %90'ın üzerinde doğruluk oranına ulaşarak meme kanseri riskini öngörmede büyük başarı sağladı. Bu gibi çıkarımlar, yeni ilaç keşiflerini ve genetik araştırmaları hızlandırabilir.

Bunun yanında, belirli genetik dizilimlerin belirli hücrelerde aktif olması için hassas düzenlemeler yapabiliyor. "Eğer bir gen terapisi yalnızca sinir hücrelerinde etkinleşmeliyse veya sadece karaciğer hücrelerinde aktif olmalıysa, Evo 2 bu özelleştirilmiş genetik elementleri tasarlayabilir." diyen UC San Francisco'dan Hani Goodarzi, bu sayede yan etkileri minimize eden daha hassas tedavilerin geliştirilebileceğini belirtiyor.

Gelecekteki Kullanım Alanları ve Etik Hususlar

Arc Institute Teknoloji Direktörü Dave Burke, "Evo 2'yi biyolojinin işletim sistemi çekirdeği gibi düşünün. Üzerine farklı uygulamalar inşa edilebilir." diyerek modelin genetik tasarım ve hastalık analizlerinde temel bir rol oynayabileceğini belirtiyor. Ancak, geliştiriciler, insan patojenlerini içeren verileri modelin eğitiminden çıkardı ve böylece etik riskleri azaltmak amacıyla şuurlu kısıtlamalar getirdi. Stanford'dan Tina Hernandez-Boussard, modelin sorumlu kullanımı konusunda danışmanlık sağlıyor.

NVIDIA Dijital Biyoloji Direktörü Anthony Costa, "Evo 2, biyolojik sistemleri anlamada devrim yaratmıştır." diyerek modelin bilim insanlarına büyük keşfetme olanakları sunduğunu belirtiyor.

Kaynak: https://www.synbiobeta.com/read/evo2-one-bio-ai-model-to-rule-them-all

https://blogs.nvidia.com/blog/evo-2-biomolecular-ai/