İnsansı ve konuşabilen bir robot olan ‘Figure 01’in ürpertici bir videosu internete düştü. Ve bunun ‘Ben, Robot’ filminden silinmiş bir sahne olmadığına inanmak zor.

Demoda, OpenAI teknolojisiyle donatılmış Figure 01’e ‘ne görebildiği’ soruluyor. Görsel tanıma becerisini sergileyen robot, önünde ne işe yaradığını doğru bir halde açıklıyor: Kırmızı bir elma, bulaşıklarla dolu bir kurutma rafı ve Figure 01’e suali soran adam.

Tamam, birazcık tekinsiz fakat daha ilkin görmediğimiz bir şey de sayılmaz. Örneğin geçen yıl Google, suni zekâ modeli Gemini’ın mavi bir lastik ördekten elle çizilmiş çeşitli resimlere kadar önüne konan şeyleri iyi mi tanıyabildiğini göstermişti. (Gerçi sonrasında kurnazca meydana getirilen düzenlemenin Gemini’ın kabiliyetlerini birazcık abarttığı anlaşıldı.)

Fakat sonrasında adam şu şekilde soruyor: “Yiyecek bir şey alabilir miyim?”

Figure 01 masadaki tek yenilebilir nesne olan elmayı kaptığı şeklinde adama uzatıyor. Will Smith’in pek yakında ortaya çıkmayacağından güvenilir miyiz?

Figure 01 robotu iyi mi çalışıyor?

Figure 01’in bir insanla sorunsuz etkileşiminin temelinde tam olarak ne yatıyor? Ve onu hantal bir hurda yığınından, birazcık fazla insana benzeyen fantastik ve fütüristik bir robota dönüştüren şey nedir? Cevap: Yeni bir görsel dil modeli VLM. VLM, OpenAI ve Figure 01’in arkasındaki girişim olan Figure’ün iş birliği sonucunda ortaya çıktı.

Figure 01, “Bunu çöpe atarken niçin elmayı bana verdiğini açıklayabilir misin?” diye sorulduğunda aynı anda birkaç görevin üstesinden gelebileceğini gösteriyor.

Robot, neyin çöp bulunduğunu (ve neyin olmadığını) anlayıp onları çöpe atarken adama elmayı önündeki yenebilecek tek şey olduğundan verdiğini açıklıyor. Bu hakkaten etkisinde bırakan bir çoklu vazife!

Son olarak, adam Figure 01’e ne kadar başarı göstermiş bulunduğunu düşündüğünü soruyor. Robot, söyleşi havasında şu şekilde cevap veriyor: “Sanırım oldukça iyi yaptım. Elma yeni sahibini buldu, çöpler atıldı ve sofra takımları da mensup oldukları yerde duruyor.”

Figure’ün kurucusu Brett Adcock’a bakılırsa robot önündeki sahneyi ‘anlamasına’ destek olan VLM verilerini besleyen ve robotun karşısındaki insanla sorunsuz bir halde etkileşime girmesini elde eden yerleşik kameralara haiz. Figure 01, Adcock’un yanı sıra Boston Dynamics, Tesla, Google Deep Mind ve Archer Aviation’dan birçok mühim ismin ortak ürünü.

Elon Musk’ın Optimus robotuna gönderme meydana getiren Adcock, Figure 01’in teleoperasyonla çalışmıyor olmasıyla övünüyor. Bir başka deyişle, gömlek katladığı için viral olan Optimus’un aksine Figure 01 bağımsız olarak çalışabiliyor.

Peki Adcock’un nihai hedefi ne? Milyarlarca insansı robotu denetim edebilecek süper gelişmiş bir suni zekâ sistemini eğitmek ve böylece birçok sektörde devrim yaratmak. Görünüşe bakılırsa artık ‘Ben, Robot’ düşündüğümüzden fazlaca daha gerçeğe yakın.


Kimberly Gedeon, Mashable’da teknoloji editörü.