Görsellere üçüncü boyut katan yapay zeka

Google’ın yapay zeka girişimi Deepmind, sadece iki boyutlu olarak gördüğü sahneleri üç boyutlu sahnelere çevirebilen bir yapay zeka geliştirdi.

Yayın tarihi:

3 Temmuz 2018

–

Kategori: Tasarım / İnovasyon, Teknoloji / Bilim

Google’ın Birleşik Krallık merkezli şirketi Deepmind, sadece iki boyutlu olarak gördüğü sahneleri üç boyutlu sahnelere çevirebilen bir yapay zeka geliştirdi.

Yapay zeka araştırmacıları makinelere insan gibi öğrenebilmeyi öğretmeye çalışıyor. Biz dünyayı pikseller olarak görmektense çevremize bakıp gördüğümüz her şeyle ilgili varsayımlarda bulunuyoruz. Örneğin karşımızdaki bir insanın göğsünü görüyorsak bu insanın arka tarafta, bizim göremediğimiz yerde bir de sırtı olduğunu varsayıyoruz.

9 aydan büyük bir çocukla ‘ce-e’ oyunu oynadıysanız, çocuk siz yüzünüzü elinizle kapattığınızda bile yüzünüzün orada olduğunu bilir. Ancak daha küçük çocuklarda ‘nesne devamlılığı’ gelişmediği için yüzünüzü elinizle kapattığınızda yüzünüzün tamamen kaybolduğunu zanneder. Deepmind ekibi de şu anda 9 aydan küçük bir çocuk gibi davranan yapay zekaya nesne devamlılığını öğretmeye çalışıyor. Böylece yapay zeka etrafındaki şeylerin, daha önce görmediği açılardan nasıl görüneceğini tahmin edebilecek.

İki boyutlu resimden üç boyutlu sahne

Deepmind bilimcileri Üretici Sorgu Ağı (GQN) adını verdikleri bir yapay sinir ağı tasarlayarak yapay zekaya, nesnelerden oluşan bir sahnenin farklı perspektiflerden nasıl görüneceğini tahmin etmeyi öğretmeye çalıştılar. Yani yapay zeka bir sahnenin iki boyutlu görsellerine bakıp o sahneyi yeniden oluşturmaya çalışıyor. Bu çalışmada önemli olan yapay zekanın insanlar tarafından yerleştirilmiş etiketleri ya da önceden edindiği bilgileri kullanmaması. Yapay zeka sadece bir sahnenin üç farklı resmine bakıyor ve aynı sahnenin üç boyutlu versiyonunun nasıl olacağını kestirmeye çalışıyor.

Basit olarak bu işlemi, yapay zekaya küp fotoğrafı gösterip bunu başka açılardan yeniden oluşturmasını istemek gibi düşünebilirsiniz. Işık ve gölge ya da küpü oluşturan çizgiler daha farklı olacaktır. GQN kullanan yapay zeka, istenen üç boyutlu görseli oluşturabilmek için küpün daha önce hiç görmediği açılardan nasıl görüneceğini tahmin etmek zorunda.

Araştırmacıların amacı ‘tamamen gözetimsiz sahne anlama’ yeteneğini geliştirmek. Şu anda yapay zeka gerçek dünyadan alınmış görsellerle eğitiliyor. Bir sonraki adım, fotoğrafları kullanarak gerçekçi sahneler oluşturmak olabilir. Gelecekte Deepmind’ın GQN tabanlı yapay zekası, çektiğimiz fotoğraflara bakarak, gerçek dünyayla neredeyse birebir aynı üç boyutlu sahneler oluşturabilir. Bu sahneler sanal gerçeklik, sinema ya da bilgisayar oyunu gibi alanlarda çok kullanışlı olabilir.