Yapay zeka insanların videolarını değiştirme konusunda her geçen gün daha etkili bir araç haline geliyor. Yüz değiştirme teknolojisi ile üretilen ‘deepfake’ videolar yapay zekanın bu amaçla kullanımının en belirgin örneklerinden biri. Bu alanda en son gelişme ise dans videolarında yaşandı. Kaliforniya Berkeley Üniversitesinden araştırmacılar tarafından geliştirilen yapay zeka yazılımı dans eden bir kişinin vücut hareketlerini başka bir kişinin videosuna aktarabiliyor. Böylece diğer videodaki kişi de aynı şekilde dans ediyormuş gibi görünüyor.
arXiV’de yayımlanan makalede sistemin birbirinden ayrı bir dizi adımdan oluştuğu belirtiliyor. Öncelikle hedef video kaydediliyor ve bir alt program bu videodaki hareketleri bir çöp adam figürüne aktarıyor. Sistem kaliteli bir transfer için 20 dakikalık ve saniyede 120 karelik bir video görüntüsüne ihtiyaç duyuyor. Daha sonra bir kaynak video bulunuyor ve onun hareketlerinden de bir çöp adam figürü oluşturuluyor. Dönüşüm, hedef kişinin videosunun bir yapay sinir ağı sentezlemesi ile kaynak çöp adam figürünün hareketlerine adapte edilmesi ile gerçekleşiyor.
Böyle anlatınca basit gibi duruyor ama arka planda çok fazla zekice mühendislik çalışması yer alıyor. Örneğin çöp adam figürlerinin hareketlerini yumuşatan bir yazılım sayesinde dansçıların vücudu çok fazla savruluyormuş gibi görünmüyor. Ayrıca daha gerçekçi bir görünüm sağlamak adına yüz ifadesini düzenlemek için tamamen ayrı bir yapay sinir ağı çalışıyor.
Henüz mükemmel değil
Programın hala eksiklikleri var. Yapay sinir ağı bol kumaşları modellemekte zorlandığı için hedef kişinin dar kıyafetler giymesi gerekiyor. Videoda bazı görsel anormallikler görmek mümkün. Hedef ve kaynak videolardaki eklemlerin tam olarak eşleşmediği noktalarda ya da yapay zeka yazılımının bazı karmaşık hareketleri yeniden oluşturamadığı anlarda bu anormallikler belirgin hale geliyor.
Yine de bu çalışma oldukça etkileyici. Normalde bir video düzenleme ekibinin günlerini alacak bir işlem, yapay zeka sayesinde kısa sürede gerçekleştirilebiliyor. Tek ihtiyaç duyulan şey bir kaynak video ve yapay zeka yazılımı. Kısa süre içinde bu teknoloji karşımıza bir akıllı telefon uygulaması olarak çıkabilir. Bu tarz teknolojilerin videolu kanıtlara bakış açımızı nasıl etkilediği ise apayrı bir konu.
Yorumunuz: