Fotoğraftaki boşlukları dolduran yapay zeka

Bir grup araştırmacı, resimlerdeki boşlukları anlamlı şekilde doldurabilen bir teknoloji geliştirdi.

Haber Özeti

Tam Sürüm

Japonya’daki Waseda Üniversitesi’nde çalışan Profesör Hiroshi Ishikawa önderliğindeki ekip tarafından geliştirilen bir sistem, derin öğrenmenin bir türü olan evrişimsel sinir ağı kullanarak resimlerdeki eksik kısımları tahmin ediyor. Teknoloji, fotoğraf düzenleme uygulamalarında ya da iki boyutlu resimlerden üç boyutlu resimler elde etmek amacıyla kullanılabilir.

Ekip öncelikle gerçek manzara, insan yüzleri ve başka nesnelerden oluşan yaklaşık 8 milyon resim topladı. Özel bir yazılım kullanan ekip, resimlere çeşitli şekil boyut ve pozisyonlarda rastgele yapay boşluklar ekleyerek her bir resmin çok sayıda farklı versiyonunu üretti. Sistemin boşlukları orijinal gibi görünecek şekilde doldurmayı öğrenmesi üç ay sürdü. Modelin öğrenme algoritması öncelikle tahminde bulunup sonra boşlukları dolduruyor. Daha sonra da eklediği kısmın çevresiyle ne kadar tutarlı olduğunu değerlendiriyor. Bu tutarlılık, resmin gerçek ve sahte kenarları incelenerek değerlendiriliyor. Daha sonra model, resmin bir bütün olarak doğal ve gerçek görünüp görünmediğine karar veriyor.

Tahmin ve değerlendirme döngüsünü tekrarladıktan sonra öğrenme modeli, sadece tahmin edilen kısımları kullanarak bütün bir resmi yapay şekilde inşa edebilecek beceriyi kazanıyor. Böylece, gerçek bir iki boyutlu fotoğrafı üç boyutlu hale getirebiliyor.

Ekip, geliştirdikleri modelin fotoğraf düzenleme uygulamalarında kullanılmasını umuyor. Ayrıca sistem, çocukların yüz özelliklerini gösteren fotoğraflar gibi bazı fotoğraflarda az miktarda değişiklik yapabilme özelliğine sahip. Bu sayede, aileler çocuklarının fotoğraflarını sosyal medya platformlarında paylaşmadan önce hafifçe değiştirip çocuklarının kimliğini riske atma kaygısından kurtulabilir.

Kaynak: Nikkei Asian Review

Görsellerdeki eksik yerleri anlamlı şekilde doldurabilen bir sistem geliştirildi. Araştırmacılar gerçek manzara, insan ya da nesnelerden oluşan 8 milyon kadar görsel topladı. Sonra bu görsellerin üzerine çeşitli şekil, boyut ve pozisyonlarda rastgele yapay boşluklar ekleyerek her bir görselin çeşitli versiyonlarını ürettiler. Sistemin öğrenme algoritması önce tahminde bulunup sonra boşlukları dolduruyor. Sonra da eklediği kısmın çevresiyle ne kadar tutarlı olduğunu değerlendiriyor. Bu tutarlılık, resmin gerçek ve sahte kenarları incelenerek değerlendiriliyor. Daha sonra model, resmin bir bütün olarak doğal ve gerçek görünüp görünmediğine karar veriyor. Tahmin ve değerlendirme döngüsünü tekrarladıktan sonra öğrenme modeli, sadece tahmin edilen kısımları kullanarak bütün bir resmi yapay şekilde inşa edebilecek beceriyi kazanıyor. Böylece, iki boyutlu bir fotoğraf üç boyutlu hale getirilebiliyor. Ekip, geliştirilen teknolojinin fotoğraf düzenleme uygulamalarında kullanılacağını tahmin ediyor.

1 Yorum

Yorum yazmak için tıklayın

Yorumunuz:

e-Bülten Aboneliği