PlaNet görüntüden yer tespiti yapıyor

Google'dan bir ekip fotoğrafa bakarak çekildiği yeri insanlara göre iki kat daha iyi tespit edebilen bir sistem geliştirdi.

Haber Özeti

Tam Sürüm

İnternetten rastgele bir fotoğraf seçip, sadece fotoğrafa bakarak onun nerede çekildiğini bulabilir misiniz? Arkada Eyfel Kulesi ya da Boğaziçi Köprüsü gibi bilindik bir yapı varsa kolay. Peki ya fotoğrafta böyle bir yapı yoksa hatta fotoğraf iç mekanda çekilmişse? Ya da bir evcil hayvanın veya bir yemeğin fotoğrafıysa?

İnsanlar bu işte şaşırtıcı şekilde iyi. Bunu başarabilmek için etraftaki tabelalardaki yazıya, bitki örtüsüne, mimari yapıya ya da trafiğin akış yönüne bakabiliyoruz. İnsanlar hayatını bu tarz konum tanıma ip uçları toplayarak geçiriyorlar. O yüzden makinelerin böyle bir işte zorlanacağını düşünmek kolay. En azından şimdiye dek hep öyle olmuştu. Ama bu durum artık değişiyor.

Google’da Bilgisayar Görüsü Uzmanı olarak çalışan Tobias Weyand öncülüğünde geliştirilen derin öğrenme sistemi, neredeyse tüm fotoğrafların nerede çekildiğini tespit edebiliyor.

Dünya 26 bin bölgeye ayrılmış

Ekip, sistemi geliştirmeden önce fotoğraf çekilme sıklığına göre, dünyayı farklı büyüklükte 26 bin ayrı alana ayırdı. Çok fazla fotoğraf çekilen şehir merkezleri daha fazla alana ayrılırken, daha az fotoğraf çekilen kırsal bölgeler daha geniş karelere bölündü. Hatta okyanuslar ve kutuplar gibi neredeyse hiç fotoğraf çekilmeyen alanlar sisteme dahil edilmedi.

Ekip daha sonra, nerede çekildiği işaretlenmiş 126 milyon fotoğraflık arşivi kendi böldükleri alanlara göre ayırdı ve bu fotoğrafların 91 milyonunu sisteme veri olarak gösterdi. Belirli bölgelerde çekilen fotoğrafların ortak özelliklerini çıkaran sistemin bulguları daha sonra arşivde kalan 34 milyon fotoğraf kullanılarak doğrulandı.

Kullanıma hazır olan ve PlaNet adı verilen sistemin ne kadar başarılı tahmin yapabildiğini ölçebilmek için Flickr üzerinden konum bilgisi tanımlanmış 2.3 milyon fotoğraf kullanıldı. PlaNet bu fotoğrafların yüzde 3.6’sının hangi sokakta, yüzde 10.1’inin hangi şehirde, yüzde 28.4’ünün hangi ülkede çekildiğini doğru tahmin eden sistem, fotoğrafların neredeyse yarısının hangi kıtada çekildiğini başarıyla tespit etti.

İnsan gözünden iki kat daha tutarlı

Bu rakamlar hala öğrenmekte olan bir sistem için oldukça iyi. Ancak asıl şaşırtıcı durum, PlaNet’in becerileri insanlarınkiyle karşılaştırıldığında ortaya çıkıyor. Google’ın Street View servisinden alınan rastgele görsellerin konumunun tahmin edilmesine dayanan Geoguessr adlı oyunda 10 adet gezgin insan PlaNet ile yarıştı.

Toplam 50 fotoğrafta 28 doğru tahminde bulunan PlaNet’in konumlandırma hatası ortalama 1.131,7 km oldu. Aynı rakam insanlarda ortalama 2.320,75 km. Yani bu küçük araştırmaya göre PlaNet, ortalama bir insandan iki kat daha üstün bir beceriyle konum tespiti yapabiliyor.

Weyand ve ekibi sistemin bu başarısını, PlaNet’in bir çok insanın hayatı boyunca göremeyeceği kadar çok yer görmüş olmasına bağlıyor. Ayrıca yapının insanların hafızalarında tutamayacağı kadar çok detayı hatırladığını da eklemek gerek.

Sistem, konumuna dair çok ipucu olmayan iç mekan ya da detay fotoğraflarının konumunu tespit edebilmek için de fotoğrafın bir albüme bağlı olup olmadığına bakıyor. Albümdeki diğer fotoğraflardan ipuçlarını toplayan PlaNet fotoğrafın konumunu tespit edebiliyor.

Bu sistemin çalışmak için sadece 337MB belleğe ihtiyaç duyması da başka bir önemli özelliği. Bu sayede PlaNet’i çok yakında akıllı telefonlarımızda kullanabiliriz.

Google'dan bir ekip, fotoğrafları inceleyip nerede çekildiğini tespit eden bir yazılım geliştirdi. PlaNet rastgele verilen fotoğrafların yüzde 48'inde fotoğrafın çekildiği kıtayı, yüzde 10'unda da fotoğrafın çekildiğini şehri doğru tahmin etti. Geliştirme aşamasındaki sistem yer tespitinde şimdiden insanlardan 2 kat daha başarılı.

2 Yorum

Yorum yazmak için tıklayın

Yorumunuz:

e-Bülten Aboneliği