Dudak okuyan bilgisayarlar

Oxford Üniversitesi'nden bir grup bilimci, Google'ın DeepMind adlı yazılımından faydalanarak insanlardan daha iyi dudak okuyan bir yapay zeka geliştirdi.

Haber Özeti

Tam Sürüm

Oxford Üniversitesi‘nden bir grup bilimci, insanlardan daha iyi dudak okuyan bir yapay zeka geliştirdi. Geliştirilen sistem için Google’ın DeepMind adlı yapay zeka ekibinden destek alınırken, BBC‘nin haberleriyle saatlerce eğitim yapıldı. ‘Watch, Attend and Spell‘ (İzle, Dikkat Et ve Hecele) adı verilen sistem, sessiz bir konuşma izlediğinde yüzde 50 oranında kelimeleri doğru seçiyor. Bu oran kulağa çok iyi gelmese de profesyonellerin oranının yüzde 12 olduğunu belirtmekte fayda var. Mühendislik Departmanı’ndan Doktora Öğrencisi Joon Son Chung bunun ne kadar zorlu bir süreç olduğunu belirtirken, ‘mat’, ‘bat’ ve ‘pat’ kelimelerinin söylenişinin ne kadar benzediğine değiniyor. Sistemi açıklarken de ‘bu sistemin ağız hareketlerinden sonra gelen sesi ve sese eşlik eden karakterleri bulma konusunu öğrendiğini’ ifade ediyor.

BBC, Breakfast (sabah haberleri), Newsnight (gece haberleri), Question Time gibi programların altyazılı bölümlerini araştırmacılarla paylaştı. 118 bin cümlelik alıştırmanın sonunda sistem 17 bin 500 kelime öğrendi. Sistem özellikle haberlerle öğrenim süreci geçirdiği için, eğer bir spiker konuşuyorsa ‘Başbakan’ kelimesinin ardından ‘Avrupa’ veya ‘Birlik’ kelimelerinin geleceğini anlıyor. Sistemin geliştirilmesi için daha fazla çalışılması gerekiyor ama duyma kaybı yaşayanlar için bir hayır kurumu olan Action on Hearing Loss bu konuda oldukça heyecanlı. Kurumun Teknoloji Araştırma Yöneticisi Jesal Vishnuram bunun ‘dudak okuma teknolojisini geliştireceğini, ayrıca televizyondaki altyazılara ve gürültülü ortamlardaki duyma problemine çözüm olabileceğini’ düşünüyor.

Gelişmesi için televizyon izlemesi şart

Sistem şimdi kaydedilmiş tam cümlelerle sınırlı, fakat ‘bunun gerçek hayatta da kullanılması’ isteniyor. Chung çözümü işaret ediyor: “Televizyon izlemeye devam ettikçe öğrenecek.

Yapay zekanın potansiyeli aşikar, bu teknoloji için geliştirildiğinde de kişilerin gürültülü ortamlarda akıllı telefonlarına talimat verebilmesinden eski sessiz filmlerin dublajlarına kadar değerlendirilebilir. Kısaca, konuşmaların tanımlanması için her türlü iyi bir gelişme olduğu söylenebilir.

 Kaynak: BBC

Oxford Üniversitesi'nden bir grup bilimci, insanlardan daha iyi dudak okuyan bir yapay zeka geliştirdi. Geliştirilen sistem için Google'ın DeepMind adlı yapay zeka ekibinden destek alınırken, BBC'nin haberleriyle saatlerce eğitim yapıldı. 'Watch, Attend and Spell' (İzle, Dikkat Et ve Hecele) adı verilen sistem, sessiz bir konuşma izlediğinde yüzde 50 oranında kelimeleri doğru seçiyor. Sistem şu an yeterli değil, ama geliştirilirse duyma problemi yaşayan kişilerden akıllı telefonlara gürültülü ortamlarda komut verebilmeye kadar yarar sağlayacağı düşünülüyor. Sistemin gelişmesi için ise tek ihtiyacı televizyon izlemek.

Yorum Ekle

Yorum yazmak için tıklayın

Yorumunuz:

  • Türkiye İş Bankası'nın katkılarıyla

Bülten Aboneliği

Günlük haberleri eposta bültenimizle takip edin!

Teşekkür ederiz.

Bir terslik var...