Microsoft’un ses tanıma sistemi insanlardan daha başarılı

Microsoft, dün yaptığı açıklamada, sohbet konuşmalarını anlama sisteminin hata oranının yüzde 5,1'e kadar düştüğünü açıkladı.

Haber Özeti

Tam Sürüm

Microsoft, dün yaptığı açıklamada, sohbet konuşmalarını anlama sisteminin hata oranının yüzde 5,1’e kadar düştüğünü açıkladı. Bu rakam, geçtiğimiz yıl Microsoft Yapay Zeka ve Araştırma ekibinin eriştiği yüzde 5,9 hata oranından daha iyi ve Microsoft’un sistemini profesyonel sesten yazıya aktarım uzmanları kadar başarılı bir hale getiriyor. Üstelik bu işi yapan insanlar, aynı konuşmayı birden fazla dinleme imkanına sahip oluyor.

Her iki çalışmada da Switchboard kütüphanesinden alınan 2 bin 400 adet telefon konuşması kaydı kullanıldı. Bu konuşmalar, araştırmacılar tarafından 1990’lardan bu yana ses tanıma yazılımlarını test etmek için kullanılıyor. Yeni araştırma, Microsoft Yapay Zeka ve Araştırma ekibi tarafından, bu işi profesyonel olarak gerçekleştiren insanların seviyesinde bir yazılım geliştirme amacıyla yapıldı.

İnsan gibi konuşmayı dinliyor

Ortalama olarak hata oranı geçtiğimiz yılın sonuçlarına oranla yüzde 12 azaldı. Bu başarıya ulaşmak için Microsoft’un konuşma tanıma sisteminin yapay sinir ağı tabanlı akustik ve dil modelleri geliştirildi. Ayrıca ses algılayıcının konuşmanın tamamını dikkate alarak, konuşmanın bağlamını da göz önünde bulundurması sağlandı. Böylece yazılım, tıpkı insanların yaptığı gibi, konuşmanın gidişatını göz önünde bulundurarak, bir sonraki kelimenin ne olacağı hakkında tahmin yürütebilir hale geldi.

Microsoft’un konuşma tanıma sistemi Cortana, Presentation Translator (sunum çevirici) ve Microsoft Cognitive Services (Miccrosoft Bilişsel Hizmetleri) gibi alanlarda kullanılıyor.

Kaynak: TechCrunch

Microsoft, dün yaptığı açıklamada, sohbet konuşmalarını anlama sisteminin hata oranının yüzde 5,1'e kadar düştüğünü açıkladı. Bu rakam, geçtiğimiz yıl Microsoft Yapay Zeka ve Araştırma ekibinin eriştiği yüzde 5,9 hata oranından daha iyi ve Microsoft'un sistemini profesyonel sesten yazıya aktarım uzmanları kadar başarılı bir hale getiriyor. Ayrıca yazılım, tıpkı insanların yaptığı gibi, konuşmanın gidişatını göz önünde bulundurarak, bir sonraki kelimenin ne olacağı hakkında tahmin yürütebiliyor.

Yorum Ekle

Yorum yazmak için tıklayın

Yorumunuz:

e-Bülten Aboneliği