Microsoft'un Konuşma Tanıma Sistemi Yeni Rekor Kırdı

Microsoft bugün yaptığı açıklamada sohbet ve konuşma tanıma sistemi hata payının %5.1'e indiğini, ve bunun da şimdiye dek eriştikleri en yüksek isabet oranı olduğunu bildirdi. Bu oran, geçtiğimiz yıl Microsoft Yapay Zeka ve Araştırma ekibinin ulaştığı %5.9'u geride bırakıyor.

Her iki çalışma da, araştırmacıların 1990'ların başından beri konuşma tanıma sistemlerini test etmek için kullandıkları yaklaşık 2,400 telefon görüşmesinden oluşan Switchboard corpus'tan kayıtları kullandı. Microsoft Yapay Zeka ve Araştırma'da çalışan bir grup araştırmacının yeni çalışması, yapay zekayı insan seviyesine yaklaştırmayı amaçlıyor. Ekip, yapay zekanın duyduklarını içeriğe dönüştürmesini, sohbetin içeriğine erişmesini ve diğer içeriklerle çalışabilmesini sağlıyor.

Genel olarak, son araştırmacılar, Microsoft'un konuşma tanıma sisteminin sinir ağı tabanlı akustik ve dil modellerini geliştirerek hata oranını geçen yılki bulgulara kıyasla yaklaşık yüzde 12 oranında azalttı. Özellikle, konuşma tanıma cihazını, transkripsiyonlarını içeriğe uyarlamasına ve bir sonraki konuşmada insanların yaptığı gibi, gelecekte hangi kelimelerin ya da kelime öbeklerinin geleceğini tahmin etmesini sağlayan tüm konuşmaları kullanmasını sağladılar.

Microsoft'un konuşma tanıma sistemi Cortana, Presentation Translator ve Microsoft Bilişsel Hizmetler gibi hizmetlerde kullanılıyor.