Microsoft'un Ses Tanıma Sistemi, İnsanları Yakaladı...

Microsoft, yapay zeka konusunda ne kadar ciddi olduğunu kanıtlayan, önemli bir başarıya daha imzasını attı!

Microsoft'un yeni duyurusuna göre ses tanımlama kodunda büyük bir atılım yaşanmış durumda ve yeni sistem, kelimeleri artık insanların duyduğu kadar doğru bir şekilde algılıyor.

Microsoft Artificial Intelligence and Research mühendislerinin raporuna göre ses tanıma sistemi artık insan seviyesine ulaşmış durumda. Başka bir deyişle artık sadece insanların yaptıkları duyma hataları söz konusu olabiliyor. Yapılan testlerde sistem, yüzde 5.9 kelime hatası oranına ulaştı ve araştırma ekibi bunun, profesyonel not dökümcüleri ile aynı seviyede veya daha iyi olduğunu söylemekte.

Bunun büyük bir başarı olmasının yanı sıra Microsoft, bu başarının önünü açtığı imkanların da farkında. Bunun en belirgin kullanım alanlarından biri, şu anda da ses komutları ile açılabilen, oyunları başlatabilen ve daha fazlasını yapabilen Xbox One olabilir.

Ayrıca Microsoft Artificial Intelligence and Research yardımcı başkanı Harry Shum, firmanın Siri-benzeri Cortana sanal asistanını özellikle belirterek, bu yeni sistem sayesinde "gerçekten zeki bir asistanın" üretilmesinin mümkün olduğunu söylemekte.

Google'ın DeepMind projesi de bu yıl Alpha Go robotu ile beraber yapay zeka alanında büyük adımlar atmış durumda ve insanlığın en iyi Go şampiyonlarından bazılarını yendi bile. Bu oyun, neredeyse sonsuz stratejik seçeneklerinden dolayı uzun bir süredir robotlar için anlaşılması imkansız olarak görülmekteydi.

Geçtiğimiz ay da DeepMind mühendisleri, robot konuşmalarının insanlara bir miktar daha yaklaşmasını sağlayan WaveNet sistemini geliştirmişlerdi.

Her ne kadar Microsoft'un bu başarısı oldukça büyük olsa da, yeni ses sistemi de insanlarla aynı sorunları yaşayabiliyor. Başka bir deyiş ile aksanlar, konuşma engelleri ve rahatsız edici arka plan sesleri halen bu sistem için sorun olabiliyor.

Ayrıca Microsoft, ses tanımanın konuşmayı anlamak ile aynı şey olmadığının da altını çizmekte. Bir konuşmayı kelimelere aktarmak ve bunların ne anlama geldiğini ayırt etmek iki farklı şey. Microsoft'un bir sonraki adımı da bu olarak görülmekte: Sadece konuşmayı tanıyabilen değil, aynı zamanda da anlayabilen ve yanıt verebilen bir sistem geliştirmek...

Sonraki Haber

Forum