Microsoft'un Yeni Patenti, Bilgisayarlarla Konuşmayı Normalleştirecek
Microsoft'un yeni patenti, bilgisayarlar ile kurduğumuz sesli iletişimi daha doğal ve "daha gerçek" bir hale getirmeyi amaçlıyor.
Birleşik Devletler Patent Ofisi tarafından Microsoft'a yeni
verilen bir patent, firmanın kullanıcıların konuşma tarzı
ve/veya yüz ifadelerini öğrenen ve buna göre hareket eden
sanal konuşma birimleri üzerine çalıştığını gösteriyor.
Dilsel Tarz Eşleşme Birimi adı verilen patent, 3
Eylül 2020 tarihinde Microsoft'a verildi
ve geliştiricileri olarak Daniel J
McDuff, Kael R. Rowan, Mary P
Czerwinski, Deepali Aneja ve Rens
Hoegen'i sayıyor.
Konuşma tanıma ve diyalog oluşturma modellerindeki gelişmeler, chatbot'lar ve sanal asistanlar benzeri konuşma arayüzlerini daha popüler hale getiriyor. Her ne kadar bu doğal dil etkileşimleri insan-bilgisayar etkileşiminde yeni bir çağ başlatmış olsa da, iletişim çoğunlukla monoton ve sınırlı oluyor. Bu yüzden de bu iletişimler sadece belirli işlemleri gerçekleştirmeye yönelik oluyor ve doğal olmuyor.
Yeni teknoloji ise, kullanıcının konuşma tarzı ve yüz ifadeleri
ile uyumlu olan, daha doğal, çok dönüşlü diyalog kurabilen uçtan
uca ses tabanlı bir iletişim birimini sunmayı planlıyor.
Bu birim sadece sesli olabilir veya konuşmak için gözüken bir "yüz"e sahip olabilir gibi gözüküyor. Ancak bu iki uygulamada da makine öğrenimi teknikleri kullanılarak kullanıcılara doğal ve anlaşılır bir şekilde cevap verilmesi ve bu sayede de genel olarak insan-makine etkileşimlerinin geliştirilmesi hedefleniyor.