Birleşik Devletler Patent Ofisi tarafından Microsoft'a yeni verilen bir patent, firmanın kullanıcıların konuşma tarzı ve/veya yüz ifadelerini öğrenen ve buna göre hareket eden sanal konuşma birimleri üzerine çalıştığını gösteriyor. Dilsel Tarz Eşleşme Birimi adı verilen patent, 3 Eylül 2020 tarihinde Microsoft'a verildi ve geliştiricileri olarak Daniel J McDuff, Kael R. Rowan, Mary P Czerwinski, Deepali Aneja ve Rens Hoegen'i sayıyor.
Konuşma tanıma ve diyalog oluşturma modellerindeki gelişmeler, chatbot'lar ve sanal asistanlar benzeri konuşma arayüzlerini daha popüler hale getiriyor. Her ne kadar bu doğal dil etkileşimleri insan-bilgisayar etkileşiminde yeni bir çağ başlatmış olsa da, iletişim çoğunlukla monoton ve sınırlı oluyor. Bu yüzden de bu iletişimler sadece belirli işlemleri gerçekleştirmeye yönelik oluyor ve doğal olmuyor.
Yeni teknoloji ise, kullanıcının konuşma tarzı ve yüz ifadeleri ile uyumlu olan, daha doğal, çok dönüşlü diyalog kurabilen uçtan uca ses tabanlı bir iletişim birimini sunmayı planlıyor.
Bu birim sadece sesli olabilir veya konuşmak için gözüken bir "yüz"e sahip olabilir gibi gözüküyor. Ancak bu iki uygulamada da makine öğrenimi teknikleri kullanılarak kullanıcılara doğal ve anlaşılır bir şekilde cevap verilmesi ve bu sayede de genel olarak insan-makine etkileşimlerinin geliştirilmesi hedefleniyor.