Google'dan İnsandan Daha İyi Dudak Okuyan Yapay Zeka

Google'dan ve Oxford Üniversitesi'nden bilim adamları, yapay zeka ile dudak okuma konusunda dikkat çekecek bir adım attılar!

Google'ın yapay zeka bölümü Deep Mind ve Oxford Üniversitesi'nden araştırmacılar, piyasanın en iyi dudak okuma yazılımını geliştirdiler.

BBC'den binlerce saatlik video ile eğitilen sinir ağı, videolardaki konuşmaları yüzde 46,8 isabetle algılayabildi. Ses kaydından yapılan algılamaya göre bu oranın pek etkileyici görünmediği doğru. Ancak profesyonel bir insan dudak okuyucusunun ancak yüzde 12,4 isabet kaydedebildiğini söyleyelim.

Oxford Üniversitesi'nden benzer bir araştırma sürdüren bir başka grup, testlerde yüzde 93,4 isabete ulaşan LipNet adlı bir program geliştirmişti. Bu testlerde insanların sağladığı isabet ise yüzde 52,3 idi. Ancak LipNet'in testi, sadece özel kaydedilmiş, sabit ifadelerden oluşan cümlelerden oluşuyordu. DeepMind'ın yazılımı ise çok daha zor videolarla test edildi.

DeepMind araştırmacıları, programın duyma zorluğu çeken kişilere yardımcı olabileceğini, sessiz filmlere açıklamalar yazmakta kullanılabileceğini veya Siri, Alexa gibi dijital asistanları kontrol etmekte kullanılabileceğini söylüyor. Bu tür teknolojiler elbette gizlilik endişeleriyle de geliyor – dudak okuyan yazılımlar, gelecekte günlük hayatta konuştuklarımızı kaydetmekte kullanılabilir. Bununla birlikte araştırmacılar, parlak, iyi aydınlatılmış yüksek çözünürlüklü videolarla karlı, kare oranı düşük görüntülerde kaydettikleri isabet arasında halen büyük farklar olduğunu söylüyorlar. Yine de bu fark, giderek kapanıyor gibi görünüyor.

Sonraki Haber

Forum