Sydney Teknoloji Üniversitesi'ndeki GrapheneX-UTS İnsan Odaklı Yapay Zeka Merkezi’ndeki araştırmacıların yeni buluşu, düşüncelerin ekranda görülen kelimelere dönüşmesini sağlarken “zihin okuma” artık bir gerçeklik haline gelmek üzere olabilir.
UTS Bilgisayar Bilimleri Okulu Seçkin Profesörü (Seçkin Profesör, Türkiye’de bir süre boyunca kullanılan Ordinaryüs Profesör unvanına benzeyen bir unvandır) ve GrapheneX-UTS HAI Merkezi Direktörü Ching-Ten Lin, “Bu araştırma, saf EEG dalgalarını doğrudan dile çevirme konusunda öncü bir çabayı temsil ediyor ve bu alanda önemli bir gelişmeyi gösteriyor” dedi ve ekledi: “Bu, beyinden metne çeviri sürecine ayrı kodlama tekniklerini dahil eden ve sinirsel kod çözmeye yenilikçi bir yaklaşım getiren ilk çalışmadır. Büyük dil modelleriyle entegrasyon aynı zamanda sinir bilimi ve yapay zeka alanında da yeni ufuklar açıyor.”
Yapay zeka ve makine öğrenimi araştırmacılarının yıllık toplantısı olan NeurIPS konferansında öne çıkan bir makale olarak seçilen çalışmada, katılımcılar sessizce metin parçalarını okurken, DeWave adı verilen bir yapay zeka modeli, girdi olarak yalnızca beyin dalgalarını kullanarak bu kelimeleri ekrana yansıttı.
Bu araştırma, beyin sinyallerini konuşma diline çevirebilen ilk teknoloji olmasa da, şu ana kadar geliştirilenler arasında beyin implantlarına veya tam donanımlı bir MRI makinesine erişim gerektirmeyen tek teknoloji olarak dikkat çekiyor. Araştırmacılar, yeni teknolojinin, göz izleme yazılımı gibi ek girdi gerektiren önceki modellere göre de bir avantajı olduğunu ve bu tür ekstra donanımlarla birlikte veya bu bunlar olmadan kullanılabildiğini söylüyor.
Yeni teknolojide, kullanıcıların beyin aktivitelerini elektroensefalogram (EEG) aracılığıyla kaydeden bir başlık takmaları yeterli oluyor. Bu, bir göz takip cihazından (ve doğal olarak bir MRI makinesinden) çok daha pratik ve kullanışlı bir sistem. Araştırmacılar, sadece bu başlığın kullanılmasının sinyalin implantlardan elde edilen bilgiye göre biraz daha fazla gürültüye sahip olduğu anlamına geldiğini kabul ediyor olsalar da, bu gürültüye rağmen denemelerde oldukça iyi performans gösterdi. Orijinal bir metnin makine tarafından çevrilmiş bir çıktıya benzerliğini ona 0 ile 1 arasında bir puan vererek değerlendirmenin bir yolu olan BLEU algoritmasını kullanan doğruluk ölçümleri, yeni teknolojiyi yaklaşık 0,4 olarak belirledi.
Elbette bu oran, daha invaziv yöntemlere dayanan diğer seçeneklerden bazıları kadar iyi değil. Araştırmaya eşlik eden makalenin baş yazarı Yiqun Duan’ın belirttiğine göre model, fiilleri eşleştirme konusunda isimlerden daha becerikli gözüküyor. İsimler söz konusu olduğunda, kesin çeviriler yerine eşanlamlı çiftlere doğru bir eğilim görülüyor; örneğin ‘yazar’ yerine ‘adam’ gibi...
Duan, “[Bu hataların] beyin bu kelimeleri işlediğinde anlamsal olarak benzer kelimelerin benzer beyin dalgası modelleri üretebilmesinden kaynaklandığını düşünüyoruz” diyor.
Duan, “zorluklara rağmen modelimiz anlamlı sonuçlar veriyor” diyor ve “anahtar kelimeleri sıralayabiliyor ve benzer cümle yapıları oluşturabiliyor” diye ekliyor.
Sonuçlar NeurIPS konferansında sunuldu ve henüz hakem incelemesinden geçmemiş olan ön baskı sürümü ArXiV üzerinde yayınlandı.