Yapay zekaya IQ testi yaptılar, sonuç hiç de beklendiği gibi çıkmadı

Yeni bir araştırmaya göre yapay zeka, insanların temel problem çözme becerilerine göre halen çok gerilerde kalıyor.

Meta'nın yapay zeka bilimcisi Yann LeCun'un son araştırması, yapay zekanın yakın zamanda işlerimizi ele geçirmesinin pek mümkün olmadığını gösteriyor. Yakın zamanda yayınlanan bir makalede LeCun, yapay zekanın en önemli konularda insanlardan çok daha aptal olduğunu savunuyor.

Hugging Face ve AutoGPT gibi diğer yapay zeka girişimlerinden araştırmacılar da dahil olmak üzere bir dizi başka bilim insanı tarafından ortaklaşa yazılan bu makale, yapay zekanın genel amaca yönelik muhakemesinin ortalama bir insan karşısında nasıl olduğunu inceliyor. Bunu ölçmek için araştırma ekibi, çalışmanın tanımladığı gibi "insanlar için kavramsal olarak basit ancak en gelişmiş yapay zekalar için zorlayıcı" olacak kendi soru listesini oluşturdu. Sorular bir insan grubuna ve OpenAI'nin en son büyük dil modeli olan GPT-4'ün eklenti donanımlı bir versiyonuna verildi. Henüz hakem değerlendirmesinden geçmemiş olan araştırma, yapay zeka programlarını "akıl yürütme, çoklu modalite kullanımı, web taraması ve genel olarak araç kullanım yeterliliği gibi bir dizi temel yetenek gerektiren gerçek dünya sorularına" nasıl yanıt verecekleri konusunda test etti.

Araştırmacılar tarafından sorulan sorular, LLM'nin cevap vermek üzere bilgi edinmek için bir dizi adım atmasını gerektiriyordu. Örneğin bir soruda, LLM'den belirli bir web sitesini ziyaret etmesi ve bu sitedeki bilgilere özgü bir soruyu yanıtlaması istenirken; diğerlerinde, programın bir fotoğraftaki bir kişiyle ilişkili bilgiler için genel bir web araması yapması gerekiyordu. Ancak sonuca göre, LLM'ler pek başarılı olamadı. Gerçekten de araştırma sonuçları, büyük dil modellerinin daha karmaşık gerçek dünya problem çözme senaryoları söz konusu olduğunda tipik olarak insanlar tarafından geride kaldığını gösteriyor.

LeCun, son tweet'lerinde sektörün mevcut teknolojik kapasitesini eleştirerek, yapay zekanın insan kapasitesine yakın olmadığını açıkça savunuyor.

Sonraki Haber

Forum