Yapay zeka ve makine öğrenimi üzerine araştırmaları ile ünlenen OpenAI firması, geçtiğimiz günlerde yaptığı bir gösterimde Rübik Küpünü çözen bir robot eli tanıttı.
Dactyl adını taşıyan robot el, Automatic Domain Randomization (ADR) olarak adlandırılan yeni bir teknik ile beraber bir çift sinir ağının çalışmasıyla ve takviyeli öğrenimle eğitildi. Dactyl tarafından kullanılan takviyeli öğrenim algoritması, daha önce Dota 2'de insan rakiplere karşı kendisini kanıtlamıştı.
Yeni teknik ADR, robot elin saygıdeğer bulmacayı çözmek için eğitilmesi adına en önemli etmendi ve Dactyl'in çalışması için sürekli olarak zorluğu artan eğitim senaryoları oluşturuyordu. ADR, çalışmaya tekil, rastlantısal olmayan bir ortamda başlıyor ve burada sinir ağı Rubik Küpünü çözmeyi öğreniyor. Sinir ağı bu görevde daha başarılı olduğunda ve bir performans sınırına ulaştığında, rastlantılık otomatik olarak artıyor. Bu da görevi, sinir ağının daha rastlantısal ortamlara göre genelleştirmeyi öğrenmesini gerektirdiğinden dolayı, daha da zorlaştırıyor. Ağ, bir kez daha performans sınırına ulaşana kadar öğrenmeye devam ediyor ve bu noktada rastlantısallık bir kez daha artıyor. Süreç temel olarak bu şekilde ilerlemeye devam ediyor.
Ekibin söylediğine göre ADR çok önemli bir gelişim; çünkü sürekli olarak zorlaşan eğitim simülasyonları, "gerçek dünyanın doğru bir modelini kurma zorunluluğunu ortadan kaldırıyor" ve simülasyonda eğitilen sinir ağlarının gerçek dünyaya uygulanmasına imkan tanıyor. Dactyl, aralarında parmakların bağlanması, lastik eldiven giyilmesi ve benzeri çeşitli fiziksel senaryolara uyum sağlayabiliyor.
Robotik alanındaki pek çok önemli isim ve profesör, OpenAI'nin hem Rübik Küpünü çevirecek ince yeteneği oluşturması, hem de farklı senaryolara karşı öğrenme yeteneği konusunda geleceğin bu yöntemde olduğunu düşünüyor. Yine de takviyeli öğrenimin gelecek için doğru seçenek olduğundan emin olmayan kişiler de var. Bu şüphenin arkasındaki temel sebep, takviyeli öğrenimin temel özelliği ve tek bir görevde ustalaşmaktan ziyade çok sayıda görevi yapabilecek hale gelip gelemeyeceği sorusundan kaynaklanıyor.