OpenAI uzmanları, Minecraft'ı insan oyuncular kadar yüksek standartta oynayan bir sinir ağını eğitti. Sinir ağı, klavye ve fare girişlerinin de kaydedildiği, yüklenicilerin belirli oyun içi görevleri gerçekleştirdiği küçük bir video veritabanıyla desteklenen 70.000 saatlik çeşitli oyun içi görüntüler ile eğitildi.
İnce ayardan sonra OpenAI, modelin yüzmeden hayvan avlamaya ve etlerini tüketmeye kadar her türlü karmaşık beceriyi gerçekleştirebildiği gördü. Aynı zamanda, oyuncunun yükselmek için sıçrarken altına bir malzeme bloğu yerleştirdiği bir hareket olan “sütun tırmanmayı” da kavradı.
Belki de en etkileyici olanı, yapay zeka, OpenAI'nin bir bilgisayar aracısı için benzeri görülmemiş bir başarı olarak tanımladığı, sırayla yürütülmesi gereken uzun bir dizi eylemi gerektiren elmas araçları üretebildi.
Minecraft projesi, şirketin Video PreTraining (VPT) olarak adlandırılan AI modellerinin eğitiminde OpenAI tarafından kullanılan yeni bir tekniğin işe yaradığını kanıtladığından dolayı büyük önem taşıyor.
Geçmişe bakıldığında, yapay zeka modellerini eğitmek için bir kaynak olarak ham videoyu kullanmanın en büyük zorluğu, olanların anlaşılması için yeterince basit olmasıydı, ancak bu video eğitimleri sonuçların nasılını öğretmiyor. Gerçekte, AI modeli istenen sonuçları emiyor, ancak bunlara ulaşmak için gereken girdi kombinasyonlarını kavrayamıyor.
Ancak VPT ile OpenAI, temel modeli oluşturmak için ilgili klavye ve fare hareketleriyle etiketlenmiş, özenle seçilmiş bir görüntü havuzuyla halka açık web kaynaklarından alınan büyük bir video veri kümesini eşleştiriyor.
Ekip, temel modelde ince ayar yapmak amacıyla belirli görevleri öğretmek için tasarlanmış daha küçük veri kümelerini ekler. Bu anlamda, OpenAI, ağaçların kesilmesi ve üretim istasyonları inşa edilmesi gibi erken oyun eylemlerini gerçekleştiren oyuncuların görüntülerini kullandı. Bunun, modelin bu görevleri yerine getirebildiği güvenilirlikte "büyük bir gelişme" sağladığı söyleniyor.
Bir diğer teknik, pekiştirmeli öğrenme olarak bilinen bir uygulama olan bir dizi görevdeki her adımı başarmak için AI modelini "ödüllendirmeyi" içeriyor. Bu süreç, sinir ağının insan düzeyinde bir başarı oranına sahip olarak bir elmas kazma üretebilmek için tüm malzemeleri toplamasını sağladı.
OpenAI tarafından gönderilen bir blog yazısında “VPT, yalnızca dilden daha fazla alanda doğrudan büyük ölçekli davranışsal öncelikleri öğrenmenin heyecan verici olasılığını sunuyor. Yalnızca Minecraft'ta deneyler yapsak da, oyunun ucu çok açık ve yerel insan arayüzü (fare ve klavye) çok genel, bu nedenle sonuçlarımızın diğer benzer alanlar, örneğin bilgisayar kullanımı için iyiye işaret ettiğine inanıyoruz."