Pennsylvania Üniversitesi’ndeki bir grup bilim insanı, OpenAI GPT-4 gibi büyük yapay zeka dil modellerini kullanarak robotları eğitmek için tasarlanan DrEureka adlı bir sistem geliştirdi. Anlaşıldığı üzere, bu, gerçek dünyadaki bir dizi görevden daha etkili bir yöntemdir.
DrEureka (Etki Alanı Rastgeleleştirme Eureka) platformu, açık kaynak yazılımlı dört ayaklı bir makine olan Unitree Go1 robot örneğini kullanarak işlevselliğini kanıtladı. Sürtünme, kütle, sönümleme, ağırlık merkezi yer değiştirmesi ve diğer parametreler gibi temel değişkenlerin rastgele seçilmesi kullanılarak simüle edilmiş bir ortamda bir robotun eğitilmesini içeriyor. Yapay zeka, çeşitli kullanıcı isteklerine dayanarak robotun sanal ortamda eğitilmesi için bir ödül ve ceza sistemini açıklayan kod oluşturdu. Her simülasyonun sonunda yapay zeka, sanal robotun bir sonraki görevle ne kadar iyi başa çıktığını ve performansının nasıl iyileştirilebileceğini analiz ediyor. Sinir ağının büyük hacimlerde hızlı bir şekilde senaryolar oluşturabilmesi ve bunların eş zamanlı olarak yürütülmesini başlatabilmesi işlemi kolaylaştırıyor.
Yapay zeka, mekanizmanın arızalandığı veya bozulduğu noktalarda maksimum ve minimum parametre değerlerine sahip görevler oluşturuyor; bunun başarılması veya aşılması, eğitim senaryosunu tamamlama puanının düşmesini gerektirir. Çalışmanın programcıları, AI kodunu doğru bir şekilde yazmak için ek güvenlik talimatlarının gerekli olduğunu, aksi takdirde sinir ağının maksimum performans elde etmek amacıyla simülasyon sırasında “hile yapmaya” başladığını ve bunun gerçek dünyada motorların aşırı ısınmasına veya robotun uzuvlarında hasar bırakmasına neden oluyor. Bu doğal olmayan senaryolardan birinde sanal robot, bacaklarından birini kapatıp üç bacakla hareket etmeye başlarsa daha hızlı hareket edebileceğini “keşfetti”.
Araştırmacılar, eğitilen robotun gerçek dünyada test edileceği göz önüne alındığında yapay zekaya özel dikkat göstermesi talimatını verdi; böylece sinir ağı, hareketlerin düzgünlüğü, yatay yönelim ve gövde yüksekliği gibi yönler için ek güvenlik işlevleri de oluşturdu. elektrik motorları için tork miktarı dikkate alındığında belirtilen değerlerin aşmaması gerekiyor. Sonuç olarak, DrEureka sistemi, robotu insandan daha iyi eğitmeyi başardı: makine, hareket hızında yüzde 34’lük bir artış ve engebeli arazide kat edilen mesafede yüzde 20’lik bir artış gösterdi. Araştırmacılar bu sonucu yaklaşımlardaki farklılıkla açıkladılar. Bir problemi öğrenirken, kişi onu birkaç aşamaya ayırır ve her biri için bir çözüm bulurken, GPT her şeyi aynı anda öğretir ve insanların bunu yapamayacağı bellidir.
Sonuç olarak DrEureka sistemi simülasyondan gerçek dünyadaki çalışmaya doğrudan geçmemize olanak sağladı. Projenin yazarları, yapay zekaya gerçek dünyadan geri bildirim sağlayabilirlerse platformun verimliliğini daha da artırabileceklerini iddia ediyorlar – bunun için sinir ağının, testlerin video kayıtlarını sınırlamak yerine incelemesi gerekecek. Robotun sistem günlüklerindeki hataları analiz etmek için. Ortalama bir kişinin yürümeyi öğrenmesi 1,5 yıl kadar sürer ve yalnızca birkaçı yoga topuna binebilir. DrEureka tarafından eğitilen robot bu görevin üstesinden etkili bir şekilde geliyor.