Un groupe de scientifiques de l'Université de Pennsylvanie a développé un système appelé Dreureka conçu pour former des robots à l'aide de grands modèles de langage d'intelligence artificielle tels que Openai GPT-4. Comme il est compris, il s'agit d'une méthode plus efficace qu'une série de tâches dans le monde réel.

La plate-forme Dreureka (Eureka) a prouvé sa fonctionnalité en utilisant l'exemple de robot Unitree Go1, une machine à quatre pattes avec un logiciel open source. Il implique la formation d'un robot dans un environnement simulé en utilisant une sélection aléatoire de variables de base telles que la frottement, la masse, l'amortissement, le centre de gravité et d'autres paramètres. L'intelligence artificielle a créé une récompense et un code qui explique le système pénal pour former le robot dans un environnement virtuel basé sur diverses demandes d'utilisateurs. À la fin de chaque simulation, l'intelligence artificielle analyse la façon dont le robot virtuel fait face à la tâche suivante et comment améliorer les performances. Le fait que le réseau nerveux puisse rapidement créer des scénarios en gros volumes et démarrer leur exécution simultanée facilite le processus.

L'intelligence artificielle constitue des tâches avec des valeurs de paramètres maximales et minimales aux points où le mécanisme est mal fonctionné ou cassé; Le succès ou la surmonter cela nécessite une diminution de la fin du scénario de formation. Les programmeurs de l'étude provoquent des instructions de sécurité supplémentaires nécessaires pour rédiger correctement le code d'IA, sinon le réseau nerveux commence à «tromper Olarak pendant la simulation pour atteindre des performances maximales, ce qui fait surchauffer ou endommager le robot dans le monde réel.

Les chercheurs ont demandé au robot formé de prêter une attention particulière à l'intelligence artificielle, étant donné que le robot sera testé dans le monde réel; Ainsi, le réseau nerveux, la douceur des mouvements, l'orientation horizontale et la hauteur du corps des fonctions de sécurité supplémentaires formées. Compte tenu de la quantité de couple pour les moteurs électriques, les valeurs spécifiées ne doivent pas dépasser. En conséquence, le système Dreureka a réussi à former le robot mieux que l'homme: la machine a montré une augmentation de 34% de vitesse de mouvement et une augmentation de 20% sur la terre accidentée. Les chercheurs ont expliqué ce résultat avec une différence d'approches. Lors de l'apprentissage d'un problème, la personne la divise en plusieurs étapes et trouve une solution pour chacun, le GPT enseigne tout en même temps et il est clair que les gens ne peuvent pas le faire.

En conséquence, le système Dreureka nous a permis de passer directement de la simulation au monde réel. Les auteurs du projet affirment que s'ils peuvent fournir des commentaires du monde réel à l'intelligence artificielle, ils augmenteront encore l'efficacité de la plate-forme - pour cela, le réseau neuronal devra examiner les enregistrements vidéo des tests au lieu de limiter les enregistrements vidéo. Pour analyser les erreurs dans les journaux du système du robot. Il faut environ 1,5 ans à une personne moyenne pour apprendre à marcher et seuls quelques-uns peuvent faire du ballon de yoga. Formé par Dreureka, le robot surmonte effectivement cette tâche.