Группа ученых из Университета Пенсильвании разработала систему под названием Dreureka, предназначенная для обучения роботов с использованием крупных моделей языка искусственного интеллекта, таких как OpenAI GPT-4. Как понимается, это более эффективный метод, чем серия задач в реальном мире.
Платформа Dreureka (Eureka) доказала свою функциональность, используя пример Robot Unitere GO1, четырехгруппированную машину с программным обеспечением с открытым исходным кодом. Он включает в себя обучение робота в среде, моделируемой с использованием случайного выбора основных переменных, таких как трение, масса, демпфирование, центр тяжести и другие параметры. Искусственный интеллект создал вознаграждение и код, который объясняет криминальную систему для обучения робота в виртуальной среде, основанной на различных запросах пользователей. В конце каждой симуляции искусственный интеллект анализирует, насколько хорошо виртуальный робот справляется со следующей задачей и как повысить производительность. Тот факт, что нервная сеть может быстро создавать сценарии в больших объемах и начать одновременное выполнение, облегчает процесс.
Искусственный интеллект представляет собой задачи с максимальными и минимальными значениями параметров в точках, где механизм неисправен или сломан; Успех или преодоление этого требует уменьшения завершения сценария обучения. Программисты исследования вызывают дополнительные инструкции по безопасности, необходимые для правильной записи кода ИИ, в противном случае нервная сеть начинает «обманывать Оларак во время симуляции для достижения максимальной производительности, и это приводит к перегреву или повреждению робота в реальном мире. В одном из этих неестественных сценариев виртуальный робот обнаружил, что он может перемещаться быстрее.
Исследователи проинструктировали обученного робота обратить особое внимание на искусственный интеллект, учитывая, что робот будет протестирован в реальном мире; Таким образом, нервная сеть, плавность движений, горизонтальная ориентация и высота тела дополнительных функций безопасности. Учитывая количество крутящего момента для электродвигателей, указанные значения не должны превышать. В результате система Dreureka удалось обучить робота лучше человека: машина показала увеличение на 34 процента в скорости движения и увеличение на 20 процентов на бурной земле. Исследователи объяснили этот результат с разницей в подходах. При изучении проблемы человек делит ее на несколько этапов и находит решение для каждого, GPT учит всему одновременно, и ясно, что люди не могут этого сделать.
В результате система Dreureka позволила нам напрямую перейти от симуляции в реальный мир. Авторы проекта утверждают, что если они смогут предоставить отзыв от реального мира искусственному интеллекту, они дополнительно повысят эффективность платформы - для этого нейронная сеть должна будет изучить видеозаписи тестов вместо ограничения видеозаписей. Анализировать ошибки в системных дневниках робота. Средний человек, чтобы учиться ходить, требуется около 1,5 года, и лишь немногие могут ездить на йоге. Обученный Dreureka, робот эффективно преодолевает эту задачу.