Исследователи Калифорнийского университета в Беркли разработали роботизированную технологию обучения, которая позволяет роботам представлять будущее своих действий, чтобы они могли понять, как манипулировать объектами, с которыми они никогда не сталкивались ранее. В будущем эта технология может помочь автомобилям с автоматическим вождением предвидеть будущие события на дороге и производить более умных помощников-роботов в домах, но первоначальный прототип сфокусирован на изучении простых ручных навыков исключительно из автономной игры.
Используя эту технологию, называется визуальное предвидениероботы могут предсказать, что их камеры увидят, если они выполнят определенную последовательность движений. Эти фантазии роботов пока еще относительно просты - предсказания сделаны только через несколько секунд в будущем - но их достаточно, чтобы робот мог понять, как перемещать объекты на столе, не мешая препятствиям. Важно отметить, что робот может научиться выполнять эти задачи без какой-либо помощи людей или предварительных знаний о физике, окружающей среде или о том, что это за объекты. Это потому, что зрительное воображение полностью изучено с нуля из необслуживаемых и неконтролируемых исследований, где робот играет с объектами на столе. После этой фазы игры робот строит прогнозирующую модель мира и может использовать эту модель для манипулирования новыми объектами, которые он раньше не видел.
«Точно так же, как мы можем представить, как наши действия будут перемещать объекты в нашей среде, этот метод может позволить роботу визуализировать, как различные виды поведения будут влиять на мир вокруг него», - сказал он. Сергей Левин, доцент кафедры электротехники и компьютерных наук Беркли, в лаборатории которой была разработана технология. «Это может позволить разумное планирование очень гибких навыков в сложных реальных ситуациях».
[the_ad id = "11018 ″]
Исследовательская группа проведет демонстрацию технологии визуального предвидения на Конференция по обработке нейронных информационных систем в Лонг-Бич, Калифорния, в декабре 5.
В основе этой системы лежит технология глубокого обучения, основанная на сверточном рекуррентном предсказании видео, или динамическая нейронная адвекция (ДНК). Основанные на ДНК модели предсказывают, как пиксели изображения будут перемещаться из одного кадра в другой в зависимости от действий робота. Недавние усовершенствования этого класса моделей, а также значительно улучшенные возможности планирования позволили автоматизированному управлению на основе видео предсказания выполнять все более сложные задачи, такие как перемещение игрушек вокруг препятствий и перемещение нескольких объектов.