Планирование – монументально трудная вещь для роботов, в основном из-за того, как они чувствуют и взаимодействуют с миром. Восприятие робота мира состоит из не чего иного как обширного множества пикселей, собранных его камерами, и его способность действовать ограничена урегулированием положений отдельных двигателей, которые управляют его суставами и захватами.
Это испытывает недостаток во врожденном понимании того, как те пиксели касаются того, что мы могли бы рассмотреть значащими понятиями в мире.«То взаимодействие низкого уровня с миром делает, это действительно трудно, чтобы сделать решает, что сделать», сказал Джордж Конидэрис, доцент информатики в Брауне и ведущем авторе нового исследования. «Вообразите, как трудно это должно было бы запланировать что-то столь же простое как поездка в продуктовый магазин, если бы Вы должны были думать о каждой мышце, то Вы согнули бы, чтобы добраться там, и вообразить заранее и подробно терабайты визуальных данных, которые пройдут через Ваши сетчатки по пути.
Вы немедленно увязли бы в деталях. Люди, конечно, не планируют тот путь. Мы в состоянии ввести абстрактные понятия, которые выбрасывают ту огромную массу несоответствующей детали и сосредотачиваются только на том, что важно».
Даже современные роботы не способны к такой абстракции. Когда мы видим демонстрации роботов, планирующих и выполняющих многоступенчатые задачи, «почти всегда имеет место, что программист явно сказал робот, как думать о мире для него, чтобы сделать план», сказал Конидэрис. «Но если мы хотим роботы, которые могут действовать более автономно, они собираются нуждаться в способности изучить абстракции самостоятельно».В терминах информатики эти виды абстракций попадают в две категории: «процедурные абстракции» и «перцепционные абстракции».
Процедурные абстракции – программы, сделанные из движений низкого уровня, составленных в высокоуровневые навыки. Пример ушел бы в спешке, все небольшие движения должны были открыть дверь – все моторные движения, вовлеченные в достижение для кнопки, превращение его и натяжение открытой двери – в сингл, «открытый дверь» умение.
Как только такое умение построено, Вы не должны волноваться о том, как оно работает. Все, что Вы должны знать, – когда управлять им. Roboticists – включая самого Конидэриса – учились, как заставить роботы изучать процедурные абстракции в течение многих лет, говорит он.Но по данным Konidaris, было меньше прогресса перцепционной абстракции, которая имеет отношение к помощи роботу понять его пикселированную среду.
Это – центр этого нового исследования.«Наша работа показывает, что, как только у робота есть моторные навыки высокого уровня, это может автоматически построить совместимое символическое представление высокого уровня мира – тот, который доказуемо подходит для планирования использования тех навыков», сказал Конидэрис.
Изучение абстрактных состояний мираДля исследования исследователи ввели робот под названием Устройство Анафемы (или Ана, если коротко) в комнату, содержащую шкаф, кулер, выключатель, который управляет светом в шкафу и бутылкой, которую можно было оставить или в кулере или в шкафу. Они дали Ане ряд моторных навыков высокого уровня для управления объектами в комнате – открытие и закрытие и кулер и шкаф, щелкание выключателем и взятие бутылки.
Тогда они отпустили Ану, чтобы испытать ее моторные навыки в комнате, делая запись сенсорных данных из ее камер и приводов головок прежде и после каждого профессионального выполнения. Те данные были поданы в алгоритм машинного обучения, разработанный командой.(Посмотрите видео процесса здесь: https://www.youtube.com/watch? v=lY4PKBqp9ZM)Исследователи показали, что Ана смогла изучить очень абстрактное описание окружающей среды, которая содержала только, что было необходимо для нее, чтобы быть в состоянии, выполняют конкретное умение.
Например, она узнала, что, чтобы открыть кулер, она должна была стоять перед ним и не держать что-либо (потому что ей были нужны обе руки, чтобы открыть крышку). Она также изучила надлежащую конфигурацию пикселей в ее поле зрения, связанном с более прохладной закрываемой крышкой, который является единственной конфигурацией, в которой возможно открыть его.
Она изучила подобные абстракции, связанные с нею другие навыки. Она узнала, например, что свет в шкафу был так ярок, что это обвинило ее датчики. Таким образом, чтобы управлять бутылкой в шкафу, свет должен был быть выключен.
Она также узнала, что, чтобы выключить свет, дверца шкафа должна была быть закрыта, потому что открытая дверь блокировала ее доступ к выключателю. Получающееся абстрактное представление дистиллировало все это знание вниз от высококачественных изображений до текстового файла, всего 126 линий долго.«Они были всеми важными абстрактными понятиями о ее среде», сказал Конидэрис. «Двери должны быть закрыты, прежде чем они смогут быть открыты. Вы не можете вытащить бутылку из шкафа, если это не открыто и так далее.
И она смогла изучить их только, выполнив ее навыки и видя то, что происходит».Планирование в резюме
Как только Сборник изречений был вооружен ее изученным абстрактным представлением, исследователи попросили, чтобы она сделала что-то, что потребовало некоторого планирования: возьмите бутылку от кулера и поместите его в шкаф.Поскольку они надеялись, что она будет, Ана провела к кулеру и открыла его, чтобы показать бутылку.
Но она не взяла его. Вместо этого она запланировала заранее. Она поняла, что, если бы у нее была бутылка в ее захвате, тогда она не была бы в состоянии открыть шкаф, потому что выполнение так требует обеих рук. Таким образом после того, как она открыла кулер, она провела к шкафу.
Там она видела, что выключатель в «на» положении, и поняла, что открытие шкафа заблокирует выключатель, таким образом, она выключила выключатель прежде, чем открыть шкаф, возвратившись к кулеру и восстановив бутылку, и наконец поместив его в шкаф. Короче говоря, она запланировала заранее, определив проблемы и фиксируя их, прежде чем они могли произойти.
«Мы не предоставляли Ане ни одно из абстрактных представлений, которые она должна была запланировать задачу», сказал Конидэрис. «Она изучила те абстракции самостоятельно, и как только у нее были они, планирование было легко. Она нашла что план только в приблизительно четырех миллисекундах».Конидэрис говорит, что исследование обеспечивает важный теоретический стандартный блок для применения искусственного интеллекта к робототехнике. «Мы полагаем, что разрешение наших роботов запланировать и учиться в резюме, а не бетоне будет фундаментально для строительства действительно интеллектуальных роботов», сказал он. «Много проблем часто довольно просты, если Вы думаете о них правильным способом».
Соавторами Конидэриса на бумаге был Лесли Пэк Кэелблинг и Томас Лозано-Перес из MIT. Исследование было поддержано премией от Управления перспективного планирования оборонных научно-исследовательских работ и Инициативой Разведки MIT.