Исследование было во главе с Дилипом Арумугэмом и Сиддартом Карамкети, обоими студентами в Брауне, когда работа была выполнена (Арумугэм – теперь аспирант Брауна). Они работали с аспирантом Нэкулом Гопаланом и постдокторским исследователем Лоусоном Л.С. Вонгом в лаборатории Стефани Теллекс, преподавателя информатики в Брауне.«Проблемой, которую мы решаем, является языковое основание, что означает иметь робот, берут владение естественным языком и производят поведения, которые успешно выполняют задачу», сказал Арумугэм. «Проблема состоит в том, что у команд могут быть разные уровни абстракции, и это может заставить робот планировать свои действия неэффективно или быть не в состоянии выполнить задачу вообще».
Например, вообразите кого-то на складе, работающем бок о бок с автоматизированным грузоподъемником. Человек мог бы сказать автоматизированному партнеру, «Захватите тот поддон».
Это – очень абстрактная команда, которая подразумевает много меньших подшагов – выстраивание в линию лифта, помещение вилок внизу и подъем его. Однако другие общие команды могли бы быть более мелкозернистыми, включив только единственное действие: «Наклоните вилки назад немного», например.Те разные уровни абстракции могут вызвать проблемы для текущих языковых моделей робота, говорят исследователи.
Большинство моделей пытается определить указания от слов в команде, а также структуре предложения и затем вывести желаемое действие из того языка. Результаты вывода тогда вызывают алгоритм планирования, который пытается решить задачу.
Но не принимая во внимание специфику инструкций, робот мог бы сверхзапланировать простые инструкции или underplan для более абстрактных инструкций, которые включают больше подшагов. Это может привести к неправильным действиям или чрезмерно долгой задержке планирования, прежде чем робот примет меры.
Но эта новая система добавляет дополнительный уровень изощренности к существующим моделям. В дополнение к простому выведению желаемой задачи с языка новая система также анализирует язык, чтобы вывести отличный уровень абстракции.«Это позволяет нам соединять наш вывод задачи, а также наш выведенный уровень специфики с иерархическим планировщиком, таким образом, мы можем запланировать на любом уровне абстракции», сказал Арумугэм. «В свою очередь мы можем получить драматические ускорения в работе, выполняя задачи по сравнению с существующими системами».
Чтобы разработать их новую модель, исследователи использовали Mechanical Turk, краудсорсинговый рынок Amazon и виртуальную область задачи под названием Мир Очистки. Область онлайн состоит из нескольких комнат, на которые наносят цветную маркировку, автоматизированного агента и объекта, которым можно управлять – в этом случае, стул, который может быть перемещен от комнаты до комнаты.
Волонтеры Mechanical Turk наблюдали, что агент робота выполнил задачу в области Мира Очистки – например, переместив стул от красной комнаты до смежной синей комнаты. Тогда волонтеров попросили сказать, какие инструкции они дадут роботу, чтобы заставить его выполнять задачу, которую они просто наблюдали. Волонтеры были давшими указаниями относительно уровня специфики, которую должны иметь их направления. Инструкции колебались от высокого уровня: «Председательствуйте в синюю комнату» к пошаговому уровню: «Сделайте пять шагов на север, поверните направо, сделайте еще два шага, получите стул, поверните налево, поверните налево, сделайте пять шагов на юг».
Третий уровень абстракции использовал терминологию, где-нибудь промежуточную те два.Исследователи использовали разговорные инструкции волонтеров обучить их систему понимать, какие виды слов используются на каждом уровне абстракции.
Оттуда, система училась выводить не только желаемое действие, но также и уровень абстракции команды. Зная обе из тех вещей, система могла тогда вызвать свой иерархический алгоритм планирования, чтобы решить задачу от соответствующего уровня.Обучив их систему, исследователи проверили его и в виртуальном Мире Очистки и с фактическим подобным Roomba роботом, работающим в материальном мире, подобном пространству Мира Очистки.
Они показали, что, когда робот смог вывести и задачу и специфику инструкций, это ответило на команды во вторые 90 процентов времени. В сравнении, когда никакой уровень специфики не был выведен, половина всех задач потребовала 20 или больше секунд планирования времени.
«Мы в конечном счете хотим видеть роботы, которые являются услужливыми партнерами в наших домах и рабочих местах», сказал Теллекс, который специализируется на сотрудничестве человеческого робота. «Эта работа – шаг к цели предоставления возможности людям общаться с роботами почти таким же способом, которым мы общаемся друг с другом».