Руки помощи ведут роботы, как они узнают: Инженеры совершенствуют метод, чтобы приказать роботам сотрудничать через демонстрацию

Рисовый инженер Марсия О’Мэлли и аспирант Дилан Лоузи усовершенствовали их метод, чтобы обучить роботы, применив нежную физическую обратную связь к машинам, в то время как они выполняют задачи. Цель состоит в том, чтобы упростить обучение роботов, которые, как ожидают, будут работать эффективно бок о бок с людьми.Статья об их исследовании появляется в IEEE, Исследуют.

«Исторически, роль роботов должна была принять приземленные задачи, которые мы не хотим делать: производство, сборочные конвейеры, сварка, живопись», сказал О’Мэлли, преподаватель машиностроения, электротехники и вычислительной техники и информатики. «Поскольку мы становимся более склонны делиться личной информацией с технологией, как способ, которым делают запись мои часы, сколько шагов я делаю, та технология шаги в воплощенные аппаратные средства также.«Роботы уже находятся в нашей уборке пылесосом домов или управлении нашими термостатами или кошении газона», сказала она. «Есть все виды способов, которыми технология проникает в наших жизнях. Я уже говорю с Алексой в кухне, итак, почему не также имеют машины, с которыми мы можем физически сотрудничать?

Большая наша работа о создании безопасных взаимодействий человеческого робота».По словам исследователей, роботы, адаптированные, чтобы ответить на физическое взаимодействие человеческого робота (pHRI) традиционно, рассматривают такие взаимодействия как беспорядки и возобновляют их оригинальные поведения, когда взаимодействия заканчиваются.

Рисовые исследователи увеличили pHRI с методом, который позволяет людям физически регулировать траекторию робота в режиме реального времени.В основе программы понятие контроля за импедансом, буквально способ управлять тем, что происходит, когда толчок прибывает в толчок.

Робот, который допускает контроль за импедансом через физический вход, регулирует свою запрограммированную траекторию, чтобы ответить, но возвращается к его начальной траектории, когда вход заканчивается.Рисовый алгоритм полагается на то понятие, поскольку это позволяет роботу регулировать свой путь вне входа и вычислять новый маршрут к его цели, чему-то как система GPS, которая повторно вычисляет маршрут к его месту назначения, когда водитель пропускает поворот.Лоузи провел большую часть прошлого лета в лаборатории Анки Драгана, доцента электротехники и информатики в Калифорнийском университете, Беркли, проверив теорию. Он и другие студенты обучили манипулятор и руку поставлять кофейную чашку через рабочий стол, и затем использовали увеличенный pHRI, чтобы держать его отдельно от компьютерной клавиатуры и достаточно низко так, чтобы чашка не ломалась, если пропущено. (Отдельная статья об экспериментах появляется на Слушаниях Исследования Машинного обучения.)

Цель состояла в том, чтобы исказить запрограммированную траекторию робота через физическое взаимодействие. «Здесь у робота есть план или желаемая траектория, которая описывает, как робот думает, что это должно выполнить задачу», написал Лоузи в эссе об экспериментах Беркли. «Мы ввели алгоритм в реальном времени, который изменил или исказил, будущее робота желало траектории».В способе импеданса робот последовательно возвращался к его оригинальной траектории после взаимодействия. В изучении способа обратная связь изменила не только государство робота во время взаимодействия, но также и как это продолжалось к цели, сказал Лоузи. Если бы пользователь направил его, чтобы помешать чашке передавать по клавиатуре, например, это продолжило бы делать так в будущем. «Нашим перепланированием желаемой траектории робота после каждого нового наблюдения робот смог произвести поведение, которое соответствует предпочтению человека», сказал он.

Дальнейшие тесты наняли 10 студентов Райса, которые использовали реабилитирующий робот обратной связи силы лаборатории О’Мэлли, OpenWrist, чтобы управлять курсором вокруг препятствий на мониторе и приземлиться на синюю точку. Тесты сначала использовали стандартный контроль за импедансом и затем контроль за импедансом с физически интерактивной деформацией траектории, аналогом pHRI, который позволил студентам обучать устройство изучать новые траектории.

Результаты показали, что испытания с деформацией траектории были физически легче и необходимыми значительно меньше взаимодействия, чтобы достигнуть цели. Эксперименты продемонстрировали, что взаимодействия могут программировать иначе автономные роботы, у которых есть несколько степеней свободы в этом случае, сгибающем руку и вращающем запястьем.Одно текущее ограничение – то, что pHRI еще не может изменить количество времени, это берет робот, чтобы выполнить задачу, но это находится на повестке дня команды Райса.

«Изменение парадигмы в этой работе – то, что вместо того, чтобы рассматривать человека как случайное волнение, робот должен рассматривать человека как рациональное существо, которое имеет причину взаимодействовать и пытается передать что-то важное», сказал Лоузи. «Робот не должен просто пытаться уйти с дороги. Это должно изучить то, что продолжается, и сделайте его работу лучше».


FBCONSTANTA.RU