Архитектура MIBE - MIBE architecture

Архитектура MIBE (Мотивированное независимое поведение) это основанный на поведении архитектура роботов разработана в Лаборатория искусственного интеллекта и робототехники из Миланский политехнический университет Фабио Ла Дага и Андреа Бонарини в 1998 году. Архитектура MIBE основана на идее анимат и получен из архитектура подчинения, ранее разработанная Родни Брукс и коллеги в Массачусетский технологический институт в 1986 г.

Описание

Архитектура MIBE основана на предположении, что автономия основана на мотивация и возникает в результате наложения синергетических действий в ответ на несколько диски. Автономный агент разрабатывается для достижения одной или нескольких целей (первичных целей), но вторичные цели также возникают из-за экологических и функциональных ограничений. Архитектура MIBE определяет как основные, так и второстепенные цели как потребности. Определенный драйв исходит из каждой потребности. Архитектура MIBE генерирует и взвешивает все эти диски в явном виде. мотивационное состояние. Чем выше срочность удовлетворения конкретной потребности, тем выше ее вес в мотивационном состоянии и тем выше стремление к поведению, которое удовлетворяет данную потребность.

Отличия от архитектуры подчинения

Архитектура MIBE в основном отходит от архитектура подчинения за счет введения верхнего уровня мотивационная структура который определяет приоритеты поведения во время выполнения. То есть между поведенческими модулями не существует уровней и статических иерархических зависимостей, но каждое поведение постоянно конкурирует с другими за контроль над агентом через мотивационное состояние верхнего уровня, из которого возникают определенные побуждения (через заранее определенные функции или функции, полученные с помощью подкрепления).

В то время как архитектура подчинения построена на заранее определенной иерархии поведенческих модулей, архитектура MIBE состоит из более сложной структуры, где несколько вариантов поведения (которые всегда конкурируют за получение контроля над роботом через мотивационное состояние) могут активировать и динамически управлять адаптивным набором базовых модули, называемые способности. Каждое поведение выполняет свою задачу, активируя и настраивая необходимые ему способности. Способности обеспечивают функциональные модули для выполнения определенных действий и могут активировать друг друга в иерархической структуре таким же образом, как поведение использует способности. И поведение, и способности реализуются одними и теми же функциональными модулями, но существует фундаментальное различие: самоактивирующийся модули в ответ на состояние робота + среды, в то время как способности просто функциональные блоки активируются и контролируются поведением для выполнения своих задач (или способностями более высокого уровня, которые уже были активированы поведением). Поведение существует для удовлетворения конкретных потребностей, в то время как способности не связаны с какой-либо потребностью, потому что они используются поведением для выполнения своих задач, но не имеют одного значения.

Список способностей, необходимых для каждого модуля (поведения или способности), представлен его дерево активации; полный набор деревьев активации может быть представлен общесистемным ациклическим график активации.

Поведение активируется на основе их специфического давления влечения в мотивационном состоянии во время выполнения: всегда активируется наиболее мотивированное поведение (т. Е. Наиболее неотложное или удобное). Тем не менее, менее мотивированное поведение может быть даже активировано одновременно, с ограничением, что они не могут использовать какие-либо способности, уже накопленные более мотивированным поведением, которое уже действует. Подсистема BCR (Разрешение конфликтов поведения) гарантирует, что конфликтующее поведение (например, совместное использование одной или нескольких способностей в деревьях активации) не может быть активным одновременно.

Основным преимуществом архитектуры MIBE является ее высокая модульность и молекулярность: новые способности и модели поведения могут быть легко добавлены без изменения существующей модульной структуры. Точно так же поведение можно изменить или удалить без функционального воздействия на другие модули. Диски могут быть добавлены или удалены из мотивационной структуры или изменены без необходимости изменять предыдущую структуру системы, за исключением повторного балансирования функций генерации стимулов.

Основной проблемой архитектуры MIBE является сложность моделирования оптимальных границ пространство состояний путем формирования мотивационной структуры (например, настройки функций генерации привода или их алгоритмов обучения) так, чтобы автономный агент выполнял наилучшее поведение для каждого состояния робот + среда (однако такая же сложность также касается разработки автономных агентов на основе архитектуры подчинения , хотя статические иерархические зависимости между поведенческими модулями немного упрощают их настройку).

Смотрите также

Рекомендации

  • Ф. Ла Дага, А. Бонарини (1998), «Архитектура управления поведением с мотивационным подходом для автономных агентов», Миланский политехнический университет, Dipartimento di Elettronica e Informazione (DEI).
  • М. Коломбетти, М. Дориго (1998), «Формирование робота: эксперимент в области инженерии поведения», серия «Интеллектуальная робототехника и автономные агенты», MIT Press
  • Д. МакФарланд, Т. Боссер (1993), "Интеллектуальное поведение животных и роботов", MIT Press / Bradford books