Управление машинным обучением - Википедия - Machine learning control

Управление машинным обучением (MLC) является подполем машинное обучение, интеллектуальное управление и теория управления который решает оптимальный контроль проблемы с методами машинное обучение.Ключевыми приложениями являются сложные нелинейные системы, для которых теория линейного управления методы не применимы.

Типы проблем и задач

Обычно встречаются четыре типа проблем.

  • Идентификация управляющих параметров: MLC преобразуется в идентификацию параметра[1] если структура закона управления задана, но параметры неизвестны. Одним из примеров является генетический алгоритм для оптимизации коэффициентов ПИД-регулятор[2] или оптимальное управление с дискретным временем.[3]
  • Дизайн управления как задача регрессии первого типа: MLC аппроксимирует общее нелинейное отображение сигналов датчиков в команды срабатывания, если сигналы датчиков и оптимальная команда срабатывания известны для каждого состояния. Одним из примеров является вычисление обратной связи датчика от известного полная обратная связь. А нейронная сеть обычно используется для этой задачи.[4]
  • Дизайн управления как задача регрессии второго типа: MLC также может определять произвольные нелинейные законы управления, которые минимизируют функцию затрат объекта. В этом случае не требуется знать ни модель, ни структуру закона управления, ни команду срабатывания оптимизатора. Оптимизация основана только на характеристиках управления (функциях затрат), измеренных на предприятии. Генетическое программирование это мощный метод регрессии для этой цели.[5]
  • Контроль обучения с подкреплением: закон контроля может постоянно обновляться в зависимости от измеренных изменений производительности (вознаграждений), используя обучение с подкреплением.[6]

MLC включает, например, управление нейронной сетью, управление на основе генетического алгоритма, управление генетическим программированием, управление обучением с подкреплением и имеет методологические совпадения с другими элементами управления, управляемыми данными, такими как искусственный интеллект и управление роботом.

Приложения

MLC успешно применялся для решения многих задач нелинейного управления, исследуя неизвестные и часто неожиданные механизмы срабатывания.

  • Контроль высоты спутников.[7]
  • Тепловой контроль здания.[8]
  • Контроль турбулентности с обратной связью.[2][9]
  • Дистанционно управляемый подводный аппарат.[10]
  • Многие другие инженерные приложения MLC резюмированы в обзорной статье PJ Fleming & RC Purshouse (2002).[11]

Что касается всех общих нелинейных методов, MLC не имеет гарантированной сходимости, оптимальности или устойчивости для ряда рабочих условий.

Рекомендации

  1. ^ Томас Бэк и Ханс-Пауль Швефель (весна 1993 г.) «Обзор эволюционных алгоритмов оптимизации параметров», Журнал эволюционных вычислений (MIT Press), т. 1, вып. 1. С. 1-23.
  2. ^ а б N. Benard, J. Pons-Prats, J. Periaux, G. Bugeda, J.-P. Бонне и Э. Моро, (2015) "Генетический алгоритм с несколькими входами для экспериментальной оптимизации повторного прикрепления после обратного шага с плазменным актуатором на поверхности", Статья AIAA 2015-2957 на 46-й конференции AIAA по плазменной динамике и лазерам, Даллас, Техас, США, стр. 1-23.
  3. ^ Збигнев Михалевич, Цезарий З. Яников и Яцек Б. Кравчик (июль 1992 г.) «Модифицированный генетический алгоритм для задач оптимального управления», [Компьютеры и математика с приложениями], т. 23, № 12, с. 83-94.
  4. ^ К. Ли, Дж. Ким, Д. Бэбкок и Р. Гудман (1997) «Применение нейронных сетей для контроля турбулентности для уменьшения сопротивления», Физика жидкостей, т. 6, вып. 9. С. 1740-1747.
  5. ^ Д. К. Дракопулос и С. Кент (декабрь 1997 г.) «Генетическое программирование для предсказания и контроля», Нейронные вычисления и приложения (Springer), т. 6, вып. 4. С. 214-228.
  6. ^ Эндрю Дж. Барто (декабрь 1994 г.) «Контроль обучения с подкреплением», Текущее мнение в нейробиологии, т. 6, вып. 4. С. 888–893.
  7. ^ Димитрис. К. Дракопулос и Антония. Дж. Джонс (1994) Нейрогенетический адаптивный контроль отношения, Нейронные вычисления и приложения (Springer), т. 2, вып. 4. С. 183-204.
  8. ^ Джонатан А. Райт, Хизер А. Лусмор и Разие Фармани (2002) «Оптимизация теплового проектирования и управления зданием с помощью многокритериального генетического алгоритма., [Энергетика и строительство], т. 34, нет. 9. С. 959-972.
  9. ^ Стивен Дж. Брантон и Бернд Р. Ноак (2015) Контроль турбулентности с обратной связью: прогресс и проблемы, Обзоры прикладной механики, т. 67, нет. 5, статья 050801, с. 1-48.
  10. ^ Дж. Джавади-Могхаддам и А. Багери (2010 г. «Адаптивная нейро-нечеткая система управления на основе генетического алгоритма скользящего режима для подводного корабля с дистанционным управлением», Экспертные системы с приложениями, т. 37 нет. 1. С. 647-660.
  11. ^ Питер Дж. Флеминг, Р. К. Пёршаус (2002 «Эволюционные алгоритмы в проектировании систем управления: обзор»Инженерная практика управления, т. 10, вып. 11. С. 1223-1241.

дальнейшее чтение

  • Димитрис С. Дракопулос (Август 1997 г.) «Эволюционные алгоритмы обучения для нейроадаптивного управления», Springer. ISBN  978-3-540-76161-7.
  • Томас Дурье, Стивен Л. Брантон & Бернд Р. Ноак (Ноябрь 2016 г.) «Управление машинным обучением - укрощение нелинейной динамики и турбулентности», Springer. ISBN  978-3-319-40624-4.