Принцип максимума Понтрягина - Википедия - Pontryagins maximum principle

Принцип максимума Понтрягина используется в оптимальный контроль теории, чтобы найти наилучший возможный контроль для принятия динамическая система из одного состояния в другое, особенно при наличии ограничений для состояния или элементов управления вводом.^[1] В нем говорится, что это необходимо для любого оптимального управления наряду с траекторией оптимального состояния для решения так называемой гамильтоновой системы, которая является двухточечной краевая задача, плюс максимальное условие Гамильтониан.^[а] Этих необходимых условий становится достаточно при определенных условиях выпуклости на целевую функцию и функцию ограничения.^[2]^[3]

Принцип максимума сформулировал в 1956 г. русский математик. Лев Понтрягин и его ученики,^[4]^[5] и его первоначальное применение было для максимизации конечной скорости ракеты.^[6] Результат был получен с использованием идей классической вариационное исчисление.^[7] После небольшого возмущение оптимального управления рассматривается член первого порядка Тейлор расширение по возмущению; обращение возмущения к нулю приводит к вариационному неравенству, из которого следует принцип максимума.^[8]

Считается важной вехой в теории оптимального управления,^[1] значение принципа максимума состоит в том, что максимизировать гамильтониан намного проще, чем исходная бесконечномерная задача управления; а не максимизировать функциональное пространство, проблема преобразуется в точечно оптимизация.^[9] Аналогичная логика приводит к Принцип оптимальности Беллмана, связанный подход к задачам оптимального управления, который утверждает, что оптимальная траектория остается оптимальной в промежуточные моменты времени.^[10] Результирующий Уравнение Гамильтона – Якоби – Беллмана. обеспечивает необходимое и достаточное условие для оптимума и допускает простое расширение к стохастическим задачам оптимального управления, тогда как принцип максимума - нет.^[8] Однако в отличие от уравнения Гамильтона – Якоби – Беллмана, которое должно выполняться для всего пространства состояний, принцип максимума Понтрягина потенциально более эффективен с точки зрения вычислений, поскольку условия, которые он задает, должны выполняться только для определенной траектории.^[1]

Обозначение

В дальнейшем мы будем использовать следующие обозначения.

{ Displaystyle Psi _ {T} (x (T)) = left. { frac { partial Psi (x)} { partial T}} right | _ {x = x (T)} ,}

{ Displaystyle Psi _ {x} (x (T)) = { begin {bmatrix} left. { frac { partial Psi (x)} { partial x_ {1}}} right | _ {x = x (T)} & cdots & left. { frac { partial Psi (x)} { partial x_ {n}}} right | _ {x = x (T)} end {bmatrix}}}

{ displaystyle H_ {x} (x ^ {*}, u ^ {*}, lambda ^ {*}, t) = { begin {bmatrix} left. { frac { partial H} { partial x_ {1}}} right | _ {x = x ^ {*}, u = u ^ {*}, lambda = lambda ^ {*}} & cdots & left. { frac { partial H} { partial x_ {n}}} right | _ {x = x ^ {*}, u = u ^ {*}, lambda = lambda ^ {*}} end {bmatrix}}}

{ displaystyle L_ {x} (x ^ {*}, u ^ {*}) = { begin {bmatrix} left. { frac { partial L} { partial x_ {1}}} right | _ {x = x ^ {*}, u = u ^ {*}} & cdots & left. { frac { partial L} { partial x_ {n}}} right | _ {x = x ^ {*}, u = u ^ {*}} end {bmatrix}}}

{ displaystyle f_ {x} (x ^ {*}, u ^ {*}) = { begin {bmatrix} left. { frac { partial f_ {1}} { partial x_ {1}}} right | _ {x = x ^ {*}, u = u ^ {*}} & cdots & left. { frac { partial f_ {1}} { partial x_ {n}}} right | _ {x = x ^ {*}, u = u ^ {*}} vdots & ddots & vdots left. { frac { partial f_ {n}} { partial x_ { 1}}} right | _ {x = x ^ {*}, u = u ^ {*}} & ldots & left. { Frac { partial f_ {n}} { partial x_ {n} }} right | _ {x = x ^ {*}, u = u ^ {*}} end {bmatrix}}}

Формальная формулировка необходимых условий задачи минимизации.

Здесь показаны необходимые условия минимизации функционала. Брать ${ displaystyle x}$ быть государством динамическая система с вводом ${ displaystyle u}$ , так что

{ Displaystyle { точка {х}} = е (х, и), квадроцикл х (0) = х_ {0}, квад и (т) ин { mathcal {U}}, квад т в [0, T]}

куда ${ displaystyle { mathcal {U}}}$ - множество допустимых управлений и ${ displaystyle T}$ - конечное (то есть конечное) время системы. Контроль ${ displaystyle u in { mathcal {U}}}$ должен быть выбран для всех ${ displaystyle t in [0, T]}$ минимизировать целевой функционал ${ displaystyle J}$ который определяется приложением и может быть абстрагирован как

{ Displaystyle J = Psi (x (T)) + int _ {0} ^ {T} L (x (t), u (t)) , dt}

К ограничениям на динамику системы можно добавить Лагранжиан ${ displaystyle L}$ введя изменяющиеся во времени Множитель Лагранжа вектор ${ displaystyle lambda}$ , элементы которой называются костями системы. Это мотивирует строительство Гамильтониан ${ displaystyle H}$ определены для всех ${ displaystyle t in [0, T]}$ к:

{ Displaystyle Н (Икс (Т), U (Т), Лямбда (Т), Т) = Лямбда ^ { РМ {Т}} (Т) е (Х (Т), и (Т)) + L (x (t), u (t)) ,}

куда ${ displaystyle lambda ^ { rm {T}}}$ это транспонирование ${ displaystyle lambda}$ .

Принцип минимума Понтрягина утверждает, что оптимальная траектория состояния ${ displaystyle x ^ {*}}$ , оптимальное управление ${ displaystyle u ^ {*}}$ , и соответствующий вектор множителя Лагранжа ${ displaystyle lambda ^ {*}}$ должен минимизировать гамильтониан ${ displaystyle H}$ так что

{ displaystyle (1) qquad H (x ^ {*} (t), u ^ {*} (t), lambda ^ {*} (t), t) leq H (x ^ {*} ( t), u, lambda ^ {*} (t), t) ,}

за все время ${ displaystyle t in [0, T]}$ и для всех допустимых управляющих входов ${ displaystyle u in { mathcal {U}}}$ . Также должно быть, что

{ Displaystyle (2) qquad Psi _ {T} (х (T)) + H (T) = 0 ,}

Кроме того, сопряженные уравнения

{ displaystyle (3) qquad - { dot { lambda}} ^ { rm {T}} (t) = H_ {x} (x ^ {*} (t), u ^ {*} (t ), lambda (t), t) = lambda ^ { rm {T}} (t) f_ {x} (x ^ {*} (t), u ^ {*} (t)) + L_ { x} (x ^ {*} (t), u ^ {*} (t))}

должен быть доволен. Если конечное состояние ${ Displaystyle х (Т)}$ не является фиксированным (т.е. его дифференциальная вариация не равна нулю), также должно быть, чтобы конечные затраты были такими, что

{ Displaystyle (4) qquad lambda ^ { rm {T}} (T) = Psi _ {x} (x (T)) ,}

Эти четыре условия в (1) - (4) являются необходимыми условиями для оптимального управления. Обратите внимание, что (4) применяется только тогда, когда ${ Displaystyle х (Т)}$ бесплатно. Если он зафиксирован, то это условие не обязательно для оптимума.

Смотрите также

Множители Лагранжа на банаховых пространствах, Лагранжев метод в вариационном исчислении

Примечания

^ Будет ли крайнее значение максимальным или минимальным, зависит как от проблемы, так и от соглашения о знаках, используемого для определения гамильтониана. Нормальное соглашение приводит к максимуму, следовательно, принцип максимума.

дальнейшее чтение

Геринг, Х. П. (2007). Оптимальное управление с помощью инженерных приложений. Springer. ISBN 978-3-540-69437-3.
Кирк, Д. Э. (1970). Теория оптимального управления: введение. Прентис Холл. ISBN 0-486-43484-2.
Lee, E. B .; Маркус, Л. (1967). Основы теории оптимального управления. Нью-Йорк: Вили.
Зейерстад, Атле; Сидсэтер, Кнут (1987). Теория оптимального управления с экономическими приложениями. Амстердам: Северная Голландия. ISBN 0-444-87923-4.

внешняя ссылка

«Принцип максимума Понтрягина», Энциклопедия математики, EMS Press, 2001 [1994]

[2] Будет ли крайнее значение максимальным или минимальным, зависит как от проблемы, так и от соглашения о знаках, используемого для определения гамильтониана. Нормальное соглашение приводит к максимуму, следовательно, принцип максимума.

[:0-1] а ^б ^c Росс, Исаак (2015). Учебник по принципу Понтрягина в оптимальном управлении. Сан-Франциско: коллегиальные издатели. ISBN 978-0-9843571-0-9. OCLC 625106088.CS1 maint: дата и год (связь)

[3] Мангасарян, О. (1966). «Достаточные условия оптимального управления нелинейными системами». SIAM Journal on Control. 4 (1): 139–152. Дои:10.1137/0304013.

[4] Камиен, Мортон И.; Шварц, Нэнси Л. (1971). «Достаточные условия в теории оптимального управления». Журнал экономической теории. 3 (2): 207–214. Дои:10.1016/0022-0531(71)90018-4.

[5] Болтянский, В .; Мартини, H .; Солтан, В. (1998). «Принцип максимума - как он появился?». Геометрические методы и проблемы оптимизации. Нью-Йорк: Спрингер. С. 204–227. ISBN 0-7923-5454-0.

[6] Гамкрелидзе, Р. В. (1999). «Открытие принципа максимума». Журнал динамических и управляющих систем. 5 (4): 437–451. Дои:10.1023 / А: 1021783020548. S2CID 122690986. Перепечатано в Болибрух, А.А.; и др., ред. (2006). Математические события двадцатого века. Берлин: Springer. С. 85–99. ISBN 3-540-23235-4.

[7] Ссылки на первые опубликованные работы см. В Фуллер, А. Т. (1963). «Библиография принципа максимума Понтрягина». J. Электроника и управление. 15 (5): 513–517. Дои:10.1080/00207216308937602.

[8] МакШейн, Э. Дж. (1989). "Расчет вариаций от начала до теории оптимального управления". SIAM J. Control Optim. 27 (5): 916–939. Дои:10.1137/0327049.

[YongZhou-9] а ^б Yong, J .; Чжоу, X. Y. (1999). «Принцип максимума и стохастические гамильтоновы системы». Стохастические управления: гамильтоновы системы и уравнения HJB. Нью-Йорк: Спрингер. стр.101 –156. ISBN 0-387-98723-1.

[10] Састри, Шанкар (29 марта 2009 г.). «Конспект лекции 8. Оптимальное управление и динамические игры» (PDF).

[11] Чжоу, X. Y. (1990). «Принцип максимума, динамическое программирование и их связь в детерминированном управлении». Журнал теории оптимизации и приложений. 65 (2): 363–373. Дои:10.1007 / BF01102352. S2CID 122333807.

[1]

[а]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]