Условия Каруша – Куна – Таккера. - Karush–Kuhn–Tucker conditions

В математическая оптимизация, то Условия Каруша – Куна – Таккера (ККТ), также известный как Условия Куна – Таккера, находятся первые производные тесты (иногда называется первым порядком необходимые условия ) для решения в нелинейное программирование быть оптимальный при условии, что некоторые условия регулярности довольны.

Допуская ограничения неравенства, подход ККТ к нелинейному программированию обобщает метод Множители Лагранжа, который допускает только ограничения типа равенства. Подобно подходу Лагранжа, задача ограниченной максимизации (минимизации) переписывается в виде функции Лагранжа, оптимальной точкой которой является точка перевала, т.е. глобальный максимум (минимум) в области переменных выбора и глобальный минимум (максимум) по множителям, поэтому теорему Каруша – Куна – Такера иногда называют теоремой о перевалке.[1]

Условия ККТ изначально были названы в честь Гарольд В. Кун и Альберт В. Такер, который впервые опубликовал условия в 1951 году.[2] Позднее ученые обнаружили, что необходимые условия для этой проблемы были сформулированы Уильям Каруш в своей кандидатской диссертации в 1939 году.[3][4]

Задача нелинейной оптимизации

Рассмотрим следующие нелинейные проблема минимизации или максимизации:

Оптимизировать
при условии

куда переменная оптимизации, выбранная из выпуклое подмножество из , это цель или же полезность функция неравенство ограничение функции и равенство ограничение функции. Номера неравенств и равенств обозначаются через и соответственно. В соответствии с задачей оптимизации ограничений можно сформировать функцию Лагранжа

куда , . В Теорема Каруша – Куна – Таккера. затем заявляет следующее.

Теорема. Если это точка перевала из в , , тогда является оптимальным вектором для указанной выше задачи оптимизации. Предположим, что и , , находятся выпуклый в и что существует такой, что . Тогда с оптимальным вектором для вышеуказанной задачи оптимизации связан неотрицательный вектор такой, что это седловая точка .[5]

Поскольку идея этого подхода - найти поддерживающая гиперплоскость на возможном множестве , в доказательстве теоремы Каруша – Куна – Таккера используется теорема об отделении гиперплоскостей.[6]

Система уравнений и неравенств, соответствующая условиям ККТ, обычно напрямую не решается, за исключением нескольких частных случаев, когда закрытая форма решение может быть получено аналитически. В общем, многие алгоритмы оптимизации можно интерпретировать как методы численного решения системы уравнений и неравенств ККТ.[7]

Необходимые условия

Предположим, что целевая функция и функции ограничения и находятся непрерывно дифференцируемый в какой-то момент . Если это локальный оптимум и задача оптимизации удовлетворяет некоторым условиям регулярности (см. ниже), то существуют постоянные и , называемые мультипликаторами ККТ, такие, что выполняются следующие четыре группы условий:

Диаграмма ограничений неравенства для задач оптимизации
Стационарность
Для минимизации :
Для максимизации :
Первичная осуществимость
Двойная осуществимость
Дополнительная расслабленность

Последнее условие иногда записывают в эквивалентной форме:

В частном случае , т.е. при отсутствии ограничений-неравенств, условия ККТ превращаются в условия Лагранжа, а множители ККТ называются Множители Лагранжа.

Если некоторые функции недифференцируемы, субдифференциальный доступны версии условий Каруша – Куна – Таккера (ККТ).[8]

Матричное представление

Необходимые условия можно записать с помощью Матрицы Якоби функций ограничений. Позволять быть определенным как и разреши быть определенным как . Позволять и . Тогда необходимые условия можно записать как:

Стационарность
Для максимизации :
Для минимизации :
Первичная осуществимость
Двойная осуществимость
Дополнительная расслабленность

Условия регулярности (или ограничения)

Можно спросить, есть ли точка минимизатора исходной задачи оптимизации с ограничениями (при условии, что она существует) должна удовлетворять указанным выше условиям KKT. Это похоже на вопрос, при каких условиях минимизатор функции в задаче без ограничений должен удовлетворять условию . Для случая с ограничениями ситуация более сложная, и можно сформулировать множество (постоянно усложняющихся) условий «регулярности», при которых минимизатор с ограничениями также удовлетворяет условиям KKT. Некоторые распространенные примеры условий, которые гарантируют это, приведены в следующей таблице, причем LICQ является наиболее часто используемым:

ОграничениеАкронимЗаявление
Квалификация ограничения линейностиLCQЕсли и находятся аффинные функции, то никаких других условий не требуется.
Квалификация ограничения линейной независимостиLICQГрадиенты ограничений активного неравенства и градиенты ограничений равенства равны линейно независимый в .
Ограничительная квалификация Мангасаряна-ФромовицаMFCQГрадиенты ограничений-равенств линейно независимы при и существует вектор такой, что для всех ограничений активного неравенства и для всех ограничений равенства.[9]
Квалификация ограничения постоянного рангаCRCQДля каждого подмножества градиентов ограничений активного неравенства и градиентов ограничений равенства ранг в окрестности постоянно.
Квалификация ограничения постоянной положительной линейной зависимостиCPLDДля каждого подмножества градиентов ограничений активного неравенства и градиентов ограничений равенства, если подмножество векторов линейно зависит в с неотрицательными скалярами, связанными с ограничениями неравенства, то он остается линейно зависимым в окрестности .
Квазинормальность ограничения квалификацииQNCQЕсли градиенты ограничений активного неравенства и градиенты ограничений равенства линейно зависимы в с соответствующими множителями для равенства и для неравенств не существует последовательности такой, что и
Состояние СлейтераSCДля выпуклая задача (т.е. предполагая минимизацию, выпуклые и аффинно) существует точка такой, что и

Можно показать, что

LICQ ⇒ MFCQ ⇒ CPLD ⇒ QNCQ.

и

LICQ ⇒ CRCQ ⇒ CPLD ⇒ QNCQ.

(и обратное неверно), хотя MFCQ не эквивалентен CRCQ.[10]На практике предпочтительны более слабые ограничивающие квалификации, поскольку они применяются к более широкому набору проблем.

Достаточные условия

В некоторых случаях необходимых условий также достаточно для оптимальности. В общем, необходимых условий недостаточно для оптимальности, и требуется дополнительная информация, такая как достаточные условия второго порядка (SOSC). Для гладких функций SOSC включает вторые производные, что объясняет его название.

Необходимые условия достаточны для оптимальности, если целевая функция задачи максимизации - это вогнутая функция, ограничения неравенства непрерывно дифференцируемы выпуклые функции и ограничения равенства находятся аффинные функции. Аналогично, если целевая функция задачи минимизации является выпуклая функция, необходимые условия также достаточны для оптимальности.

В 1985 году Мартин показал, что более широкий класс функций, в которых условия KKT гарантируют глобальную оптимальность, - это так называемый тип 1. invex функции.[11][12]

Достаточные условия второго порядка

Для гладкости, нелинейная оптимизация задачи, достаточное условие второго порядка задается следующим образом.

Решение найденный в предыдущем разделе, является ограниченным локальным минимумом, если для лагранжиана

тогда,

куда вектор, удовлетворяющий следующему,

где только те активные ограничения неравенства соответствующий строгой дополнительности (т.е. где ) применяются. Решением является строгий ограниченный локальный минимум в случае, если неравенство также строгое.

Если , следует использовать разложение Тейлора третьего порядка лагранжиана, чтобы проверить, это местный минимум. Минимизация хороший контрпример, см. также Поверхность Пеано.

Экономика

Часто в математическая экономика Подход ККТ используется в теоретических моделях для получения качественных результатов. Например,[13] рассмотрим фирму, которая максимизирует доход от продаж при минимальном ограничении прибыли. Сдача быть количеством произведенной продукции (будет выбрано), быть выручкой от продаж с положительной первой производной и с нулевым значением при нулевом выпуске, быть производственными затратами с положительной первой производной и с неотрицательным значением при нулевом выпуске, и быть положительным минимально допустимым уровнем выгода, то проблема становится значимой, если функция дохода выравнивается, поэтому в конечном итоге она становится менее крутой, чем функция затрат. Проблема, выраженная в ранее данной минимизационной форме, такова:

Свести к минимуму
при условии

и условия ККТ

С нарушит ограничение минимальной прибыли, мы имеем а значит, из третьего условия следует, что первое условие выполняется с равенством. Решение этого равенства дает

Потому что было дано это и строго положительны, это неравенство вместе с условием неотрицательности гарантирует, что положительна, и поэтому фирма, максимизирующая доход, работает на уровне выпуска, при котором предельный доход меньше чем предельная стоимость - результат, представляющий интерес, поскольку он контрастирует с поведением максимизация прибыли фирма, которая работает на уровне, на котором они равны.

Функция значения

Если мы пересмотрим задачу оптимизации как задачу максимизации с постоянными ограничениями неравенства:

Функция ценности определяется как

так что область является

Учитывая это определение, каждый коэффициент - скорость, с которой функция цены увеличивается при увеличивается. Таким образом, если каждый интерпретируется как ограничение ресурса, коэффициенты говорят вам, насколько увеличение ресурса увеличит оптимальное значение нашей функции . Эта интерпретация особенно важна в экономике и используется, например, в проблемы максимизации полезности.

Обобщения

С дополнительным множителем , который может быть нулевым (до тех пор, пока ), перед условия стационарности ККТ превращаются в

которые называются Условия Фрица Джона. Эти условия оптимальности выполняются без ограничений и эквивалентны условию оптимальности ККТ или (не-MFCQ).

Условия KKT относятся к более широкому классу необходимых условий первого порядка (FONC), которые позволяют использовать негладкие функции субпроизводные.

Смотрите также

Рекомендации

  1. ^ Табак, Даниил; Куо, Бенджамин С. (1971). Оптимальное управление математическим программированием. Энглвуд Клиффс, Нью-Джерси: Прентис-Холл. С. 19–20. ISBN  0-13-638106-5.
  2. ^ Кун, Х. В.; Такер, А.В. (1951). «Нелинейное программирование». Материалы 2-го симпозиума в Беркли. Беркли: Калифорнийский университет Press. С. 481–492. МИСТЕР  0047303.
  3. ^ В. Каруш (1939). Минимумы функций нескольких переменных с неравенствами как побочными ограничениями (Кандидатская диссертация). Кафедра математики Univ. Чикаго, Чикаго, Иллинойс.
  4. ^ Кьельдсен, Тинне Хофф (2000). «Контекстуализированный исторический анализ теоремы Куна-Такера в нелинейном программировании: влияние Второй мировой войны». Historia Math. 27 (4): 331–361. Дои:10.1006 / hmat.2000.2289. МИСТЕР  1800317.
  5. ^ Уолш, Г. Р. (1975). «Свойство перевала функции Лагранжа». Методы оптимизации. Нью-Йорк: Джон Вили и сыновья. С. 39–44. ISBN  0-471-91922-5.
  6. ^ Кемп, Мюррей С .; Кимура, Йошио (1978). Введение в математическую экономику. Нью-Йорк: Спрингер. стр.38–44. ISBN  0-387-90304-6.
  7. ^ Бойд, Стивен; Ванденберге, Ливен (2004). Выпуклая оптимизация. Кембридж: Издательство Кембриджского университета. п. 244. ISBN  0-521-83378-7. МИСТЕР  2061575.
  8. ^ Рущинский, Анджей (2006). Нелинейная оптимизация. Принстон, штат Нью-Джерси: Princeton University Press. ISBN  978-0691119151. МИСТЕР  2199043.
  9. ^ Димитрий Берцекас (1999). Нелинейное программирование (2-е изд.). Athena Scientific. С. 329–330. ISBN  9781886529007.
  10. ^ Родриго Эустакио; Элизабет Карас; Адемир Рибейро. Квалификация ограничений для нелинейного программирования (PDF) (Технический отчет). Федеральный университет Параны.
  11. ^ Мартин, Д. Х. (1985). «Сущность косности». J. Optim. Теория Appl. 47 (1): 65–76. Дои:10.1007 / BF00941316. S2CID  122906371.
  12. ^ Хэнсон, М.А. (1999). «Невыпуклость и теорема Куна-Такера». J. Math. Анальный. Приложение. 236 (2): 594–604. Дои:10.1006 / jmaa.1999.6484.
  13. ^ Чан, Альфа К. Фундаментальные методы математической экономики, 3-е издание, 1984 г., стр. 750–752.

дальнейшее чтение

внешняя ссылка