Оптимизация по сумме квадратов - Википедия - Sum-of-squares optimization

В этой статье рассматриваются ограничения суммы квадратов. Для проблем с функциями стоимости суммы квадратов см. Наименьших квадратов.

А оптимизация по сумме квадратов программа - это оптимизация проблема с линейным функция стоимости и особый тип ограничение от переменных решения. Эти ограничения имеют форму, когда переменные решения используются в качестве коэффициентов в определенных многочлены, эти многочлены должны иметь полином SOS свойство. При фиксации максимальной степени задействованных многочленов оптимизация по сумме квадратов также известна как Иерархия Лассерра расслабления в полуопределенное программирование.

Методы оптимизации по сумме квадратов применялись в различных областях, включая теорию управления (в частности, для поиска полиномиальных функций Ляпунова для динамических систем, описываемых полиномиальными векторными полями), статистику, финансы и машинное обучение.[1][2][3][4]

Проблема оптимизации

Проблема может быть выражена как

при условии

Здесь "SOS" представляет собой класс полиномов суммы квадратов (SOS). Вектор и многочлены приведены как часть данных для задачи оптимизации. Количество - переменные решения. Программы SOS могут быть преобразованы в полуопределенные программы (SDP) с помощьюдвойственность из SOS полином программа и релаксация для ограниченной полиномиальной оптимизации с использованием положительно-полуопределенные матрицы см. следующий раздел.

Двойная задача: полиномиальная оптимизация с ограничениями

Предположим, у нас есть -вариант полином , и предположим, что мы хотели бы минимизировать этот многочлен по подмножеству .Предположим, кроме того, что ограничения на подмножество можно закодировать с помощью полиномиальные равенства степени не выше , каждая форма куда является многочленом степени не выше . Естественная, хотя в целом невыпуклая программа для этой задачи оптимизации следующая:

при условии:

,    (1)
,

куда это -мерный вектор с одним элементом для каждого одночлена из степени не более , так что для каждого мультимножества , - матрица коэффициентов многочлена что мы хотим минимизировать, и - матрица коэффициентов многочлена кодирование ограничение на подмножество . Дополнительный фиксированный постоянный индекс в нашем пространстве поиска, , добавлен для удобства записи многочленов и в матричном представлении.

Эта программа обычно невыпуклая, потому что ограничения (1) не выпуклые. Одна возможная выпуклая релаксация для этой задачи минимизации использует полуопределенное программирование заменить матрицу переменных первого ранга с положительно-полуопределенной матрицей : мы индексируем каждый моном размера не более мультимножеством не более индексы, . Для каждого такого монома создадим переменную в программе, и расставляем переменные сформировать матрицу , куда - это множество вещественных матриц, строки и столбцы которых отождествляются с мультимножествами элементов из размером не более . Затем мы записываем следующую полуопределенную программу в переменных :

при условии:

,
,
,
,

где снова - матрица коэффициентов многочлена что мы хотим минимизировать, и - матрица коэффициентов многочлена кодирование ограничение на подмножество .

Третье ограничение гарантирует, что значение одночлена, который встречается несколько раз в матрице, одинаково во всей матрице, и добавляется, чтобы сделать соблюдать симметрии, представленные в квадратичной форме .

Двойственность

Можно взять двойник указанной выше полуопределенной программы и получить следующую программу:

,

при условии:

.

У нас есть переменная соответствующая ограничению (куда матрица со всеми нулевыми элементами, за исключением записи, индексированной ), действительная переменная для каждого полиномиального ограничения и для каждой группы мультимножеств , у нас есть двойственная переменная для ограничения симметрии . Ограничение положительной полуопределенности гарантирует, что представляет собой сумму квадратов многочленов над : характеристикой положительно-полуопределенных матриц для любой положительно-полуопределенной матрицы , мы можем написать для векторов . Таким образом, для любого ,

где мы определили векторы с коэффициентами полинома степени не выше . Это дает доказательство суммы квадратов того, что значение над .

Вышеуказанное также может быть распространено на регионы определяется полиномиальными неравенствами.

Иерархия суммы квадратов

Иерархия суммы квадратов (иерархия SOS), также известная как иерархия Лассерра, представляет собой иерархию выпуклых релаксаций возрастающей мощности и увеличения вычислительных затрат. Для каждого натурального числа соответствующая выпуклая релаксация известна как й уровень или же -й раунд иерархии SOS. В 1 тур, когда , соответствует базовому полуопределенная программа, или к оптимизации по сумме квадратов по многочленам степени не выше . Чтобы расширить базовую программу выпуклости на уровне иерархии до -го уровня в программу добавляются дополнительные переменные и ограничения, чтобы программа учитывала многочлены степени не выше .

Иерархия SOS получила свое название от того факта, что значение целевой функции на -й уровень ограничен доказательством суммы квадратов с использованием многочленов степени не выше через дуальное (см. «Двойственность» выше). Следовательно, любое доказательство суммы квадратов, использующее многочлены степени не выше может использоваться для ограничения объективного значения, позволяя доказать гарантии герметичности релаксации.

В сочетании с теоремой Берга это также означает, что при достаточно большом количестве раундов релаксация становится сколь угодно жесткой на любом фиксированном интервале. Результат Берга[5][6] утверждает, что каждый неотрицательный действительный многочлен в пределах ограниченного интервала может быть аппроксимирован с точностью на этом интервале с суммой квадратов действительных многочленов достаточно высокой степени, и, следовательно, если является полиномиальным целевым значением как функцией точки , если неравенство относится ко всем в интересующей области, то должно быть доказательство этого факта методом суммы квадратов. Выбор чтобы быть минимумом целевой функции по допустимой области, мы имеем результат.

Вычислительная стоимость

При оптимизации функции в переменные, -й уровень иерархии можно записать как полуопределенную программу над переменные и могут быть решены во времени с использованием метода эллипсоида.

Фон суммы квадратов

Полином это сумма площадей (SOS), если существуют многочлены такой, что . Например,

представляет собой сумму квадратов, поскольку

куда

Обратите внимание, что если это сумма квадратов, тогда для всех . Подробные описания полином SOS доступны.[7][8][9]

Квадратичные формы можно выразить как куда является симметричной матрицей. Аналогично многочлены степени ≤ 2d можно выразить как

где вектор содержит все одночлены степени . Это известно как Матрица Грама форма. Важным фактом является то, что является SOS тогда и только тогда, когда существует симметричный и положительно-полуопределенная матрица такой, что Это обеспечивает связь между полиномами SOS и положительно-полуопределенными матрицами.

Программные инструменты

Рекомендации

  1. ^ Американское математическое общество. Краткий курс, Сумма квадратов: теория и приложения (2019: Балтимор, Мэриленд). Сумма квадратов: теория и приложения: краткий курс AMS, сумма квадратов: теория и приложения, 14-15 января 2019 г., Балтимор, Мэриленд. Паррило, Пабло А., Томас, Рекха Р., 1967-. Провиденс, Род-Айленд. ISBN  978-1-4704-5025-0. OCLC  1157604983.CS1 maint: лишняя пунктуация (связь) CS1 maint: несколько имен: список авторов (связь)
  2. ^ Тан, В., Паккард, А., 2004 г. "Поиск управляющих функций Ляпунова с помощью программирования сумм квадратов ". В: Allerton Conf. по связи, контролю иВычисление. С. 210–219.
  3. ^ Тан В., У. Топчу, Зайлер П., Балас Г., Паккард А., 2008. Анализ достижимости и локального усиления с помощью моделирования для нелинейных динамических систем. В: Proc. конференции IEEE по решениям и контролю. С. 4097–4102.
  4. ^ А. Чакраборти, П. Зайлер, Г. Балас.Восприимчивость авиадиспетчеров F / A-18 к режиму «падающего листа»: нелинейный анализ, ”AIAA Journal of Guidance, Control, and Dynamics, Vol.34 No. 1, 2011, 73–85.
  5. ^ Берг, Кристиан (1987). Ландау, Генри Дж. (Ред.). «Многомерная проблема моментов и полугруппы». Материалы симпозиумов по прикладной математике.
  6. ^ Лассер, Дж. (01.01.2007). «Аппроксимация суммой квадратов неотрицательных многочленов». SIAM Обзор. 49 (4): 651–669. arXiv:математика / 0412398. Дои:10.1137/070693709. ISSN  0036-1445.
  7. ^ Паррило, П., (2000) [https://thesis.library.caltech.edu/1647/1/Parrilo-Thesis.pdf Структурированные полуопределенные программы и полуалгебраическая геометрияметоды устойчивости и оптимизации]. Кандидат наук. дипломная работа, КалифорнияТехнологический Институт.
  8. ^ Паррило, П. (2003) "[http://www.cds.caltech.edu/~doyle/hot/SDPrelaxations.pdf Релаксации полуопределенного программирования для полуалгебраических задач. Математическое программирование Сер. В 96 (2), 293–320.
  9. ^ Лассер, Дж. (2001) "Глобальная оптимизация с многочленами и проблема моментов ". SIAM Journal по оптимизации, 11 (3), 796{817.