Аппроксимация низкого ранга - Википедия - Low-rank approximation

В математике приближение низкого ранга это минимизация проблема, в которой функция стоимости измеряет соответствие между заданной матрицей (данными) и аппроксимирующей матрицей (переменная оптимизации), при условии, что аппроксимирующая матрица уменьшила классифицировать. Проблема используется для математическое моделирование и Сжатие данных. Ограничение ранга связано с ограничением сложности модели, которая соответствует данным. В приложениях часто существуют другие ограничения на аппроксимирующую матрицу, помимо ограничения ранга, например, неотрицательность и Структура Ганкеля.

Аппроксимация низкого ранга тесно связана с:

Определение

Данный

  • спецификация конструкции ,
  • вектор параметров конструкции ,
  • норма , и
  • желаемый ранг ,

Приложения

Основная задача аппроксимации низкого ранга

Неструктурированная проблема с подгонкой, измеренная Норма Фробениуса, т.е.

имеет аналитическое решение с точки зрения разложение по сингулярным числам матрицы данных. Результат называется леммой о матричной аппроксимации или теоремой Эккарта – Юнга – Мирского.[4] Позволять

- сингулярное разложение и раздел , , и следующее:

куда является , является , и является . Тогда звание- матрица, полученная из усеченного сингулярного разложения

таково, что

Минимайзер уникален тогда и только тогда, когда .

Доказательство теоремы Эккарта – Юнга – Мирского (для спектральная норма )

Позволять - вещественная (возможно, прямоугольная) матрица с . Предположим, что

это разложение по сингулярным числам из . Напомним, что и находятся ортогональный матрицы и является диагональ матрица с записями такой, что .

Мы утверждаем, что лучший ранг приближение к в спектральной норме, обозначаемой , дан кем-то

куда и обозначить -й столбец и , соответственно.

Во-первых, обратите внимание, что у нас есть

Следовательно, нам нужно показать, что если куда и имеют столбцы тогда .

С имеет столбцов, то должна быть нетривиальная линейная комбинация первых столбцы , т.е.

такой, что . Без потери общности мы можем масштабировать так что или (эквивалентно) . Следовательно,

Результат получается извлечением квадратного корня из обеих частей указанного неравенства.

Доказательство теоремы Эккарта – Юнга – Мирского (для Норма Фробениуса )

Позволять - вещественная (возможно, прямоугольная) матрица с . Предположим, что

это разложение по сингулярным числам из .

Мы утверждаем, что лучший ранг приближение к в норме Фробениуса, обозначаемой , дан кем-то

куда и обозначить -й столбец и , соответственно.

Во-первых, обратите внимание, что у нас есть

Следовательно, нам нужно показать, что если куда и имеют столбцы тогда

По неравенству треугольника со спектральной нормой, если тогда . Предполагать и соответственно обозначают ранг приближение к и методом СВД, описанным выше. Тогда для любого

С , когда и мы заключаем, что для

Следовательно,

как требуется.

Взвешенные задачи аппроксимации низкого ранга

Норма Фробениуса равномерно взвешивает все элементы ошибки аппроксимации . Предварительные сведения о распределении ошибок можно учесть, рассматривая взвешенную задачу аппроксимации низкого ранга

куда векторизует матрица колонка мудрая и - заданная положительная (полу) определенная весовая матрица.

Общая взвешенная задача аппроксимации низкого ранга не допускает аналитического решения в терминах разложения по сингулярным значениям и решается методами локальной оптимизации, которые не гарантируют, что глобально оптимальное решение будет найдено.

В случае некоррелированных весов задача взвешенной аппроксимации низкого ранга также может быть сформулирована следующим образом:[5][6] для неотрицательной матрицы и матрица мы хотим минимизировать над матрицами, , ранга не выше .

Входной задачи аппроксимации низкого ранга

Позволять . За , самый быстрый алгоритм работает в время,.[7][8] Одна из важных использованных идей - это забвение встраивания подпространств (OSE), она впервые была предложена Сарлосом.[9]

За , известно, что эта начальная норма L1 более устойчива, чем норма Фробениуса при наличии выбросов, и указывается в моделях, где предположения Гаусса относительно шума могут не применяться. Естественно стремиться минимизировать .[10] За и , есть несколько алгоритмов с доказуемыми гарантиями.[11][12]

Задача аппроксимации низкого ранга расстояния

Позволять и - два точечных множества в произвольном метрическом пространстве. Позволять представляют матрица, где . Такие матрицы расстояний обычно вычисляются в программных пакетах и ​​имеют приложения для изучения многообразий изображений, распознавания почерка и многомерного развертывания. В попытке уменьшить размер их описания,[13][14] можно изучить низкоранговую аппроксимацию таких матриц.

Распределенная / потоковая задача аппроксимации низкого ранга

Проблемы аппроксимации низкого ранга в распределенной и потоковой настройке рассмотрены в.[15]

Представления ранговых ограничений в виде и ядре

Используя эквивалентности

и

взвешенная задача аппроксимации низкого ранга становится эквивалентной задачам оптимизации параметров

и

куда это единичная матрица размера .

Алгоритм чередования проекций

Графическое представление ограничения ранга предлагает метод оптимизации параметров, в котором функция стоимости минимизируется поочередно по одной из переменных ( или же ) с фиксированным другим. Хотя одновременная минимизация по обоим и сложно двояковыпуклая оптимизация проблема, минимизация только по одной из переменных является линейный метод наименьших квадратов проблема и может быть решена глобально и эффективно.

Результирующий алгоритм оптимизации (называемый чередующимися проекциями) глобально сходится с линейной скоростью сходимости к локально оптимальному решению взвешенной задачи аппроксимации низкого ранга. Начальное значение для (или же ) должен быть указан. Итерация останавливается, когда выполняется определенное пользователем условие сходимости.

Matlab реализация алгоритма чередующихся проекций для взвешенной низкоранговой аппроксимации:

функция[дх, ф] =wlra_ap(д, ш, п, тол, макситер)[м, п] = размер(d); р = размер(п, 2); ж = инф;за я = 2: макситер    % минимизации над L    бп = крон(глаз(п), п);    vl = (бп' * ш * бп) \ бп' * ш * d(:);    л  = изменить форму (vl, r, n);    % минимизации над P    бл = крон(л', глаз(м));    вице-президент = (бл' * ш * бл) \ бл' * ш * d(:);    п  = изменить форму (вп, м, г);    % проверить условие выхода    dh = п * л; дд = d - dh;    ж(я) = дд(:)' * ш * дд(:);    если abs (f (i - 1) - f (i)) конец

Алгоритм переменных проекций

Алгоритм альтернативных проекций использует тот факт, что задача аппроксимации низкого ранга, параметризованная в форме изображения, является билинейной по переменным или же . Билинейный характер проблемы эффективно используется в альтернативном подходе, называемом переменными проекциями.[16]

Рассмотрим снова взвешенную задачу аппроксимации низкого ранга, параметризованную в форме изображения. Минимизация по переменная (линейная задача наименьших квадратов) приводит к выражению в замкнутой форме ошибки аппроксимации как функции

Исходная проблема, следовательно, эквивалентна нелинейная задача наименьших квадратов минимизации относительно . Для этого используются стандартные методы оптимизации, например то Алгоритм Левенберга-Марквардта может быть использован.

Matlab реализация алгоритма переменных проекций для взвешенной низкоранговой аппроксимации:

функция[дх, ф] =wlra_varpro(д, ш, п, тол, макситер)проблема = optimset(); проблема.решатель = 'lsqnonlin';проблема.опции = optimset('MaxIter', макситер, 'TolFun', тол); проблема.x0 = п; проблема.цель = @(п) cost_fun(п, d, ш);[п, ж ] = lsqnonlin(проблема); [ж, vl] = cost_fun(п, d, ш); dh = п * изменить форму(vl, размер(п, 2), размер(d, 2));функция [f, vl] = cost_fun (p, d, w)бп = крон(глаз(размер(d, 2)), п);vl = (бп' * ш * бп) \ бп' * ш * d(:);ж = d(:)' * ш * (d(:) - бп * vl);

Подход переменных проекций можно применять также к задачам аппроксимации низкого ранга, параметризованным в форме ядра. Метод эффективен, когда количество исключаемых переменных намного превышает количество оптимизационных переменных, оставшихся на этапе минимизации нелинейным методом наименьших квадратов. Такие проблемы возникают при идентификации системы, параметризованной в форме ядра, где исключенные переменные представляют собой аппроксимирующую траекторию, а остальные переменные - параметры модели. В контексте линейные инвариантные во времени системы, шаг исключения эквивалентен Кальмановское сглаживание.

Вариант: выпукло-ограниченная аппроксимация низкого ранга

Обычно мы хотим, чтобы наше новое решение было не только низкого ранга, но и удовлетворяло другим выпуклым ограничениям, обусловленным требованиями приложения. Наша интересующая проблема будет заключаться в следующем:

У этой проблемы есть много реальных приложений, в том числе для восстановления хорошего решения из неточного (полуопределенного программирования) релаксации. Если дополнительное ограничение является линейным, так как мы требуем, чтобы все элементы были неотрицательными, задача называется структурированным приближением низкого ранга.[17] Более общая форма называется выпукло-ограниченным приближением низкого ранга.

Эта проблема помогает при решении многих проблем. Однако это сложно из-за комбинации выпуклых и невыпуклых (низкого ранга) ограничений. Различные методы были разработаны на основе различных реализаций . Однако метод множителей переменного направления (ADMM) может применяться для решения невыпуклой задачи с выпуклой целевой функцией, ранговыми ограничениями и другими выпуклыми ограничениями,[18] и поэтому подходит для решения нашей вышеупомянутой проблемы. Более того, в отличие от общих невыпуклых задач, ADMM гарантирует сходимость допустимого решения до тех пор, пока его двойственная переменная сходится в итерациях.

Смотрите также

Рекомендации

  1. ^ Марковский И. Структурированная аппроксимация низкого ранга и ее приложения, Автоматика, том 44, выпуск 4, апрель 2008 г., страницы 891–909. Дои:10.1016 / j.automatica.2007.09.011
  2. ^ И. Марковский, Дж. К. Виллемс, С. Ван Хаффель, Б. Де Моор и Р. Пинтелон, Применение структурированных общих наименьших квадратов для идентификации систем и сокращения модели. IEEE Transactions on Automatic Control, Volume 50, Number 10, 2005, страницы 1490–1500.
  3. ^ Марковский И. Приближение низкого ранга: алгоритмы, реализация, приложения, Springer, 2012, ISBN  978-1-4471-2226-5
  4. ^ К. Эккарт, Г. Янг, Аппроксимация одной матрицы другой более низкого ранга. Психометрика, Том 1, 1936, страницы 211–8. Дои:10.1007 / BF02288367
  5. ^ Сребро, Натан; Яаккола, Томми (2003). Взвешенные приближения низкого ранга (PDF). ICML'03.
  6. ^ Разенштейн, Илья; Песня, Чжао; Вудрафф, Дэвид П. (2016). Взвешенные приближения низкого ранга с предоставляемыми гарантиями. STOC '16 Материалы сорок восьмого ежегодного симпозиума ACM по теории вычислений.
  7. ^ Clarkson, Kenneth L .; Вудрафф, Дэвид П. (2013). Аппроксимация низкого ранга и регрессия во времени разреженности входных данных. STOC '13 Материалы сорок пятого ежегодного симпозиума ACM по теории вычислений. arXiv:1207.6365.
  8. ^ Нельсон, Джелани; Нгуен, Хай Л. (2013). OSNAP: более быстрые алгоритмы численной линейной алгебры за счет более разреженных вложений подпространств. FOCS '13. arXiv:1211.1002.
  9. ^ Сарлос, Тамас (2006). Улучшенные алгоритмы аппроксимации больших матриц с помощью случайных проекций. FOCS'06.
  10. ^ Песня, Чжао; Вудрафф, Дэвид П .; Чжун, Пейлин (2017). Аппроксимация низкого ранга с входной ошибкой L1-нормы. STOC '17 Материалы сорок девятого ежегодного симпозиума ACM по теории вычислений. arXiv:1611.00898.
  11. ^ Брингманн, Карл; Колев, Павел; Вудрафф, Дэвид П. (2017). Аппроксимационные алгоритмы для L0-аппроксимации низкого ранга. НИПС'17. arXiv:1710.11253.
  12. ^ Кьеричетти, Флавио; Голлапуди, Шринивас; Кумар, Рави; Латтанци, Сильвио; Паниграхи, Рина; Вудрафф, Дэвид П. (2017). Алгоритмы аппроксимации низкого ранга Lp. ICML'17. arXiv:1705.06730.
  13. ^ Bakshi, Ainesh L .; Вудрафф, Дэвид П. (2018). Низкоранговая аппроксимация матриц расстояний по сублинейному времени. NeurIPS. arXiv:1809.06986.
  14. ^ Индик, Петр; Вакилиан Али; Вагнер, Таль; Вудрафф, Дэвид П. (2019). Оптимальная по выборке низкоранговая аппроксимация матриц расстояний. КОЛТ.
  15. ^ Буцидис, Христос; Вудрафф, Дэвид П .; Чжун, Пэйлин (2016). Оптимальный анализ главных компонентов в распределенных и потоковых моделях. STOC. arXiv:1504.06729.
  16. ^ Голубь Г., Перейра В. Разделимые нелинейные наименьшие квадраты: метод переменной проекции и его приложения, Институт физики, Обратные задачи, Том 19, 2003 г., страницы 1-26.
  17. ^ Чу, Муди Т .; Funderlic, Роберт Э .; Племмонс, Роберт Дж. (2003). «структурированное низкоранговое приближение». Линейная алгебра и ее приложения. 366: 157–172. Дои:10.1016 / S0024-3795 (02) 00505-0.
  18. ^ «Общая система эвристического решения выпуклых задач над невыпуклыми множествами» (PDF).
  • М. Т. Чу, Р. Э. Фундерлик, Р. Дж. Племмонс, Структурированная аппроксимация низкого ранга, Линейная алгебра и ее приложения, Том 366, 1 июня 2003 г., страницы 157–172 Дои:10.1016 / S0024-3795 (02) 00505-0

внешняя ссылка