К-СВД - K-SVD

В Прикладная математика, К-СВД это изучение словаря алгоритм создания словаря для разреженные представления, через разложение по сингулярным числам подход. К-СВД - это обобщение k-означает кластеризацию метод, и он работает путем итеративного чередования между разреженным кодированием входных данных на основе текущего словаря и обновлением атомов в словаре для лучшего соответствия данным.[1][2] K-SVD широко используется в таких приложениях, как обработка изображений, обработка звука, биология и анализ документов.

Описание проблемы

Цель изучения словаря - изучить переполненную матрицу словаря. который содержит сигнальные атомы (в этих обозначениях столбцы ). Вектор сигнала могут быть представлены, редко, как линейная комбинация этих атомов; представлять , вектор представления должен удовлетворять точному условию , или приблизительное условие , уточняется, требуя, чтобы за небольшую сумму ε и немного Lп норма. Вектор содержит коэффициенты представления сигнала . Обычно норма выбран как L1, L2, или же L.

Если и D - матрица полного ранга, для задачи представления доступно бесконечное число решений. Следовательно, на решение должны быть наложены ограничения. Кроме того, для обеспечения разреженности предпочтительным является решение с наименьшим количеством ненулевых коэффициентов. Таким образом, представление разреженности является решением либо

или же

где считает ненулевые элементы вектора . (Видеть нулевая "норма".)

К-СВД алгоритм

K-SVD является своего рода обобщением K-средних, как показано ниже. k-означает кластеризацию можно также рассматривать как метод скудное представительство. То есть поиск наилучшей кодовой книги для представления выборок данных к ближайший сосед, решая

что эквивалентно

.

Буква F обозначает Норма Фробениуса. Термин разреженного представления заставляет алгоритм K-средних использовать только один атом (столбец) в словаре . Чтобы ослабить это ограничение, целью алгоритма K-SVD является представление сигнала как линейной комбинации атомов в .

Алгоритм K-SVD следует последовательности построения алгоритма K-средних. Однако, в отличие от K-средних, для достижения линейной комбинации атомов в , условие разреженности ограничения ослабляется, так что количество ненулевых записей каждого столбца может быть больше 1, но меньше числа .

Итак, целевая функция принимает вид

или в другой объективной форме

В алгоритме К-СВД сначала фиксируется и лучшая матрица коэффициентов находится. Как найти действительно оптимальное невозможно, воспользуемся приближенным методом преследования. Любой алгоритм, такой как OMP, ортогональный подходящее преследование может использоваться для вычисления коэффициентов, если он может предоставить решение с фиксированным и заранее определенным количеством ненулевых записей .

После задачи разреженного кодирования следует поиск лучшего словаря. . Однако найти весь словарь за один раз невозможно, поэтому процесс заключается в обновлении только одного столбца словаря. каждый раз, фиксируя . Обновление -й столбец делается переписыванием срока штрафа как

куда обозначает k-й ряд Икс.

Разложив умножение в сумме матрицы ранга 1, можно считать сроки предполагаются фиксированными, а -й остается неизвестным. После этого шага мы можем решить задачу минимизации, аппроксимируя срок с матрица с использованием разложение по сингулярным числам, затем обновите с этим. Однако новое решение вектора с большой вероятностью будет заполнен, потому что ограничение разреженности не применяется.

Чтобы решить эту проблему, Определите в качестве

что указывает на примеры которые используют атом (также записи что отличное от нуля). Затем определим как матрица размера , с теми, что на записи и нули в противном случае. При размножении , это сжимает вектор-строку отбрасывая нулевые записи. Аналогично умножение - это подмножество текущих примеров, использующих атом. Такой же эффект можно увидеть на .

Таким образом, проблема минимизации, как упоминалось ранее, становится

и может быть сделано непосредственно с помощью SVD. СВД разлагается в . Решение для - первый столбец U, вектор коэффициентов как первый столбец . После обновления всего словаря процесс затем переходит к итеративному решению X, а затем итеративному решению D.

Ограничения

Выбор подходящего «словаря» для набора данных - невыпуклая проблема, и K-SVD работает путем итеративного обновления, которое не гарантирует нахождение глобального оптимума.[2] Однако это обычное дело для других алгоритмов для этой цели, и K-SVD на практике работает довольно хорошо.[2][нужен лучший источник ]

Смотрите также

Рекомендации

  1. ^ Михал Аарон; Майкл Элад; Альфред Брукштейн (2006), «K-SVD: алгоритм создания переполненных словарей для разреженного представления» (PDF), Транзакции IEEE при обработке сигналов, 54 (11): 4311–4322, Bibcode:2006ITSP ... 54.4311A, Дои:10.1109 / TSP.2006.881199, S2CID  7477309
  2. ^ а б c Рубинштейн, Р., Брукштейн, А.М., Элад, М. (2010), "Словари для моделирования разреженных представлений", Труды IEEE, 98 (6): 1045–1057, CiteSeerX  10.1.1.160.527, Дои:10.1109 / JPROC.2010.2040551, S2CID  2176046CS1 maint: несколько имен: список авторов (связь)