QR-разложение - QR decomposition

В линейная алгебра, а QR-разложение, также известный как QR-факторизация или же QU факторизация это разложение из матрица А в продукт А = QR из ортогональная матрица Q и верхнетреугольная матрица р. QR-разложение часто используется для решения линейный метод наименьших квадратов проблема и является основой для конкретной алгоритм собственных значений, то QR-алгоритм.

Случаи и определения

Квадратная матрица

Любая настоящая квадратная матрица А может быть разложен как

куда Q является ортогональная матрица (его столбцы ортогональный единичные векторы смысл ) и р это верхний треугольная матрица (также называется прямоугольной матрицей, отсюда и название). Если А является обратимый, то факторизация единственна, если нам потребуются диагональные элементы р быть позитивным.

Если вместо этого А является комплексной квадратной матрицей, то существует разложение А = QR куда Q это унитарная матрица (так ).

Если А имеет п линейно независимый столбцы, затем первый п столбцы Q для мужчин ортонормированный базис для пространство столбца из А. В более общем плане первый k столбцы Q образуют ортонормированный базис для охватывать из первых k столбцы А для любого 1 ≤k ≤ п.[1] Дело в том, что любой столбец k из А зависит только от первого k столбцы Q отвечает за треугольную формур.[1]

Прямоугольная матрица

В более общем плане мы можем разложить на множители сложные м×п матрица А, с м ≥ п, как продукт м×м унитарная матрица Q и м×п верхнетреугольная матрица р. Как внизу (мп) ряды м×п верхнетреугольная матрица полностью состоит из нулей, часто бывает полезно разбить р, или оба р и Q:

куда р1 является п×п верхнетреугольная матрица, 0 является (м − пп нулевая матрица, Q1 является м×п, Q2 является м×(м − п), и Q1 и Q2 оба имеют ортогональные столбцы.

Голуб и Ван Лоан (1996), §5.2) вызов Q1р1 в тонкая QR-факторизация из А; Трефетен и Бау называют это уменьшенная QR-факторизация.[1] Если А полный классифицировать п и потребуем, чтобы диагональные элементы р1 положительны тогда р1 и Q1 уникальны, но в целом Q2 не является. р1 тогда равна верхнему треугольному множителю Разложение Холецкого из А* А (= АТА если А реально).

QL, RQ и LQ разложения

Аналогичным образом мы можем определить разложения QL, RQ и LQ с L быть ниже треугольная матрица.

Вычисление QR-разложения

Существует несколько методов реального вычисления QR-разложения, например, с помощью Процесс Грама – Шмидта, Преобразования домовладельцев, или же Гивенса вращения. У каждого есть ряд преимуществ и недостатков.

Использование процесса Грама – Шмидта

Рассмотрим Процесс Грама – Шмидта применяется к столбцам полной матрицы рангов столбцов , с внутренний продукт (или же для сложного случая).

Определить проекция:

тогда:

Теперь мы можем выразить s над нашим недавно вычисленным ортонормированным базисом:

куда . Это можно записать в матричной форме:

куда:

и

Пример

Рассмотрим разложение

Напомним, что ортонормированная матрица имеет свойство

Тогда мы можем вычислить с помощью Грама – Шмидта следующим образом:

Таким образом, мы имеем

Связь с разложением RQ

Разложение RQ преобразует матрицу А в произведение верхнетреугольной матрицы р (также известная как прямоугольная) и ортогональная матрица Q. Единственное отличие от QR-разложения - это порядок этих матриц.

QR-разложение - это ортогонализация по Граму – Шмидту столбцов А, начиная с первого столбца.

RQ-разложение - это ортогонализация по Граму – Шмидту строк А, начиная с последнего ряда.

Преимущества и недостатки

Процесс Грама-Шмидта по своей природе численно нестабилен. Хотя применение проекций имеет привлекательную геометрическую аналогию с ортогонализацией, сама ортогонализация подвержена числовым ошибкам. Однако существенным преимуществом является простота реализации, что делает этот алгоритм полезным для использования при создании прототипов, если заранее созданная библиотека линейной алгебры недоступна.

Использование отражений Хаусхолдера

Отражение Хаусхолдера для QR-разложения: цель - найти линейное преобразование, изменяющее вектор в вектор такой же длины, который коллинеарен . Мы могли бы использовать ортогональную проекцию (Грама-Шмидта), но это будет численно нестабильно, если векторы и близки к ортогональным. Вместо этого отражение Хаусхолдера отражается через пунктирную линию (выбранную, чтобы разделить угол между и ). Максимальный угол при этом преобразовании составляет 45 градусов.

А Отражение домохозяина (или же Преобразование домохозяина) - это преобразование, которое берет вектор и отражает его относительно некоторого самолет или же гиперплоскость. Мы можем использовать эту операцию для вычисления QR факторизация м-к-п матрица с м ≥ п.

Q может использоваться для отражения вектора таким образом, что все координаты, кроме одной, исчезают.

Позволять быть произвольным реальным м-мерный вектор-столбец такой, что для скаляра α. Если алгоритм реализован с использованием арифметика с плавающей запятой, тогда α должен получить знак, противоположный знаку k-я координата , куда должна быть центральной координатой, после которой все элементы в матрице равны 0 А'окончательная форма верхнего треугольника, чтобы избежать потеря значимости. В сложном случае установите

(Stoer & Bulirsch, 2002 г., п. 225) и заменить транспонирование сопряженным транспонированием при построении Q ниже.

Тогда где - вектор (1 0… 0)Т, || · || это Евклидова норма и является м-к-м единичная матрица, набор

Или если сложно

является м-к-м Матрица домовладельцев и

Это можно использовать для постепенного преобразования м-к-п матрица А к верхнему треугольный форма. Сначала умножаем А с матрицей Хаусхолдера Q1 мы получаем, когда выбираем первый столбец матрицы для Икс. В результате получается матрица Q1А с нулями в левом столбце (кроме первой строки).

Это можно повторить для А' (получен из Q1А удалив первую строку и первый столбец), в результате получится матрица Хаусхолдера Q2. Обратите внимание, что Q2 меньше чем Q1. Поскольку мы хотим, чтобы он действительно работал на Q1А вместо А′ Нам нужно развернуть его в верхний левый угол, заполнив 1, или в общем:

После итерации этого процесса, ,

- верхнетреугольная матрица. Итак, с

является QR-разложением .

У этого метода больше числовая стабильность чем вышеописанный метод Грама – Шмидта.

В следующей таблице указано количество операций в k-й шаг QR-разложения с помощью преобразования Хаусхолдера, предполагающий квадратную матрицу размером п.

ОперацияКоличество операций в k-й шаг
Умножения
Дополнения
Разделение
Квадратный корень

Суммируя эти числа по п - 1 шаг (для квадратной матрицы размером п) сложность алгоритма (с точки зрения умножения с плавающей запятой) определяется выражением

Пример

Вычислим разложение

Во-первых, нам нужно найти отражение, которое преобразует первый столбец матрицы А, вектор , в

Сейчас же,

и

Здесь,

и

Следовательно

и , а потом

Теперь обратите внимание:

так что у нас уже есть почти треугольная матрица. Нам нужно только обнулить запись (3, 2).

Возьмите (1, 1) незначительный, а затем снова примените процесс к

Тем же способом, что и выше, получаем матрицу преобразования Хаусхолдера

после выполнения прямого суммирования с 1, чтобы убедиться, что следующий шаг в процессе работает правильно.

Теперь мы находим

Или, до четырех десятичных цифр,

Матрица Q ортогонален и р верхний треугольник, поэтому А = QR - искомое QR-разложение.

Преимущества и недостатки

Использование преобразований Хаусхолдера по своей сути является наиболее простым из численно устойчивых алгоритмов QR-разложения из-за использования отражений в качестве механизма для получения нулей в р матрица. Однако алгоритм отражения Хаусхолдера требует большой полосы пропускания и не может быть распараллелен, поскольку каждое отражение, которое создает новый нулевой элемент, полностью изменяет оба Q и р матрицы.

Использование вращений Гивенса

QR разложения также могут быть вычислены с помощью серии Гивенса вращения. Каждый поворот обнуляет элемент в поддиагонали матрицы, образуя р матрица. Конкатенация всех вращений Гивенса образует ортогональную Q матрица.

На практике вращения Гивенса фактически не выполняются путем построения всей матрицы и выполнения матричного умножения. Вместо этого используется процедура вращения Гивенса, которая выполняет эквивалент умножения разреженных матриц Гивенса, без дополнительной работы по обработке разреженных элементов. Процедура вращения Гивенса полезна в ситуациях, когда требуется обнулить только относительно небольшое количество недиагональных элементов, и ее легче распараллелить, чем Преобразования домовладельцев.

Пример

Вычислим разложение

Во-первых, нам нужно сформировать матрицу вращения, которая обнулит самый нижний левый элемент, . Мы формируем эту матрицу, используя метод вращения Гивенса, и называем матрицу . Сначала мы повернем вектор , чтобы указать на Икс ось. Этот вектор имеет угол . Мы создаем ортогональную матрицу вращения Гивенса, :

И результат теперь имеет ноль в элемент.

Аналогичным образом мы можем составить матрицы Гивенса и , который обнулит субдиагональные элементы и , образуя треугольную матрицу . Ортогональная матрица формируется из произведения всех матриц Гивенса . Таким образом, мы имеем , а QR разложение .

Преимущества и недостатки

QR-разложение с помощью вращений Гивенса является наиболее сложным для реализации, поскольку порядок строк, необходимых для полного использования алгоритма, определить нетривиально. Однако у него есть существенное преимущество в том, что каждый новый нулевой элемент влияет только на строку с обнуляемым элементом (i) и строку выше (j). Это делает алгоритм вращения Гивенса более эффективным и распараллеливаемым, чем метод отражения Хаусхолдера.

Связь с определителем или произведением собственных значений

Мы можем использовать QR-разложение, чтобы найти абсолютное значение детерминант квадратной матрицы. Предположим, что матрица разлагается как . Тогда у нас есть

С Q унитарен, . Таким образом,

куда записи на диагонали р.

Кроме того, поскольку определитель равен произведению собственных значений, мы имеем

куда собственные значения .

Мы можем распространить указанные выше свойства на неквадратную комплексную матрицу путем введения определения QR-разложения для неквадратной комплексной матрицы и замены собственных значений сингулярными значениями.

Предположим, что QR-разложение для неквадратной матрицы А:

куда - нулевая матрица и является унитарной матрицей.

Из свойств СВД и определитель матрицы, имеем

куда являются сингулярными значениями .

Отметим, что сингулярные значения и идентичны, хотя их комплексные собственные значения могут быть разными. Однако если А является квадратным, верно следующее:

В заключение, QR-разложение можно эффективно использовать для вычисления произведения собственных значений или сингулярных значений матрицы.

Вращение колонны

Свернутый QR отличается от обычного Грама-Шмидта тем, что он занимает самый большой оставшийся столбец в начале каждого нового шага - поворот столбца - [2] и таким образом вводит матрица перестановок п:

Вращение столбца полезно, когда А (почти) не имеющий ранга, или подозревается в этом. Это также может улучшить числовую точность. п обычно выбирается так, чтобы диагональные элементы р не возрастают: . Это может быть использовано для определения (числового) ранга А при меньших вычислительных затратах, чем разложение по сингулярным числам, составляющих основу так называемых ранжирующие QR-алгоритмы.

Использование для решения линейных обратных задач

По сравнению с прямой обратной матрицей, обратные решения, использующие QR-разложение, более численно устойчивы, о чем свидетельствует их уменьшенная числа условий [Паркер, Геофизическая обратная теория, глава 1.13].

Чтобы решить недоопределенные () линейная задача где матрица имеет размеры и ранг , сначала найдите QR-факторизацию транспонированной : , где Q - ортогональная матрица (т.е. ), а R имеет специальный вид: . Здесь это квадрат прямоугольная матрица, а нулевая матрица имеет размерность . После некоторой алгебры можно показать, что решение обратной задачи может быть выражено как: где можно найти к Гауссово исключение или вычислить непосредственно прямая замена. Последний метод отличается большей числовой точностью и меньшим объемом вычислений.

Чтобы найти решение сверхдетерминированным () проблема что минимизирует норму , сначала найдите QR-факторизацию : . Тогда решение может быть выражено как , куда является матрица, содержащая первый столбцы полного ортонормированного базиса и где как и раньше. Эквивалентно недоопределенному случаю, обратная замена можно использовать, чтобы быстро и точно найти это без явного инвертирования . ( и часто предоставляются числовыми библиотеками как "экономичное" QR-разложение.)

Обобщения

Разложение Ивасавы обобщает QR-разложение на полупростые группы Ли.

Смотрите также

Рекомендации

  1. ^ а б c Л. Н. Трефетен и Д. Бау, Числовая линейная алгебра (СИАМ, 1997).
  2. ^ Стрэнг, Гилберт (2019). Линейная алгебра и обучение на основе данных (1-е изд.). Уэллсли: Wellesley Cambridge Press. п. 143. ISBN  978-0-692-19638-0.

дальнейшее чтение

  • Голуб, Джин Х.; Ван Лоан, Чарльз Ф. (1996), Матричные вычисления (3-е изд.), Джонс Хопкинс, ISBN  978-0-8018-5414-9.
  • Хорн, Роджер А .; Джонсон, Чарльз Р. (1985), Матричный анализ, Издательство Кембриджского университета, ISBN  0-521-38632-2. Раздел 2.8.
  • Нажмите, WH; Теукольский С.А.; Феттерлинг, штат Вашингтон; Фланнери, BP (2007), «Раздел 2.10. QR-разложение», Числовые рецепты: искусство научных вычислений (3-е изд.), Нью-Йорк: Издательство Кембриджского университета, ISBN  978-0-521-88068-8
  • Стоер, Йозеф; Булирш, Роланд (2002), Введение в численный анализ (3-е изд.), Springer, ISBN  0-387-95452-X.

внешняя ссылка