Обратное преобразование Мура – Пенроуза - Moore–Penrose inverse
В математика, и в частности линейная алгебра, то Обратное преобразование Мура – Пенроуза из матрица это наиболее широко известный обобщение из обратная матрица.[1][2][3][4] Это было независимо описано Э. Х. Мур[5] в 1920 г. Арне Бьерхаммар[6] в 1951 г. и Роджер Пенроуз[7] в 1955 году. Ранее Эрик Ивар Фредхольм ввел понятие псевдообратной интегральные операторы в 1903 году. При упоминании матрицы термин псевдообратный, без дополнительных уточнений, часто используется для обозначения обратного преобразования Мура – Пенроуза. Период, термин обобщенно обратный иногда используется как синоним псевдообратного.
Обычно псевдообратное выражение используется для вычисления "наилучшего соответствия" (наименьших квадратов ) решение система линейных уравнений без решения (см. ниже в § Приложения Другой способ - найти минимум (Евклидово ) нормальное решение системы линейных уравнений с кратными решениями. Псевдообратная матрица упрощает формулировку и доказательство результатов линейной алгебры.
Псевдообратная матрица определена и уникальна для всех матриц, элементы которых равны настоящий или же сложный числа. Его можно вычислить с помощью разложение по сингулярным числам.
Обозначение
В нижеследующем обсуждении приняты следующие условные обозначения.
- будет обозначать один из поля действительных или комплексных чисел, обозначенных , , соответственно. Векторное пространство матрицы над обозначается .
- За , и обозначают транспонирование и эрмитово транспонирование (также называемое сопряженный транспонировать ) соответственно. Если , тогда .
- За , обозначает пространство столбца (изображение (пространство, покрытое векторами-столбцами ) и обозначает ядро (пустое пространство) из .
- Наконец, для любого положительного целого числа , обозначает единичная матрица.
Определение
За , псевдообратное определяется как матрица удовлетворяющие всем следующим четырем критериям, известным как условия Мура – Пенроуза:[7][8]
( не обязательно быть общей единичной матрицей, но она отображает все векторы-столбцы себе); ( действует как слабый обратный ); ( является Эрмитский ); ( тоже эрмитово).
существует для любой матрицы , но при полном классифицировать (то есть ранг является ), тогда можно выразить в виде простой алгебраической формулы.
В частности, когда имеет линейно независимые столбцы (и, следовательно, матрица обратима), можно вычислить как
Эта конкретная псевдообратная модель представляет собой левый обратный, поскольку в этом случае .
Когда имеет линейно независимые строки (матрица обратима), можно вычислить как
Это правый обратный, так как .
Характеристики
Существование и уникальность
Псевдообратная матрица существует и единственна: для любой матрицы , имеется ровно одна матрица , который удовлетворяет четырем свойствам определения.[8]
Матрица, удовлетворяющая первому условию определения, называется обобщенной обратной. Если матрица также удовлетворяет второму определению, она называется обобщенный рефлексивный обратный. Обобщенные инверсии существуют всегда, но в общем случае не уникальны. Уникальность - следствие двух последних условий.
Основные свойства
- Если есть настоящие записи, значит, тоже .
- Если является обратимый, его псевдообратное значение является обратным. То есть, .[9]:243
- Псевдообратная нулевая матрица это его транспонирование.
- Псевдообратная псевдообратная матрица - это исходная матрица: .[9]:245
- Псевдообращение коммутирует с транспонированием, спряжением и выполнением сопряженного транспонирования:[9]:245
- , , .
- Псевдообратная скалярная величина, кратная является обратным кратным :
- за .
Идентичности
Следующие идентификаторы можно использовать для отмены определенных подвыражений или раскрытия выражений, содержащих псевдообратные символы. Доказательства этих свойств можно найти в подстраница доказательств.
Приведение к эрмитовскому регистру
Вычисление псевдообратной матрицы сводится к ее построению в эрмитовом случае. Это возможно благодаря эквивалентности:
в качестве и эрмитские.
Товары
Если , и если
- имеет ортонормированные столбцы (то есть ), или же
- имеет ортонормированные строки (то есть ), или же
- имеет все столбцы линейно независимыми (полный ранг столбца) и имеет все строки линейно независимыми (полный ранг строки), или
- (то есть, является сопряженным транспонированием ),
тогда
Последнее свойство дает равенства
NB: равенство в общем случае не выполняется. См. контрпример:
Проекторы
и находятся операторы ортогонального проектирования, то есть они эрмитовы (, ) и идемпотентный ( и ). Следующее имеет место:
- и
- это ортогональный проектор на классифицировать из (что равно ортогональное дополнение ядра ).
- ортогональный проектор на диапазон (что равно ортогональному дополнению ядра ).
- ортогональный проектор на ядро .
- ортогональный проектор на ядро .[8]
Последние два свойства подразумевают следующие тождества:
Другое свойство следующее: если является эрмитовым и идемпотентным (истинно тогда и только тогда, когда оно представляет собой ортогональную проекцию), то для любой матрицы имеет место следующее уравнение:[10]
Это можно доказать, задав матрицы , , и проверяя, что действительно является псевдообратной для проверив, что определяющие свойства псевдообратной верны, когда эрмитово и идемпотентно.
Из последнего свойства следует, что если эрмитово и идемпотентно для любой матрицы
Наконец, если является ортогональной проекционной матрицей, то ее псевдообратная матрица тривиально совпадает с самой матрицей, т. е. .
Геометрическая конструкция
Если рассматривать матрицу как линейную карту над полем тогда можно разложить следующим образом. Мы пишем для прямая сумма, для ортогональное дополнение, для ядро карты, и для изображение карты. Заметь и . Ограничение тогда является изоморфизмом. Отсюда следует, что на является обратным этому изоморфизму и равен нулю на
Другими словами: найти для данного в , первый проект перпендикулярно диапазону , найти точку В диапазоне. Затем форма , то есть найти эти векторы в который отправляет в . Это будет аффинное подпространство в параллельно ядру . Элемент этого подпространства, имеющий наименьшую длину (то есть ближайший к началу координат), является ответом мы ищем. Его можно найти, взяв произвольный член и проецируя его ортогонально на ортогональное дополнение ядра .
Это описание тесно связано с Решение с минимальной нормой линейной системы.
Подпространства
Ограничить отношения
Псевдообратные ограничения:
- (видеть Тихоновская регуляризация ). Эти ограничения существуют, даже если или же не существует.[8]:263
Непрерывность
В отличие от обычного обращения матриц, процесс взятия псевдообратных непрерывный: если последовательность сходится к матрице (в максимальная норма или норма Фробениуса, скажем), то не нужно сходиться к . Однако если все матрицы иметь одинаковый ранг, сходится к .[11]
Производная
Производная вещественнозначной псевдообратной матрицы, которая имеет постоянный ранг в точке может быть вычислено через производную исходной матрицы:[12]
Примеры
Поскольку для обратимых матриц псевдообратная матрица равна обычной обратной, ниже рассматриваются только примеры необратимых матриц.
- За псевдообратная (Обычно псевдообратной нулевой матрицей является ее транспонирование.) Уникальность этой псевдообратной матрицы видна из требования , поскольку умножение на нулевую матрицу всегда приводит к нулевой матрице.
- За псевдообратная
В самом деле, и поэтому
По аналогии, и поэтому
- За
- За (Знаменатели .)
- За
- За псевдообратная
Для этой матрицы левый обратный существует и, следовательно, равно , в самом деле,
Особые случаи
Скаляры
Также возможно определить псевдообратную форму для скаляров и векторов. Это равносильно обращению с ними как с матрицами. Псевдообратная к скаляру равно нулю, если равен нулю, и величина, обратная иначе:
Векторы
Псевдообратный нулевой вектор (полностью нулевой) - это транспонированный нулевой вектор. Псевдообратное значение ненулевого вектора - это сопряженный транспонированный вектор, деленный на его квадрат величины:
Линейно независимые столбцы
Если столбцы из находятся линейно независимый (так что ), тогда обратимо. В этом случае явная формула:[13]
- .
Следует, что тогда является левым обратным к : .
Линейно независимые строки
Если ряды из линейно независимы (так что ), тогда обратимо. В этом случае явная формула:
- .
Следует, что это правая инверсия : .
Ортонормированные столбцы или строки
Это частный случай либо полного ранга столбца, либо полного ранга строки (рассмотренного выше). Если имеет ортонормированные столбцы () или ортонормированные строки (), тогда:
- .
Ортогональные проекционные матрицы
Если ортогональная проекционная матрица, т. е. и , то псевдообратная матрица тривиально совпадает с самой матрицей:
- .
Циркулянтные матрицы
Для циркулянтная матрица , разложение по сингулярным значениям задается преобразование Фурье, то есть сингулярные числа являются коэффициентами Фурье. Позволять быть Матрица дискретного преобразования Фурье (ДПФ), тогда[14]
Строительство
Разложение по рангу
Позволять обозначить классифицировать из . потом возможно (ранг) разложен в качестве куда и имеют ранг . потом .
QR-метод
За вычисление продукта или же а их обратные значения на практике часто являются источником ошибок округления чисел и вычислительных затрат. Альтернативный подход с использованием QR-разложение из может использоваться вместо этого.
Рассмотрим случай, когда имеет полный ранг столбца, так что . Тогда Разложение Холецкого , куда является верхнетреугольная матрица, может быть использовано. Затем умножение на обратное легко выполняется путем решения системы с несколькими правыми частями,
что может быть решено прямая замена с последующим обратная замена.
Разложение Холецкого можно вычислить без формирования явно, альтернативно используя QR-разложение из , куда имеет ортонормированные столбцы, , и верхнетреугольный. потом
- ,
так фактор Холецкого .
Случай полного ранга строки рассматривается аналогично с использованием формулы и используя аналогичный аргумент, поменяв ролями и .
Разложение по сингулярным числам (SVD)
Вычислительно простой и точный способ вычисления псевдообратной матрицы - использование разложение по сингулярным числам.[13][8][15] Если является сингулярным разложением , тогда . Для прямоугольная диагональная матрица Такие как , мы получаем псевдообратную величину, взяв величину, обратную каждому ненулевому элементу на диагонали, оставляя нули на месте и затем транспонируя матрицу. При численных вычислениях ненулевыми считаются только элементы, превышающие некоторый небольшой допуск, а остальные заменяются нулями. Например, в MATLAB, GNU Octave, или же NumPy функция pinv, допуск принимается равным т = ε⋅max (м, п) ⋅max (Σ), где ε - машина эпсилон.
В вычислительных затратах этого метода преобладают затраты на вычисление SVD, которые в несколько раз выше, чем умножение матрицы на матрицу, даже если современная реализация (например, ЛАПАК ) используется.
Вышеупомянутая процедура показывает, почему взятие псевдообратной матрицы не является непрерывной операцией: если исходная матрица имеет сингулярное значение 0 (диагональный элемент матрицы выше), затем изменив немного может превратить этот ноль в крошечное положительное число, тем самым сильно влияя на псевдообратную матрицу, поскольку теперь мы должны взять обратную величину крошечного числа.
Блочные матрицы
Оптимизированные подходы существуют для вычисления псевдообратных матриц с блочной структурой.
Итерационный метод Бен-Исраэля и Коэна
Другой метод вычисления псевдообратной (см. Инверсия Дразина ) использует рекурсию
которую иногда называют последовательностью сверхмощной мощности. Эта рекурсия дает последовательность, квадратично сходящуюся к псевдообратной к если он запущен соответствующим удовлетворение . Выбор (куда , с обозначающее наибольшее сингулярное значение ) [16] утверждалось, что он не может конкурировать с методом, использующим SVD, упомянутым выше, потому что даже для умеренно плохо обусловленных матриц требуется много времени, прежде чем входит в область квадратичной сходимости.[17] Однако если начать с уже близко к обратному преобразованию Мура – Пенроуза и , Например , сходимость быстрая (квадратичная).
Обновление псевдообратной
Для случаев, когда имеет полный ранг строки или столбца и обратную матрицу корреляции ( за с полным рангом строки или для полного ранга столбца), псевдообратная для матриц, относящихся к можно вычислить, применяя Формула Шермана – Моррисона – Вудбери для обновления обратной корреляционной матрицы, что может потребовать меньше работы. В частности, если связанная матрица отличается от исходной только измененной, добавленной или удаленной строкой или столбцом, существуют дополнительные алгоритмы, использующие взаимосвязь.[18][19]
Точно так же можно обновлять коэффициент Холецкого при добавлении строки или столбца без явного создания обратной корреляционной матрицы. Однако обновление псевдообратной матрицы в общем случае недостаточного ранга намного сложнее.[20][21]
Программные библиотеки
Качественные реализации SVD, QR и обратной подстановки доступны в стандартные библиотеки, Такие как ЛАПАК. Написание собственной реализации SVD - это крупный программный проект, требующий значительных усилий. числовая экспертиза. В особых обстоятельствах, например, параллельные вычисления или же встроенные вычисления однако альтернативные реализации с помощью QR или даже использование явного обратного могут быть предпочтительнее, а пользовательские реализации могут быть неизбежны.
Пакет Python NumPy обеспечивает псевдообратное вычисление через свои функции матрица.I
и linalg.pinv
; это pinv
использует алгоритм на основе SVD. SciPy добавляет функцию scipy.linalg.pinv
который использует решатель наименьших квадратов.
Пакет MASS для р обеспечивает вычисление обратной функции Мура – Пенроуза через джинв
функция.[22] В джинв
функция вычисляет псевдообратную, используя разложение по сингулярным значениям, предоставляемое svd
функция в базовом пакете R. Альтернативой является использование pinv
функция доступна в пакете pracma.
В Язык программирования Octave предоставляет псевдообратную функцию через стандартную функцию пакета pinv
и pseudo_inverse ()
метод.
В Юлия (язык программирования), пакет LinearAlgebra стандартной библиотеки предоставляет реализацию обратного преобразования Мура-Пенроуза. pinv ()
реализуется через разложение по сингулярным числам.[23]
Приложения
Линейный метод наименьших квадратов
Псевдообратная формула дает наименьших квадратов решение для система линейных уравнений.[24]За , заданной системой линейных уравнений
в общем, вектор это решает, что система может не существовать, или, если она существует, она не может быть уникальной. Псевдообратная матрица решает проблему наименьших квадратов следующим образом:
- , у нас есть куда и обозначает Евклидова норма. Это слабое неравенство выполняется с равенством тогда и только тогда, когда для любого вектора ; это обеспечивает бесконечное количество решений по минимизации, если только имеет полный ранг столбца, и в этом случае - нулевая матрица.[25] Решение с минимальной евклидовой нормой есть [25]
Этот результат легко распространяется на системы с несколькими правыми частями, если евклидова норма заменяется нормой Фробениуса. Позволять .
- , у нас есть куда и обозначает Норма Фробениуса.
Получение всех решений линейной системы
Если линейная система
есть какие-либо решения, все они даются[26]
для произвольного вектора . Решение (я) существует тогда и только тогда, когда .[26] В последнем случае решение единственно тогда и только тогда, когда имеет полный ранг столбца, и в этом случае - нулевая матрица. Если решения существуют, но не имеет полного ранга столбца, то у нас есть неопределенная система, все бесконечное множество решений которого даются этим последним уравнением.
Решение с минимальной нормой линейной системы
Для линейных систем с неуникальными решениями (такими как недоопределенные системы), псевдообратная матрица может использоваться для построения решения минимального Евклидова норма среди всех решений.
- Если выполнимо, вектор является решением и удовлетворяет для всех решений.
Этот результат легко распространяется на системы с несколькими правыми частями, когда евклидова норма заменяется нормой Фробениуса. Позволять .
- Если выполнима матрица является решением и удовлетворяет для всех решений.
Номер условия
Используя псевдообратную и матричная норма, можно определить номер условия для любой матрицы:
Большое число обусловленности означает, что проблема нахождения решений методом наименьших квадратов соответствующей системы линейных уравнений плохо обусловлена в том смысле, что небольшие ошибки в элементах может привести к огромным ошибкам при вводе решения.[27]
Обобщения
Помимо матриц над действительными и комплексными числами, условия выполняются для матриц над бикватернионы, также называемые «сложными кватернионами».[28]
Чтобы решить более общие задачи наименьших квадратов, можно определить обратные Мура – Пенроуза для всех непрерывных линейных операторов между двумя Гильбертовы пространства и , используя те же четыре условия, что и в нашем определении выше. Оказывается, не всякий линейный непрерывный оператор имеет в этом смысле непрерывный линейный псевдообратный оператор.[27] Те, которые делают, - это именно те, чей диапазон закрыто в .
Понятие псевдообратной существует для матриц над произвольным поле оснащен произвольной инволютивный автоморфизм. В этом более общем случае данная матрица не всегда имеет псевдообратную форму. Необходимым и достаточным условием существования псевдообратной матрицы является то, что куда обозначает результат применения операции инволюции к транспонированию . Когда он существует, он уникален.[29] Пример: Рассмотрим поле комплексных чисел, снабженное инволюция идентичности (в отличие от инволюции, рассмотренной в другом месте статьи); существуют ли матрицы, не имеющие псевдообратных в этом смысле? Рассмотрим матрицу . Заметьте, что пока . Таким образом, эта матрица не имеет псевдообратной матрицы в этом смысле.
В абстрактная алгебра, обратный Мура – Пенроуза может быть определен на * -регулярная полугруппа. Это абстрактное определение совпадает с определением в линейной алгебре.
Смотрите также
- Доказательства обратного преобразования Мура – Пенроуза.
- Инверсия Дразина
- Матрица шляп
- Обратный элемент
- Линейный метод наименьших квадратов (математика)
- Псевдодетерминант
- Регулярное кольцо фон Неймана
Примечания
- ^ Бен-Исраэль и Гревиль 2003, п. 7.
- ^ Кэмпбелл и Мейер мл. 1991 г., п. 10.
- ^ Накамура 1991, п. 42.
- ^ Рао и Митра 1971, п. 50–51.
- ^ Мур, Э. (1920). «Об обратной общей алгебраической матрице». Бюллетень Американского математического общества. 26 (9): 394–95. Дои:10.1090 / S0002-9904-1920-03322-7.
- ^ Бьерхаммар, Арне (1951). «Применение исчисления матриц к методу наименьших квадратов; со специальными ссылками на геодезические расчеты». Пер. Рой. Inst. Tech. Стокгольм. 49.
- ^ а б Пенроуз, Роджер (1955). «Обобщенное обратное для матриц». Труды Кембриджского философского общества. 51 (3): 406–13. Bibcode:1955PCPS ... 51..406P. Дои:10.1017 / S0305004100030401.
- ^ а б c d е Голуб, Джин Х.; Чарльз Ф. Ван Лоан (1996). Матричные вычисления (3-е изд.). Балтимор: Джонс Хопкинс. стр.257 –258. ISBN 978-0-8018-5414-9.
- ^ а б c Стоер, Йозеф; Булирш, Роланд (2002). Введение в численный анализ (3-е изд.). Берлин, Нью-Йорк: Springer-Verlag. ISBN 978-0-387-95452-3..
- ^ Maciejewski, Anthony A .; Кляйн, Чарльз А. (1985). «Предотвращение препятствий для кинематически избыточных манипуляторов в динамически изменяющихся средах». Международный журнал исследований робототехники. 4 (3): 109–117. Дои:10.1177/027836498500400308. HDL:10217/536. S2CID 17660144.
- ^ Ракочевич, Владимир (1997). «О непрерывности обратных преобразований Мура – Пенроуза и Дразина» (PDF). Математики Весник. 49: 163–72.
- ^ Голуб, Г. Х .; Перейра, В. (апрель 1973 г.). «Дифференциация псевдообратных и нелинейных задач наименьших квадратов, в которых переменные разделяются». Журнал SIAM по численному анализу. 10 (2): 413–32. Bibcode:1973SJNA ... 10..413G. Дои:10.1137/0710036. JSTOR 2156365.
- ^ а б Бен-Исраэль и Гревиль 2003.
- ^ Столлингса, У. Т.; Буллион, Т. Л. (1972). "Псевдообратная р-Циркулянтная матрица ». Труды Американского математического общества. 34 (2): 385–88. Дои:10.2307/2038377. JSTOR 2038377.
- ^ Линейные системы и псевдообратные системы
- ^ Бен-Исраэль, Ади; Коэн, Дэн (1966). «Об итерационном вычислении обобщенных обратных и связанных проекций». Журнал SIAM по численному анализу. 3 (3): 410–19. Bibcode:1966SJNA .... 3..410B. Дои:10.1137/0703035. JSTOR 2949637.pdf
- ^ Седерстрём, Торстен; Стюарт, Г. В. (1974). "О численных свойствах итерационного метода вычисления обобщенного обратного Мура – Пенроуза". Журнал SIAM по численному анализу. 11 (1): 61–74. Bibcode:1974SJNA ... 11 ... 61S. Дои:10.1137/0711008. JSTOR 2156431.
- ^ Грамс, Тино (1992). Worterkennung mit einem künstlichen нейронален Netzwerk (Кандидатская диссертация). Георг-Август-Universität zu Göttingen. OCLC 841706164.
- ^ Эмтияз, Мохаммад (27 февраля 2008 г.). «Обновление инверсии матрицы при добавлении / удалении столбца» (PDF). Цитировать журнал требует
| журнал =
(помощь) - ^ Мейер-младший, Карл Д. (1973). «Обобщенные инверсии и ранги блочных матриц». SIAM J. Appl. Математика. 25 (4): 597–602. Дои:10.1137/0125057.
- ^ Мейер-младший, Карл Д. (1973). «Обобщенное обращение модифицированных матриц». SIAM J. Appl. Математика. 24 (3): 315–23. Дои:10.1137/0124033.
- ^ «R: Обобщенная обратная матрица».
- ^ "LinearAlgebra.pinv".
- ^ Пенроуз, Роджер (1956). «О наилучшем приближенном решении линейных матричных уравнений». Труды Кембриджского философского общества. 52 (1): 17–19. Bibcode:1956PCPS ... 52 ... 17P. Дои:10.1017 / S0305004100030929.
- ^ а б Планиц, М. (октябрь 1979 г.). «Несогласованные системы линейных уравнений». Математический вестник. 63 (425): 181–85. Дои:10.2307/3617890. JSTOR 3617890.
- ^ а б Джеймс, М. (июнь 1978 г.). «Обобщенное обратное». Математический вестник. 62 (420): 109–14. Дои:10.1017 / S0025557200086460.
- ^ а б Хаген, Роланд; Рох, Штеффен; Зильберманн, Бернд (2001). «Раздел 2.1.2». C * -алгебры и численный анализ. CRC Press.
- ^ Тиан, Юнге (2000). "Матричная теория над комплексной алгеброй кватернионов". с.8, теорема 3.5. arXiv:математика / 0004005.
- ^ Перл, Мартин Х. (1968-10-01). «Обобщенные инверсии матриц с элементами, взятыми из произвольного поля». Линейная алгебра и ее приложения. 1 (4): 571–587. Дои:10.1016/0024-3795(68)90028-1. ISSN 0024-3795.
Рекомендации
- Бен-Исраэль, Ади; Гревиль, Томас Н. (2003). Обобщенные обратные: теория и приложения (2-е изд.). Нью-Йорк, штат Нью-Йорк: Спрингер. Дои:10.1007 / b97366. ISBN 978-0-387-00293-4.CS1 maint: ref = harv (связь)
- Кэмпбелл, S. L .; Мейер-младший, К. Д. (1991). Обобщенные обращения линейных преобразований.. Дувр. ISBN 978-0-486-66693-8.CS1 maint: ref = harv (связь)
- Накамура, Йошихико (1991). Продвинутая робототехника: резервирование и оптимизация. Эддисон-Уэсли. ISBN 978-0201151985.CS1 maint: ref = harv (связь)
- Рао, Ч. Радхакришна; Митра, Суджит Кумар (1971). Обобщенная обратная матрица и ее приложения. Нью-Йорк: Джон Вили и сыновья. п.240. ISBN 978-0-471-70821-6.CS1 maint: ref = harv (связь)
внешняя ссылка
- Псевдообратная на PlanetMath
- Интерактивная программа и учебник Псевдообратной Мура – Пенроуза
- «Обратное Мура – Пенроуза». PlanetMath.
- Вайсштейн, Эрик В. «Псевдообратная». MathWorld.
- Вайсштейн, Эрик В. "Обратное Мура – Пенроуза". MathWorld.
- Псевдообратная матрица Мура – Пенроуза. Учебный обзор теории
- Онлайн калькулятор обратного преобразования Мура-Пенроуза