Основная матрица - Essential matrix

В компьютерное зрение, то основная матрица это матрица, что касается соответствующие точки в стерео изображения предполагая, что камеры удовлетворяют модель камеры-обскуры.

Функция

В частности, если и однородны нормализованный координаты изображения на изображениях 1 и 2 соответственно, то

если и соответствуют одной и той же трехмерной точке сцены.

Приведенное выше соотношение, определяющее существенную матрицу, было опубликовано в 1981 г. Х. Кристофер Лонге-Хиггинс, знакомство с концепцией сообщества компьютерного зрения. Ричард Хартли и Андрей Зиссерман в книге сообщается, что аналогичная матрица появилась в фотограмметрия задолго до этого. Статья Лонге-Хиггинса включает алгоритм оценки из набора соответствующих нормализованных координат изображения, а также алгоритма определения относительного положения и ориентации двух камер при условии, что известен. Наконец, он показывает, как можно определить трехмерные координаты точек изображения с помощью основной матрицы.

Использовать

Существенную матрицу можно рассматривать как предшественницу фундаментальная матрица. Обе матрицы могут использоваться для установления ограничений между совпадающими точками изображения, но основная матрица может использоваться только в отношении откалиброванных камер, поскольку для достижения нормализации должны быть известны параметры внутренней камеры. Однако, если камеры откалиброваны, основная матрица может быть полезна для определения как относительного положения и ориентации между камерами, так и трехмерного положения соответствующих точек изображения.

Вывод и определение

Этот вывод следует из статьи Лонге-Хиггинса.

Две нормализованные камеры проецируют трехмерный мир на свои соответствующие плоскости изображения. Пусть трехмерные координаты точки п быть и относительно системы координат каждой камеры. Поскольку камеры нормализованы, соответствующие координаты изображения равны

и

Однородное представление двух координат изображения тогда дается формулой

и

что также может быть записано более компактно как

и

куда и являются однородными представлениями координат 2D-изображения и и являются правильными трехмерными координатами, но в двух разных системах координат.

Другим следствием нормализованных камер является то, что их соответствующие системы координат связаны посредством перемещения и вращения. Это означает, что два набора трехмерных координат связаны следующим образом:

куда это матрица вращения и - трехмерный вектор трансляции.

Тогда основная матрица определяется как:

куда это матричное представление перекрестного произведения с .

Чтобы увидеть, что это определение существенной матрицы описывает ограничение на соответствующие координаты изображения, умножьте слева и справа с трехмерными координатами точки п в двух разных системах координат:

  1. Вставьте указанные выше отношения между и и определение с точки зрения и .
  2. поскольку матрица вращения.
  3. Свойства матричное представление перекрестного произведения.

Наконец, можно предположить, что оба и > 0, иначе они не видны в обеих камерах. Это дает

что является ограничением, которое существенная матрица определяет между соответствующими точками изображения.

Характеристики

Не всякий произвольный Матрица может быть незаменимой матрицей для некоторых стереокамер. Чтобы увидеть это примечание, оно определяется как матричное произведение одного матрица вращения и один кососимметричная матрица, обе . Кососимметричная матрица должна иметь два сингулярные значения которые равны, а другой равен нулю. Умножение матрицы вращения не изменяет сингулярные значения, что означает, что также существенная матрица имеет два одинаковых сингулярных значения и одно нулевое. Описанные здесь свойства иногда называют внутренние ограничения существенной матрицы.

Если существенная матрица умножается на ненулевой скаляр, результатом снова является существенная матрица, которая определяет точно такое же ограничение, как делает. Это означает, что можно рассматривать как элемент проективное пространство, то есть две такие матрицы считаются эквивалентными, если одна является ненулевым скалярным умножением другой. Это актуальная позиция, например, если оценивается по данным изображения. Однако можно также занять позицию, что определяется как

куда , а потом имеет четко выраженное «масштабирование». Какая позиция более актуальна, зависит от приложения.

Ограничения также могут быть выражены как

и

Здесь последнее уравнение представляет собой матричное ограничение, которое можно рассматривать как 9 ограничений, по одному для каждого элемента матрицы. Эти ограничения часто используются для определения существенной матрицы из пяти соответствующих пар точек.

Существенная матрица имеет пять или шесть степеней свободы, в зависимости от того, рассматривается ли она как проективный элемент. Матрица вращения и вектор перевода имеют по три степени свободы, всего шесть. Однако, если существенная матрица рассматривается как проективный элемент, необходимо вычесть одну степень свободы, связанную со скалярным умножением, оставляя в общей сложности пять степеней свободы.

Оценка

Учитывая набор соответствующих точек изображения, можно оценить существенную матрицу, которая удовлетворяет определяющему эпиполярному ограничению для всех точек в наборе. Однако, если точки изображения подвержены шуму, что является обычным случаем в любой практической ситуации, невозможно найти существенную матрицу, которая точно удовлетворяет всем ограничениям.

В зависимости от того, как измеряется ошибка, связанная с каждым ограничением, можно определить или оценить существенную матрицу, которая оптимально удовлетворяет ограничениям для данного набора соответствующих точек изображения. Самый простой подход - создать Всего наименьших квадратов проблема, широко известная как восьмиточечный алгоритм.

Извлечение вращения и перемещения

Учитывая, что основная матрица была определена для пары стереокамер - например, с помощью описанного выше метода оценки - эту информацию можно использовать также для определения поворота. и перевод (с точностью до масштабирования) между двумя системами координат камеры. В этих выводах рассматривается как проективный элемент, а не как имеющий четко определенный масштаб.

Найдите одно решение

Следующий метод определения и основан на выполнении СВД из см. книгу Хартли и Зиссермана. Также возможно определить и без SVD, например, в соответствии со статьей Лонге-Хиггинса.

СВД дает

куда и ортогональны матрицы и это диагональная матрица с

Диагональные записи - сингулярные значения который, согласно внутренние ограничения существенной матрицы, должен состоять из двух одинаковых и одного нулевого значения. Определять

с

и сделайте следующее анзац

С может не полностью соответствовать ограничениям при работе с данными реального мира (например, изображениями с камеры), альтернативный

с

может помочь.

Доказательство

Во-первых, эти выражения для и удовлетворяют определяющему уравнению для существенной матрицы

Во-вторых, необходимо показать, что это является матричным представлением перекрестного произведения для некоторых . С

это тот случай, когда кососимметрична, т. е. . То же самое и с нашими , поскольку

По общим свойствам матричное представление кросс-продукта из этого следует, что должен быть оператором кросс-произведения ровно одного вектора .

В-третьих, также необходимо показать, что приведенное выше выражение для матрица вращения. Это произведение трех матриц, которые все ортогональны, что означает, что тоже ортогонален или . Чтобы быть правильной матрицей вращения, она также должна удовлетворять . Поскольку в этом случае рассматривается как проективный элемент, это может быть достигнуто путем изменения знака если необходимо.

Поиск всех решений

Пока одно возможное решение для и был установлен с учетом . Однако это не единственное возможное решение, и оно может быть даже неприемлемым с практической точки зрения. Начнем с того, что масштабирование не определено, масштабирование также не определено. Он должен лежать в пустое пространство из поскольку

Однако для последующего анализа решений точное масштабирование не так важно, как его «знак», т.е. в какую сторону он указывает. Позволять быть нормализованным вектором в нулевом пространстве . Тогда оба и являются действительными векторами трансляции относительно . Также возможно изменить в в выводах и над. Для вектора трансляции это вызывает только изменение знака, что уже было описано как возможность. Для вращения, с другой стороны, это приведет к другому преобразованию, по крайней мере, в общем случае.

Подводя итог, учитывая есть два противоположных направления, которые возможны для и два разных поворота, совместимых с этой важной матрицей. Всего это дает четыре класса решений для вращения и перемещения между двумя системами координат камеры. Вдобавок есть еще неизвестное масштабирование для выбранного направления перевода.

Однако оказывается, что на практике может быть реализован только один из четырех классов решений. Учитывая пару соответствующих координат изображения, три решения всегда будут давать трехмерную точку, которая лежит позади по крайней мере, одна из двух камер и поэтому не видна. Только один из четырех классов будет последовательно создавать 3D-точки, которые находятся перед обеими камерами. Тогда это должно быть правильное решение. Тем не менее, он имеет неопределенное положительное масштабирование, связанное с компонентом трансляции.

Приведенное выше определение и предполагает, что удовлетворить внутренние ограничения существенной матрицы. Если это не так, что, например, обычно бывает, если был оценен на основе реальных (и зашумленных) данных изображения, следует предположить, что он приблизительно удовлетворяет внутренним ограничениям. Вектор выбирается правым сингулярным вектором соответствующее наименьшему сингулярному значению.

3D-точки из соответствующих точек изображения

Существует множество методов вычисления с учетом соответствующих нормализованных координат изображения и , если известна существенная матрица и определены соответствующие преобразования поворота и сдвига.

Смотрите также

Ящики для инструментов

внешняя ссылка

Рекомендации

  • Дэвид Нистер (июнь 2004 г.). «Эффективное решение проблемы пятибалльной относительной позы». IEEE Transactions по анализу шаблонов и машинному анализу. 26 (6): 756–777. Дои:10.1109 / TPAMI.2004.17. PMID  18579936.
  • Х. Стевениус, К. Энгельс и Д. Нистер (июнь 2006 г.). «Последние события в области прямой относительной ориентации». Журнал ISPRS по фотограмметрии и дистанционному зондированию. 60 (4): 284–294. Bibcode:2006JPRS ... 60..284S. CiteSeerX  10.1.1.61.9329. Дои:10.1016 / j.isprsjprs.2006.03.005.
  • Х. Кристофер Лонге-Хиггинс (сентябрь 1981 г.). «Компьютерный алгоритм восстановления сцены из двух проекций». Природа. 293 (5828): 133–135. Bibcode:1981Натура.293..133л. Дои:10.1038 / 293133a0.
  • Ричард Хартли и Эндрю Зиссерман (2003). Многоканальная геометрия в компьютерном зрении. Издательство Кембриджского университета. ISBN  978-0-521-54051-3.
  • Йи Ма; Стефано Соатто; Яна Кошецка; С. Шанкар Састри (2004). Приглашение в 3-D видение. Springer. ISBN  978-0-387-00893-6.
  • Ган Сюй и Чжэнъю Чжан (1996). Эпиполярная геометрия в стерео, распознавании движения и объектов. Kluwer Academic Publishers. ISBN  978-0-7923-4199-4.