Обнаружение углов - Corner detection

Выход типичного алгоритма обнаружения углов

Обнаружение углов это подход, используемый в компьютерное зрение системы для извлечения определенных видов Особенности и вывести содержание изображения. Обнаружение углов часто используется в обнаружение движения, регистрация изображения, видео слежение, мозаика изображений, сшивание панорамы, 3D реконструкция и распознавание объекта. Обнаружение углов перекликается с темой обнаружение точки интереса.

Формализация

Угол можно определить как пересечение двух ребер. Угол также можно определить как точку, для которой существуют два доминирующих и разных направления кромок в локальной окрестности точки.

Интересующая точка - это точка на изображении, которая имеет четко определенное положение и может быть надежно обнаружена. Это означает, что точка интереса может быть углом, но она также может быть, например, изолированной точкой локального максимума или минимума интенсивности, окончанием линии или точкой на кривой, где кривизна локально максимальна.

На практике большинство так называемых методов обнаружения углов обнаруживают точки интереса в целом, и фактически термины «угол» и «точка интереса» используются более или менее взаимозаменяемо в литературе.^[1] Как следствие, если должны быть обнаружены только углы, необходимо провести локальный анализ обнаруженных точек интереса, чтобы определить, какие из них являются реальными углами. Примеры обнаружения кромок, которые можно использовать с постобработкой для обнаружения углов: Оператор Кирша и маскировочный набор Frei-Chen.^[2]

«Угол», «точка интереса» и «особенность» в литературе используются как синонимы, что сбивает с толку. В частности, есть несколько детекторы капель которые можно назвать «операторами точки интереса», но иногда ошибочно называют «детекторами углов». Более того, существует понятие обнаружение гребня чтобы запечатлеть наличие удлиненных предметов.

Угловые детекторы обычно не очень надежны и часто требуют введения большого количества избыточных данных, чтобы предотвратить преобладание влияния отдельных ошибок на задачу распознавания.

Одним из факторов, определяющих качество детектора углов, является его способность обнаруживать один и тот же угол на нескольких похожих изображениях в условиях разного освещения, перемещения, поворота и других преобразований.

Простой подход к обнаружению углов на изображениях - использование корреляция, но это становится очень затратным с точки зрения вычислений и неоптимально. Часто используемый альтернативный подход основан на методе, предложенном Харрисом и Стивенсом (ниже), который, в свою очередь, является усовершенствованием метода Моравека.

Алгоритм определения углов Moravec

Это один из самых ранних алгоритмов обнаружения углов, определяющий угол быть точкой с низким самоподобием.^[3] Алгоритм проверяет каждый пиксель в изображении, чтобы увидеть, присутствует ли угол, учитывая, насколько похож патч с центром на пикселе на соседние, в значительной степени перекрывающиеся участки. Сходство измеряется как сумма квадратов разностей (SSD) между соответствующими пикселями двух участков. Меньшее число указывает на большее сходство.

Если пиксель находится в области с одинаковой интенсивностью, то соседние участки будут выглядеть одинаково. Если пиксель находится на краю, то ближайшие участки в направлении, перпендикулярном краю, будут выглядеть совершенно иначе, но соседние участки в направлении, параллельном краю, приведут только к небольшому изменению. Если пиксель находится на объекте с вариациями во всех направлениях, то ни один из ближайших участков не будет выглядеть одинаково.

Сила угла определяется как наименьший SSD между патчем и его соседями (по горизонтали, вертикали и по двум диагоналям). Причина в том, что если это число велико, то вариация по всем сдвигам либо равна ему, либо больше, поэтому при захвате все соседние участки выглядят по-разному.

Если число прочности угла вычисляется для всех местоположений, то, что оно является максимальным для одного местоположения, указывает на то, что в нем присутствует интересующий объект.

Как указывает Моравец, одна из основных проблем с этим оператором заключается в том, что он не изотропный: если присутствует край, который не находится в направлении соседей (горизонтальный, вертикальный или диагональный), тогда самый маленький SSD будет большим, и край будет неправильно выбран в качестве точки интереса.^[4]

Алгоритмы определения углов Харриса и Стивенса / Ши – Томази

Видеть Угловой детектор Харриса.

Харрис и Стивенс^[5] усовершенствован детектор углов Moravec за счет непосредственного учета разницы угловых баллов относительно направления вместо использования смещенных участков. (Этот угловой результат часто называют автокорреляция, поскольку этот термин используется в статье, в которой описывается этот детектор. Однако математические данные в статье ясно показывают, что используется сумма квадратов разностей.)

Не умаляя общности, мы будем предполагать, что используется двухмерное изображение в градациях серого. Пусть это изображение задается ${displaystyle I}$ . Рассмотрите возможность нанесения пятна изображения на область ${displaystyle (u, v)}$ и сдвигая его ${displaystyle (x, y)}$ . Взвешенный сумма квадратов разностей (SSD) между этими двумя патчами, обозначенными ${displaystyle S}$ , дан кем-то:

{displaystyle S (x, y) = sum _ {u} sum _ {v} w (u, v), слева (I (u + x, v + y) -I (u, v) ight) ^ {2 }}

${displaystyle I (u + x, v + y)}$ можно аппроксимировать Расширение Тейлора. Позволять ${displaystyle I_ {x}}$ и ${displaystyle I_ {y}}$ быть частичным производные из ${displaystyle I}$ , так что

{displaystyle I (u + x, v + y) приблизительно I (u, v) + I_ {x} (u, v) x + I_ {y} (u, v) y}

Это дает приближение

{displaystyle S (x, y) приблизительная сумма _ {u} sum _ {v} w (u, v), слева (I_ {x} (u, v) x + I_ {y} (u, v) yight) ^ {2},}

который можно записать в матричной форме:

{displaystyle S (x, y) приблизительно {egin {pmatrix} x & yend {pmatrix}} A {egin {pmatrix} x yend {pmatrix}},}

куда А это структурный тензор,

{displaystyle A = sum _ {u} sum _ {v} w (u, v) {egin {bmatrix} I_ {x} (u, v) ^ {2} & I_ {x} (u, v) I_ {y } (u, v) I_ {x} (u, v) I_ {y} (u, v) & I_ {y} (u, v) ^ {2} end {bmatrix}} = {egin {bmatrix} langle I_ {x} ^ {2} угол и угол I_ {x} I_ {y} угол langle I_ {x} I_ {y} угол и угол I_ {y} ^ {2} угол конец {bmatrix}}}

На словах мы находим ковариация частной производной интенсивности изображения ${displaystyle I}$ с уважением к ${displaystyle x}$ и ${displaystyle y}$ топоры.

Угловые скобки обозначают усреднение (т.е. суммирование по ${displaystyle (u, v)}$ ). ${displaystyle w (u, v)}$ обозначает тип окна, которое скользит по изображению. Если Коробчатый фильтр используется ответ будет анизотропный, но если Гауссовский используется, то ответ будет изотропный.

Угол (или вообще интересная точка) характеризуется большим разбросом ${displaystyle S}$ во всех направлениях вектора ${displaystyle {egin {pmatrix} x & yend {pmatrix}}}$ . Анализируя собственные значения ${displaystyle A}$ , эту характеристику можно выразить следующим образом: ${displaystyle A}$ должен иметь два "больших" собственных значения для точки интереса. На основании величин собственных значений на основании этого аргумента можно сделать следующие выводы:

Если ${displaystyle lambda _ {1} приблизительно 0}$ и ${displaystyle lambda _ {2} приблизительно 0}$ тогда этот пиксель ${displaystyle (x, y)}$ не имеет интересных особенностей.
Если ${displaystyle lambda _ {1} приблизительно 0}$ и ${displaystyle lambda _ {2}}$ имеет большое положительное значение, то обнаруживается ребро.
Если ${displaystyle lambda _ {1}}$ и ${displaystyle lambda _ {2}}$ имеют большие положительные значения, то угол найден.

Харрис и Стивенс отмечают, что точное вычисление собственных значений требует больших вычислительных ресурсов, так как требует вычисления квадратный корень, и вместо этого предложите следующую функцию ${displaystyle M_ {c}}$ , куда ${displaystyle kappa}$ - настраиваемый параметр чувствительности:

{displaystyle M_ {c} = lambda _ {1} lambda _ {2} -kappa, (lambda _ {1} + lambda _ {2}) ^ {2} = operatorname {det} (A) -kappa, operatorname { трассировка} ^ {2} (A)}

Следовательно, алгоритм^[6] не обязательно вычислять разложение на собственные значения матрицы ${displaystyle A}$ а вместо этого достаточно оценить детерминант и след из ${displaystyle A}$ найти углы, а точнее интересные места в целом.

Ши – Томази^[7] угловой детектор непосредственно вычисляет ${displaystyle min (лямбда _ {1}, лямбда _ {2})}$ потому что при определенных предположениях углы более стабильны для отслеживания. Обратите внимание, что этот метод также иногда называют угловым детектором Канаде – Томази.

Значение ${displaystyle kappa}$ должен определяться эмпирически, и в литературе значения в диапазоне 0,04–0,15 указаны как возможные.

Можно избежать установки параметра ${displaystyle kappa}$ используя Noble's^[8] угловая мера ${displaystyle M_ {c} '}$ что составляет гармоническое среднее собственных значений:

{displaystyle M_ {c} '= 2 {frac {operatorname {det} (A)} {operatorname {trace} (A) + epsilon}},}

${displaystyle epsilon}$ будучи небольшой положительной константой.

Если ${displaystyle A}$ можно интерпретировать как матрица точности для углового положения ковариационная матрица для углового положения ${displaystyle A ^ {- 1}}$ , т.е.

{displaystyle {frac {1} {langle I_ {x} ^ {2} angle langle I_ {y} ^ {2} angle -langle I_ {x} I_ {y} angle ^ {2}}} {egin {bmatrix} langle I_ {y} ^ {2} угол & -langle I_ {x} I_ {y} угол -langle I_ {x} I_ {y} угол и langle I_ {x} ^ {2} угол конец {bmatrix}}. }

Сумма собственных значений ${displaystyle A ^ {- 1}}$ , который в этом случае можно интерпретировать как обобщенная дисперсия (или «полная неопределенность») углового положения, связана с угловой мерой Нобла ${displaystyle M_ {c} '}$ по следующему уравнению:

{displaystyle lambda _ {1} (A ^ {- 1}) + lambda _ {2} (A ^ {- 1}) = {frac {operatorname {trace} (A)} {operatorname {det} (A)} } примерно {frac {2} {M_ {c} '}}.}

Угловой извещатель Förstner

Обнаружение углов с использованием алгоритма Ферстнера

В некоторых случаях может потребоваться вычислить положение угла с точностью до субпикселей. Чтобы достичь приблизительного решения, Förstner^[9] Алгоритм находит точку, ближайшую ко всем касательным линиям угла в данном окне, и является решением методом наименьших квадратов. Алгоритм основан на том факте, что для идеального угла касательные линии пересекаются в одной точке.

Уравнение касательной ${displaystyle T_ {mathbf {x '}} (mathbf {x})}$ в пикселях ${displaystyle mathbf {x '}}$ дан кем-то:

{displaystyle T_ {mathbf {x '}} (mathbf {x}) = abla I (mathbf {x'}) ^ {op} (mathbf {x} -mathbf {x '}) = 0}

куда ${displaystyle abla I (mathbf {x '}) = [I_ {mathbf {x}}, I_ {mathbf {y}}] ^ {op}}$ вектор градиента изображения ${displaystyle I}$ в ${displaystyle mathbf {x '}}$ .

Смысл ${displaystyle mathbf {x} _ {0}}$ ближе всего ко всем касательным линиям в окне ${displaystyle N}$ является:

{displaystyle mathbf {x} _ {0} = {underset {mathbf {x} in mathbb {R} ^ {2 imes 1}} {operatorname {argmin}}} int _ {mathbf {x '} in N} T_ { mathbf {x '}} (mathbf {x}) ^ {2} dmathbf {x'}}

Расстояние от ${displaystyle mathbf {x} _ {0}}$ к касательным линиям ${displaystyle T_ {mathbf {x '}}}$ взвешивается по величине градиента, что придает большее значение касательным, проходящим через пиксели с сильными градиентами.

Решение для ${displaystyle mathbf {x} _ {0}}$ :

{displaystyle {egin {align} mathbf {x} _ {0} & = {underset {mathbf {x} in mathbb {R} ^ {2 imes 1}} {operatorname {argmin}}} int _ {mathbf {x ' } в N} (abla I (mathbf {x '}) ^ {op} (mathbf {x} -mathbf {x'})) ^ {2} dmathbf {x '} & = {underset {mathbf {x} в mathbb {R} ^ {2 imes 1}} {operatorname {argmin}}} int _ {mathbf {x '} in N} (mathbf {x} -mathbf {x'}) ^ {op} abla I (mathbf {x '}) abla I (mathbf {x'}) ^ {op} (mathbf {x} -mathbf {x '}) dmathbf {x'} & = {underset {mathbf {x} в mathbb {R} ^ {2 imes 1}} {operatorname {argmin}}}, (mathbf {x} ^ {op} Amathbf {x} -2mathbf {x} ^ {op} mathbf {b} + c) конец {выровнено}}}

${displaystyle Ain mathbb {R} ^ {2 imes 2}, {extbf {b}} in mathbb {R} ^ {2 imes 1}, cin mathbb {R}}$ определяются как:

{displaystyle {egin {выровнено} A & = int abla I (mathbf {x '}) abla I (mathbf {x'}) ^ {op} dmathbf {x '} mathbf {b} & = int abla I (mathbf { x '}) abla I (mathbf {x'}) ^ {op} mathbf {x '} dmathbf {x'} c & = int mathbf {x '} ^ {op} abla I (mathbf {x'}) abla I (mathbf {x '}) ^ {op} mathbf {x'} dmathbf {x '} end {выравнивается}}}

Минимизировать это уравнение можно путем дифференцирования по ${displaystyle x}$ и установив его равным 0:

{displaystyle 2Amathbf {x} -2mathbf {b} = 0Rightarrow Amathbf {x} = mathbf {b}}

Обратите внимание, что ${displaystyle Ain mathbb {R} ^ {2 imes 2}}$ это структурный тензор. Чтобы уравнение имело решение, ${displaystyle A}$ должно быть обратимым, что означает, что ${displaystyle A}$ должен быть полного ранга (ранг 2). Таким образом, решение

{displaystyle x_ {0} = A ^ {- 1} mathbf {b}}

существует только там, где в окне есть реальный угол ${displaystyle N}$ .

Методика выполнения автоматический выбор масштаба для этого метода угловой локализации был представлен Линдебергом.^[10]^[11] минимизируя нормированный остаток

{displaystyle {ilde {d}} _ {min} = {frac {c-b ^ {T} A ^ {- 1} b} {{mbox {trace}} A}}}

по весам. Таким образом, способ имеет возможность автоматически адаптировать уровни шкалы для вычисления градиентов изображения к уровню шума в данных изображения, выбирая более грубые уровни шкалы для зашумленных данных изображения и более тонкие уровни шкалы для почти идеальных угловидных структур.

Примечания:

${displaystyle c}$ можно рассматривать как невязку при вычислении решения методом наименьших квадратов: если ${displaystyle c = 0}$ , значит ошибки не было.
этот алгоритм можно модифицировать для вычисления центров круговых объектов, заменив касательные на нормальные.

Многомасштабный оператор Харриса

Вычисление второй матрицы моментов (иногда также называемой структурный тензор ) ${displaystyle A}$ в операторе Харриса требует вычисления производные изображения ${displaystyle I_ {x}, I_ {y}}$ в области изображений, а также суммирование нелинейных комбинаций этих производных по локальным окрестностям. Поскольку вычисление производных обычно включает этап сглаживания масштабного пространства, операционное определение оператора Харриса требует двух масштабных параметров: (i) a местный масштаб для сглаживания перед вычислением производные изображения, и (ii) масштаб интеграции для накопления нелинейных операций над производными операторами в интегрированном дескрипторе изображения.

С ${displaystyle I}$ обозначая интенсивность исходного изображения, пусть ${displaystyle L}$ обозначить представление масштабного пространства из ${displaystyle I}$ полученный сверткой с гауссовым ядром

{displaystyle g (x, y, t) = {гидроразрыв {1} {2 {pi} t}} e ^ {- (x ^ {2} + y ^ {2}) / 2t}}

с параметром местного масштаба ${displaystyle t}$ :

{displaystyle L (x, y, t) = g (x, y, t) * I (x, y)}

и разреши ${displaystyle L_ {x} = частично _ {x} L}$ и ${displaystyle L_ {y} = частично _ {y} L}$ обозначим частные производные от ${displaystyle L}$ Кроме того, введем гауссову оконную функцию ${displaystyle g (x, y, s)}$ с параметром масштаба интегрирования ${displaystyle s}$ . Затем многомасштабная матрица второго момента ^[12]^[13]^[14] можно определить как

{displaystyle mu (x, y; t, s) = int _ {xi = -infty} ^ {infty} int _ {eta = -infty} ^ {infty} {egin {bmatrix} L_ {x} ^ {2} (x-xi, y-eta; t) & L_ {x} (x-xi, y-eta; t), L_ {y} (x-xi, y-eta; t) L_ {x} (x- xi, y-eta; t), L_ {y} (x-xi, y-eta; t) & L_ {y} ^ {2} (x-xi, y-eta; t) end {bmatrix}} g ( xi, eta; s), dxi, deta.}

Затем мы можем вычислить собственные значения ${displaystyle mu}$ аналогично собственным значениям ${displaystyle A}$ и определить многомасштабная угловая мера Харриса в качестве

{displaystyle M_ {c} (x, y; t, s) = имя оператора {det} (mu (x, y; t, s)) - каппа, имя оператора {след} ^ {2} (mu (x, y; т, с))}

.

По поводу выбора параметра локального масштаба ${displaystyle t}$ и параметр масштаба интегрирования ${displaystyle s}$ , эти параметры масштаба обычно связаны с параметром относительного масштаба интегрирования ${displaystyle gamma}$ такой, что ${displaystyle s = gamma ^ {2} t}$ , куда ${displaystyle gamma}$ обычно выбирается в интервале ${displaystyle [1,2]}$ .^[12]^[13] Таким образом, мы можем вычислить многомасштабную угловую меру Харриса ${displaystyle M_ {c} (x, y; t, gamma ^ {2} t)}$ в любом масштабе ${displaystyle t}$ в масштабном пространстве, чтобы получить многомасштабный детектор углов, который реагирует на угловые структуры различных размеров в области изображения.

На практике этот многомасштабный детектор углов часто дополняется шаг выбора шкалы, где нормированный на масштаб лапласов оператор^[11]^[12]

{displaystyle abla _ {norm} ^ {2} L (x, y; t) = tabla ^ {2} L (x, y, t) = t (L_ {xx} (x, y, t) + L_ { yy} (x, y, t))}

вычисляется в каждом масштабе в масштабном пространстве и масштабировать адаптированные угловые точки с автоматическим выбором масштаба («оператор Харриса-Лапласа») вычисляются из точек, которые одновременно:^[15]

пространственные максимумы многомасштабной угловой меры ${displaystyle M_ {c} (x, y; t, gamma ^ {2} t)}$

{displaystyle ({hat {x}}, {hat {y}}; t) = имя оператора {argmaxlocal} _ {(x, y)} M_ {c} (x, y; t, гамма ^ {2} t) }

локальные максимумы или минимумы на масштабах нормированного на масштаб оператора лапласа^[11] ${displaystyle abla _ {norm} ^ {2} (x, y, t)}$ :

{displaystyle {hat {t}} = operatorname {argmaxminlocal} _ {t} abla _ {norm} ^ {2} L ({hat {x}}, {hat {y}}; t)}

Подход кривизны кривой уровня

Более ранний подход к обнаружению углов заключался в обнаружении точек, в которых кривизна кривых уровня и величина градиента равны одновременно высоко.^[16]^[17] Дифференциальный способ обнаружения таких точек - вычисление измененная кривизна кривой уровня (произведение кривизны кривой уровня и величины градиента в степени трех)

{displaystyle {ilde {kappa}} (x, y; t) = L_ {x} ^ {2} L_ {yy} + L_ {y} ^ {2} L_ {xx} -2L_ {x} L_ {y} L_ {xy}}

и для обнаружения положительных максимумов и отрицательных минимумов этого дифференциального выражения в некотором масштабе ${displaystyle t}$ в представление масштабного пространства ${displaystyle L}$ исходного изображения.^[10]^[11] Однако основная проблема при вычислении объекта кривизны перемасштабированной кривой уровня в едином масштабе состоит в том, что он может быть чувствительным к шуму и к выбору уровня шкалы. Лучшим методом является вычисление ${displaystyle gamma}$ -нормализованная кривизна измененной кривой уровня

{displaystyle {ilde {kappa _ {norm}}} (x, y; t) = t ^ {2gamma} (L_ {x} ^ {2} L_ {yy} + L_ {y} ^ {2} L_ {xx } -2L_ {x} L_ {y} L_ {xy})}

с ${displaystyle gamma = 7/8}$ и обнаружить знаковые экстремумы масштабного пространства этого выражения, то есть точки и масштабы, которые являются положительными максимумами и отрицательными минимумами как по пространству, так и по масштабу

{displaystyle ({hat {x}}, {hat {y}}; {hat {t}}) = operatorname {argminmaxlocal} _ {(x, y; t)} {ilde {kappa}} _ {norm} ( x, y; t)}

в сочетании с дополнительным этапом локализации, чтобы справиться с увеличением ошибки локализации в более грубых масштабах.^[10]^[11]^[12] Таким образом, большие значения масштаба будут связаны с закругленными углами большой пространственной протяженности, тогда как меньшие значения масштаба будут связаны с острыми углами с малой пространственной протяженностью. Этот подход является первым детектором углов с автоматическим выбором масштаба (до «оператора Харриса-Лапласа» выше) и использовался для отслеживания углов при крупномасштабных вариациях в области изображения.^[18] и для согласования угловых характеристик с краями для вычисления структурных характеристик изображения для геон распознавание объектов.^[19]

Лапласиан гауссиана, разности гауссианов и определитель точек интереса масштабного пространства Гессе

Бревно^[11]^[12]^[15] это аббревиатура, обозначающая Лапласиан Гаусса, Собака^[20] это аббревиатура, обозначающая разница гауссиан (DoG - это приближение к LoG), а DoH - это аббревиатура, обозначающая определитель гессиана.^[11] Все эти масштабно-инвариантные точки интереса извлекаются путем обнаружения экстремумов в масштабном пространстве нормализованных по масштабу дифференциальных выражений, то есть точек в масштабном пространстве, где соответствующие нормализованные по масштабу дифференциальные выражения принимают локальные экстремумы как по пространству, так и по масштабу^[11]

{displaystyle ({hat {x}}, {hat {y}}; {hat {t}}) = operatorname {argminmaxlocal} _ {(x, y; t)} (D_ {norm} L) (x, y ; t)}

куда ${displaystyle D_ {norm} L}$ обозначает соответствующий дифференцированный объект с нормализованной шкалой (определен ниже).

Эти детекторы более подробно описаны в обнаружение капли. Нормированный по масштабу лапласиан гауссовских и разностных гауссовских функций (Lindeberg 1994, 1998; Lowe 2004)^[11]^[12]^[20]

{displaystyle {egin {выравнивается} abla _ {norm} ^ {2} L (x, y; t) = t, (L_ {xx} + L_ {yy}) & приблизительно {frac {tleft (L (x, y; t + Delta t) -L (x, y; t) ight)} {Delta t}} конец {выровнено}}}

не обязательно создавать высокоселективные функции, поскольку эти операторы также могут приводить к откликам на краях. Чтобы улучшить способность обнаружения углов различий детектора Гауссианы, детектор признаков, используемый в ПРОСЕЯТЬ^[20] поэтому система использует дополнительный этап постобработки, на котором собственные значения из Гессен изображения в масштабе обнаружения рассматриваются аналогично оператору Харриса. Если соотношение собственных значений слишком велико, тогда локальное изображение рассматривается как слишком похожее на кромку, поэтому признак отклоняется. Также можно определить лапласиан Линдеберга гауссовского детектора признаков, включающий дополнительную пороговую обработку для дополнительного дифференциального инварианта для подавления откликов вблизи краев.^[21]

Нормализованный по масштабу определитель оператора Гессе (Линдеберг, 1994, 1998)^[11]^[12]

{displaystyle operatorname {det} H_ {norm} L = t ^ {2} (L_ {xx} L_ {yy} -L_ {xy} ^ {2})}

с другой стороны, очень селективен к хорошо локализованным функциям изображения и реагирует только тогда, когда есть значительные вариации уровня серого в двух направлениях изображения^[11]^[14] и в этом, и в других отношениях является лучшим детектором точки интереса, чем лапласиан гауссиана. Определитель гессиана является аффинно-ковариантным дифференциальным выражением и имеет лучшие свойства выбора масштаба при преобразованиях аффинных изображений, чем оператор Лапласа (Lindeberg 2013, 2015).^[21]^[22] Экспериментально это означает, что детерминант гессианских точек интереса имеет лучшие свойства повторяемости при локальной деформации изображения, чем лапласовские точки интереса, что, в свою очередь, приводит к лучшей производительности сопоставления на основе изображений с точки зрения более высоких показателей эффективности и более низких оценок точности 1.^[21]

Свойства выбора масштаба, свойства аффинного преобразования и экспериментальные свойства этих и других детекторов точек интереса в масштабном пространстве подробно анализируются в (Lindeberg 2013, 2015).^[21]^[22]

Пространственно-масштабные точки интереса, основанные на мерах силы признаков Линдеберга-Гессе

Вдохновленный структурно схожими свойствами матрицы Гессе ${displaystyle Hf}$ функции ${displaystyle f}$ и матрица второго момента (структурный тензор) ${displaystyle mu}$ , как, например, проявляться в терминах своих аналогичных свойств преобразования при деформациях аффинных изображений^[13]^[21]

{displaystyle (Hf ') = A ^ {- T}, (Hf), A ^ {- 1}}

,

{displaystyle mu '= A ^ {- T}, mu, A ^ {- 1}}

,

Линдеберг (2013, 2015)^[21]^[22] предложил определить четыре меры силы признаков из матрицы Гессе родственными способами, поскольку операторы Харриса и Ши-и Томази определены из структурного тензора (матрицы второго момента). В частности, он определил следующие беззнаковые и подписанные меры силы гессенских признаков :

мера силы I беззнакового гессенского элемента:

{displaystyle D_ {1, norm} L = {egin {Bmatrix} t ^ {2}, (имя оператора {det} HL-k, имя оператора {trace} ^ {2} HL) & {mbox {if}}, имя оператора { det} HL-k, имя оператора {трассировка} ^ {2} HL> 0 0 & {mbox {иначе}} end {Bmatrix}}}

подписанная мера силы гессенских элементов I:

{displaystyle {ilde {D}} _ {1, norm} L = {egin {Bmatrix} t ^ {2}, (имя оператора {det} HL-k, имя оператора {trace} ^ {2} HL) & {mbox { if}}, имя оператора {det} HL-k, имя оператора {след} ^ {2} HL> 0 t ^ {2}, (имя оператора {det} HL + k, имя оператора {след} ^ {2} HL) & {mbox {if}}, имя оператора {det} HL + k, имя оператора {трассировка} ^ {2} HL <0 0 & {mbox {else}} end {Bmatrix}}}

беззнаковая мера силы гессенской характеристики II:

{displaystyle D_ {2, norm} L = t, operatorname {min} (| lambda _ {1} (HL) |, | lambda _ {2} (HL) |)}

подписанная мера силы гессенских признаков II:

{displaystyle {ilde {D}} _ {2, norm} L = {egin {Bmatrix} t, lambda _ {1} (HL) & {mbox {if}}, | lambda _ {1} (HL) | < | lambda _ {2} (HL) | t, lambda _ {2} (HL) & {mbox {if}}, | lambda _ {2} (HL) | <| lambda _ {1} (HL) | t, (лямбда _ {1} (HL) + лямбда _ {2} (HL)) / 2 & {mbox {иначе}} end {Bmatrix}}}

куда ${displaystyle operatorname {trace} HL = L_ {xx} + L_ {yy}}$ и ${displaystyle operatorname {det} HL = L_ {xx} L_ {yy} -L_ {xy} ^ {2}}$ обозначим след и определитель матрицы Гессе ${displaystyle HL}$ представления масштабного пространства ${displaystyle L}$ в любом масштабе ${displaystyle t}$ , в то время как

{displaystyle lambda _ {1} (HL) = L_ {pp} = {frac {1} {2}} left (L_ {xx} + L_ {yy} - {sqrt {(L_ {xx} -L_ {yy}) ) ^ {2} + 4L_ {xy} ^ {2}}} ight)}

{displaystyle lambda _ {2} (HL) = L_ {qq} = {frac {1} {2}} left (L_ {xx} + L_ {yy} + {sqrt {(L_ {xx} -L_ {yy}) ) ^ {2} + 4L_ {xy} ^ {2}}} ight)}

обозначают собственные значения матрицы Гессе.^[23]

Беззнаковая мера силы гессенской особенности ${displaystyle D_ {1, norm} L}$ реагирует на локальные экстремумы положительными значениями и не чувствителен к седловым точкам, тогда как мера силы знаковых гессенских особенностей ${displaystyle {ilde {D}} _ {1, norm} L}$ дополнительно реагирует на седловые точки отрицательными значениями. Беззнаковая мера силы гессенского элемента ${displaystyle D_ {2, norm} L}$ нечувствителен к локальной полярности сигнала, тогда как знаковая мера силы гессенской характеристики ${displaystyle {ilde {D}} _ {2, norm} L}$ реагирует на локальную полярность сигнала знаком его выхода.

В Линдеберге (2015)^[21] эти четыре дифференциальных объекта были объединены с выбором локального масштаба на основе обнаружения экстремумов в пространстве масштаба

{displaystyle ({hat {x}}, {hat {y}}; {hat {t}}) = operatorname {argminmaxlocal} _ {(x, y; t)} (D_ {norm} L) (x, y ; t)}

или масштабное связывание. Кроме того, подписанные и неподписанные гессенские особенности меры прочности ${displaystyle D_ {2, norm} L}$ и ${displaystyle {ilde {D}} _ {2, norm} L}$ были объединены с дополнительным пороговым значением на ${displaystyle D_ {1, norm} L> 0}$ .

Путем экспериментов по сопоставлению изображений при преобразованиях масштабирования на наборе данных плаката с 12 плакатами с согласованием нескольких ракурсов при преобразованиях масштабирования до коэффициента масштабирования до 6 и вариациями направления обзора до угла наклона 45 градусов с локальными дескрипторами изображения, определенными из переформулировок было показано, что дескрипторы чистого изображения в операторах SIFT и SURF для измерения изображения в терминах операторов производной Гаусса (Gauss-SIFT и Gauss-SURF) вместо исходного SIFT, как определено из пирамиды изображения или исходного SURF, как определено из вейвлетов Хаара, было показано обнаружение интересующей точки в пространстве масштаба на основе беззнаковой меры силы гессенской характеристики ${displaystyle D_ {1, norm} L}$ позволили обеспечить лучшую производительность и лучшую производительность, чем точки интереса в пространстве масштаба, полученные из определителя гессиана ${displaystyle operatorname {det} H_ {norm} L = t ^ {2}, (L_ {xx} L_ {yy} -L_ {xy} ^ {2})}$ . Оба беззнаковых показателя силы гессенских признаков ${displaystyle D_ {1, norm} L}$ , мера прочности гессенского элемента со знаком ${displaystyle {ilde {D}} _ {1, norm} L}$ и определитель гессиана ${displaystyle operatorname {det} H_ {norm} L}$ позволил добиться лучшей производительности, чем лапласиан гауссовского ${displaystyle abla _ {norm} ^ {2} L = t, (L_ {xx} + L_ {yy})}$ . В сочетании с привязкой шкалы и дополнительным порогом ${displaystyle D_ {1, norm} L> 0}$ , мера прочности гессенского элемента со знаком ${displaystyle {ilde {D}} _ {2, norm} L}$ дополнительно учитывал лучшую производительность, чем лапласиан гауссовского ${displaystyle abla _ {norm} ^ {2} L}$ .

Кроме того, было показано, что все эти дифференциальные детекторы точек интереса в масштабном пространстве, определенные на основе матрицы Гессе, позволяют обнаруживать большее количество точек интереса и лучше согласовывать характеристики по сравнению с операторами Харриса и Ши-и-Томази, определенными из структуры тензор (матрица второго момента).

Теоретический анализ свойств выбора шкалы этих четырех мер силы признаков Гессе и других дифференциальных сущностей для обнаружения точек интереса в пространстве масштаба, включая лапласиан гауссиана и определитель гессиана, приведен в Lindeberg (2013).^[22] и анализ их свойств аффинного преобразования, а также экспериментальных свойств в Lindeberg (2015).^[21]

Аффинно-адаптированные операторы точки интереса

Точки интереса, полученные с помощью многомасштабного оператора Харриса с автоматическим выбором масштаба, инвариантны к сдвигам, поворотам и равномерному изменению масштаба в пространственной области. Однако изображения, входящие в систему компьютерного зрения, также подвержены перспективным искажениям. Чтобы получить оператор точки интереса, более устойчивый к перспективным преобразованиям, естественным подходом является разработка детектора признаков, который инвариантен к аффинным преобразованиям. На практике аффинно-инвариантные точки интереса можно получить, применяя адаптация аффинной формы где форма сглаживающего ядра итеративно деформируется, чтобы соответствовать локальной структуре изображения вокруг интересующей точки, или, что эквивалентно, локальный участок изображения итеративно деформируется, в то время как форма сглаживающего ядра остается вращательно-симметричной (Lindeberg 1993, 2008; Lindeberg and Garding 1997; Миколайзчик и Шмид 2004).^[12]^[13]^[14]^[15] Следовательно, помимо широко используемого многомасштабного оператора Харриса, адаптация аффинной формы может применяться к другим детекторам углов, перечисленным в этой статье, а также к дифференциальные детекторы капель такие как лапласиан / разность гауссовского оператора, определитель гессиана^[14] и оператор Гессе – Лапласа.

Алгоритм обнаружения углов Ванга и Брэди

Ван и Брэди^[24] детектор считает изображение поверхностью и ищет места, где есть большие кривизна по краю изображения. Другими словами, алгоритм ищет места, где край быстро меняет направление. Угловой счет, ${displaystyle C}$ , дан кем-то:

{displaystyle C = left ({frac {delta ^ {2} I} {delta {f {{t} ^ {2}}}} ight) ^ {2} -c | abla I | ^ {2},}

куда ${displaystyle {f {t}}}$ - единичный вектор, перпендикулярный градиенту, и ${displaystyle c}$ определяет степень фобии края детектора. Авторы также отмечают, что для уменьшения шума требуется сглаживание (предлагается гауссово).

Сглаживание также вызывает смещение углов, поэтому авторы получают выражение для смещения угла 90 градусов и применяют его в качестве поправочного коэффициента к обнаруженным углам.

Угловой извещатель SUSAN

СЬЮЗЕН^[25] это аббревиатура, обозначающая наименьший однозначный сегмент ассимилирующего ядра. Этот метод является предметом патента Великобритании 1994 года, который больше не действует.^[26]

Для обнаружения признаков SUSAN накладывает круговую маску на проверяемый пиксель (ядро). Область маски ${displaystyle M}$ , а пиксель в этой маске представлен как ${displaystyle {vec {m}} в M}$ . Ядро находится на ${displaystyle {vec {m}} _ {0}}$ . Каждый пиксель сравнивается с ядром с помощью функции сравнения:

{displaystyle c ({vec {m}}) = e ^ {- left ({frac {I ({vec {m}}) - I ({vec {m}} _ {0})} {t}} бегу) ) ^ {6}}}

куда ${displaystyle t}$ порог разницы яркости,^[27] ${displaystyle I}$ - яркость пикселя, а степень экспоненты была определена эмпирически. Эта функция имеет вид сглаженной цилиндрическая или прямоугольная функция. Площадь СУЗАНА определяется по:

{displaystyle n (M) = sum _ {{vec {m}} в M} c ({vec {m}})}

Если ${displaystyle c}$ - прямоугольная функция, то ${displaystyle n}$ количество пикселей в маске, которые находятся в пределах ${displaystyle t}$ ядра. Ответ оператора SUSAN дает:

{displaystyle R (M) = {egin {case} g-n (M) & {mbox {if}} n (M)

куда ${displaystyle g}$ называется "геометрическим порогом". Другими словами, оператор SUSAN получает положительную оценку только в том случае, если область достаточно мала. Наименьший локальный SUSAN можно найти с помощью немаксимального подавления, и это полный оператор SUSAN.

Значение ${displaystyle t}$ определяет, насколько похожими должны быть точки для ядра, прежде чем они будут считаться частью однозначного сегмента. Значение ${displaystyle g}$ определяет минимальный размер однозначного сегмента. Если ${displaystyle g}$ достаточно большой, тогда это становится детектор края.

Для определения угла используются еще два шага. Во-первых, центроид СУЗАНА найден. В правильном углу центр тяжести находится далеко от ядра. Второй шаг требует, чтобы все точки на линии от ядра через центроид до края маски находились в SUSAN.

Угловой детектор Трайковича и Хедли

Подобно SUSAN, этот детектор^[28] непосредственно проверяет, является ли патч под пикселем самоподобным, исследуя соседние пиксели. ${displaystyle {vec {c}}}$ - рассматриваемый пиксель, и ${displaystyle {vec {p}} на языке P}$ точка на круге ${displaystyle P}$ сосредоточено вокруг ${displaystyle {vec {c}}}$ . Смысл ${displaystyle {vec {p '}}}$ точка противоположна ${displaystyle {vec {p}}}$ по диаметру.

Функция ответа определяется как:

{displaystyle r ({vec {c}}) = min _ {{vec {p}} в P} quad ((I ({vec {p}}) - I ({vec {c}})) ^ {2 } + (I ({vec {p '}}) - I ({vec {c}})) ^ {2})}

Это будет большим, если нет направления, в котором центральный пиксель похож на два соседних пикселя по диаметру. ${displaystyle P}$ это дискретизированный круг ( Круг Брезенхема ), так интерполяция используется для промежуточных диаметров, чтобы дать более изотропный отклик. Поскольку любое вычисление дает верхнюю оценку ${displaystyle min}$ , сначала проверяются горизонтальное и вертикальное направления, чтобы увидеть, стоит ли продолжать полное вычисление ${displaystyle c}$ .

Детекторы признаков на основе AST

AST - это аббревиатура, обозначающая ускоренный сегментный тест. Этот тест является упрощенной версией критерия угла SUSAN. Вместо оценки круглого диска, только пиксели в Круг Брезенхема радиуса ${displaystyle r}$ вокруг точки-кандидата. Если ${displaystyle n}$ смежные пиксели все ярче ядра как минимум на ${displaystyle t}$ или все темнее ядра на ${displaystyle t}$ , то пиксель под ядром считается признаком. Сообщается, что этот тест дает очень стабильные функции.^[29] Выбор порядка проверки пикселей - это так называемый Проблема "Двадцать вопросов". Построение коротких деревьев решений для этой проблемы приводит к наиболее эффективным с точки зрения вычислений детекторам признаков.

Первый алгоритм обнаружения углов, основанный на AST, - БЫСТРЫЙ (особенности из ускоренного тестирования сегмента ).^[29] Несмотря на то что ${displaystyle r}$ в принципе может принимать любое значение, FAST использует только значение 3 (соответствует окружности в 16 пикселей), а тесты показывают, что наилучшие результаты достигаются с ${displaystyle n}$ равное 9. Это значение ${displaystyle n}$ это самый низкий уровень, на котором края не обнаруживаются. Порядок проверки пикселей определяется Алгоритм ID3 из обучающего набора изображений. Как ни странно, название детектора несколько похоже на название статьи, описывающей детектор Трайковича и Хедли.

Автоматический синтез детекторов

Трухильо и Олаге^[30] представил метод, с помощью которого генетическое программирование используется для автоматического синтеза операторов изображений, которые могут обнаруживать точки интереса. Наборы терминалов и функций содержат примитивные операции, которые являются общими для многих ранее предложенных искусственных конструкций. Фитнес измеряет стабильность каждого оператора с помощью коэффициента повторяемости и способствует равномерному распределению обнаруженных точек по плоскости изображения. Работоспособность усовершенствованных операторов была подтверждена экспериментально с помощью обучающих и тестовых последовательностей прогрессивно преобразованных изображений. Следовательно, предложенный алгоритм GP считается конкурентоспособным для человека в задаче обнаружения точки интереса.

Детекторы пространственно-временных точек интереса

Оператор Харриса был расширен на пространство-время Лаптевым и Линдебергом.^[31]Позволять ${displaystyle mu}$ обозначают пространственно-временную матрицу второго момента, определенную как

{displaystyle A = sum _ {u} sum _ {v} sum _ {w} h (u, v, w) {egin {bmatrix} L_ {x} (u, v, w) ^ {2} & L_ {x } (u, v, w) L_ {y} (u, v, w) & L_ {x} (u, v, w) L_ {t} (u, v, w) L_ {x} (u, v , w) L_ {y} (u, v, w) & L_ {y} (u, v, w) ^ {2} & L_ {y} (u, v, w) L_ {t} (u, v, w ) L_ {x} (u, v, w) L_ {t} (u, v, w) & L_ {y} (u, v, w) L_ {t} (u, v, w) & L_ {t} (u, v, w) ^ {2} end {bmatrix}} = {egin {bmatrix} langle L_ {x} ^ {2} angle & langle L_ {x} L_ {y} angle & langle L_ {x} L_ { t} угол langle L_ {x} L_ {y} угол и угол L_ {y} ^ {2} угол и угол L_ {y} L_ {t} угол langle L_ {x} L_ {t} угол и угол L_ {y} L_ {t} угол и угол L_ {t} ^ {2} угол end {bmatrix}}}

Затем для подходящего выбора ${displaystyle k <1/27}$ , пространственно-временные точки интереса обнаруживаются из пространственно-временных экстремумов следующей пространственно-временной меры Харриса:

{displaystyle H = operatorname {det} (mu) -kappa, operatorname {trace} ^ {2} (mu).}

Определитель оператора Гессе был расширен на совместное пространство-время Виллемсом и др. ^[32] и Линдеберг,^[33] что приводит к следующему нормированному по масштабу дифференциальному выражению:

{displaystyle operatorname {det} (H _ {(x, y, t), norm} L) =, s ^ ​​{2gamma _ {s}} au ^ {gamma _ {au}} left ((L_ {xx} L_ { yy} L_ {tt} + 2L_ {xy} L_ {xt} L_ {yt} -L_ {xx} L_ {yt} ^ {2} -L_ {yy} L_ {xt} ^ {2} -L_ {tt} L_ {xy} ^ {2} ight).}

В работе Виллемса и др.^[32] более простое выражение, соответствующее ${displaystyle gamma _ {s} = 1}$ и ${displaystyle gamma _ {au} = 1}$ использовался. В Линдеберге,^[33] было показано, что ${displaystyle gamma _ {s} = 5/4}$ и ${displaystyle gamma _ {au} = 5/4}$ подразумевает лучшие свойства масштабного выбора в том смысле, что выбранные масштабные уровни, полученные из пространственно-временного гауссова блоба с пространственной протяженностью ${displaystyle s = s_ {0}}$ и временная протяженность ${displaystyle au = au _ {0}}$ будет идеально соответствовать пространственной протяженности и временной продолжительности блоба, при этом выбор масштаба выполняется путем обнаружения пространственно-временных экстремумов масштабного пространства дифференциального выражения.

Оператор Лапласа был распространен на пространственно-временные видеоданные Линдебергом,^[33] что приводит к следующим двум пространственно-временным операторам, которые также представляют собой модели рецептивных полей нейронов без задержки и нейронов в LGN:

{displaystyle partial _ {t, norm} (abla _ {(x, y), norm} ^ {2} L) = s ^ {gamma _ {s}} au ^ {gamma _ {au} / 2} (L_ {xxt} + L_ {yyt}),}

{displaystyle partial _ {tt, norm} (abla _ {(x, y), norm} ^ {2} L) = s ^ {gamma _ {s}} au ^ {gamma _ {au}} (L_ {xxtt } + L_ {yytt}).}

Для первого оператора свойства выбора масштаба требуют использования ${displaystyle gamma _ {s} = 1}$ и ${displaystyle gamma _ {au} = 1/2}$ , если мы хотим, чтобы этот оператор принимал максимальное значение в пространственно-временных масштабах на уровне пространственно-временного масштаба, отражающем пространственную протяженность и временную продолжительность начинающегося гауссова блоба. Для второго оператора свойства выбора масштаба требуют использования ${displaystyle gamma _ {s} = 1}$ и ${displaystyle gamma _ {au} = 3/4}$ , если мы хотим, чтобы этот оператор принимал максимальное значение в пространственно-временных масштабах на пространственно-временном масштабном уровне, отражающем пространственную протяженность и временную длительность мигающего гауссова блоба.

Цветовые расширения пространственно-временных детекторов точек интереса были исследованы Everts et al.^[34]

Библиография

^ Эндрю Уиллис и Юньфэн Суй (2009). «Алгебраическая модель для быстрого обнаружения углов». 2009 12-я Международная конференция IEEE по компьютерному зрению. IEEE. С. 2296–2302. Дои:10.1109 / ICCV.2009.5459443. ISBN 978-1-4244-4420-5.
^ Шапиро, Линда и Джордж К. Стокман (2001). Компьютерное зрение, п. 257. Prentice Books, Верхняя Седл-Ривер. ISBN 0-13-030796-3.
^ Х. Моравец (1980). «Избегание препятствий и навигация в реальном мире с помощью робота-вездехода-видящего». Технический отчет CMU-RI-TR-3 Университет Карнеги-Меллона, Институт робототехники.
^ Избегание препятствий и навигация в реальном мире с помощью видящего робота-вездехода, Ханс Моравец, март 1980 г., факультет компьютерных наук Стэнфордского университета (докторская диссертация)
^ К. Харрис и М. Стивенс (1988). «Комбинированный детектор угла и края» (PDF). Материалы 4-й конференции Alvey Vision. С. 147–151.
^ Хавьер Санчес, Нельсон Монсон и Агустин Сальгадо (2018). «Анализ и реализация детектора угла Харриса» (PDF). Обработка изображений в режиме онлайн. 8: 305–328. Дои:10.5201 / ipol.2018.229. Архивировано из оригинал на 2018-10-03.
^ Дж. Ши и К. Томази (июнь 1994 г.). «Хорошие возможности для отслеживания». 9-я конференция IEEE по компьютерному зрению и распознаванию образов. Springer. С. 593–600. CiteSeerX 10.1.1.36.2669. Дои:10.1109 / CVPR.1994.323794.
{{cite techreport | автор = C. Томази и Т. Канаде | title = Обнаружение и отслеживание точечных объектов | год = 1991 | номер = CMU-CS-91-132 | учреждение = Школа компьютерных наук, Университет Карнеги-Меллона | citeseerx = 10.1.1.45.5770
^ А. Ноубл (1989). Описание поверхностей изображения (Кандидат наук.). Департамент инженерных наук Оксфордского университета. п. 45.
^ Förstner, W; Гюльх (1987). «Быстрый оператор для обнаружения и точного определения местоположения отличных точек, углов и центров круговых объектов» (PDF). ISPRS.^{[постоянная мертвая ссылка ]}
^ ^а ^б ^c Т. Линдеберг (1994). «Обнаружение стыков с автоматическим выбором шкал обнаружения и шкал локализации». Proc. 1-я Международная конференция по обработке изображений. я. Остин, Техас. С. 924–928.
^ ^а ^б ^c ^d ^е ^ж ^грамм ^час ^я ^j ^k Тони Линдеберг (1998). «Обнаружение признаков с автоматическим выбором шкалы». Международный журнал компьютерного зрения. 30 (2). С. 77–116.
^ ^а ^б ^c ^d ^е ^ж ^грамм ^час Т. Линдеберг (1994). Теория масштабного пространства в компьютерном зрении. Springer. ISBN 978-0-7923-9418-1.
^ ^а ^б ^c ^d Т. Линдеберг и Дж. Гардинг "Сглаживание с учетом формы в оценке трехмерных сигналов глубины на основе аффинных искажений локальной двумерной структуры". Image and Vision Computing 15 (6): pp 415–434, 1997.
^ ^а ^б ^c ^d Т. Линдеберг (2008). «Масштаб-Пространство». В Бенджамине Ва (ред.). Энциклопедия компьютерных наук и инженерии Wiley. IV. Джон Уайли и сыновья. С. 2495–2504. Дои:10.1002 / 9780470050118.ecse609. ISBN 978-0-470-05011-8.
^ ^а ^б ^c К. Миколайчик, К. и К. Шмид (2004). «Масштабные и аффинно-инвариантные детекторы точек интереса» (PDF). Международный журнал компьютерного зрения. 60 (1): 63–86. Дои:10.1023 / B: VISI.0000027790.02288.f2.
^ Л. Китчен и А. Розенфельд (1982). «Определение углов на уровне серого». Письма с распознаванием образов. 1 (2). С. 95–102.
^ Дж. Дж. Кендеринк и У. Ричардс (1988). «Двумерные операторы кривизны». Журнал Оптического общества Америки A. 5 (7). С. 1136–1141.
^ Л. Бретцнер и Т. Линдеберг (1998). «Отслеживание объектов с автоматическим выбором пространственных масштабов». Компьютерное зрение и понимание изображений. 71. С. 385–392.
^ Т. Линдеберг и М.-Х. Ли (1997). «Сегментация и классификация ребер с использованием аппроксимации минимальной длины описания и дополнительных точек соединения». Компьютерное зрение и понимание изображений. 67 (1). С. 88–98.
^ ^а ^б ^c Д. Лоу (2004). «Отличительные особенности изображения от ключевых точек, не зависящих от масштаба». Международный журнал компьютерного зрения. 60 (2): 91. CiteSeerX 10.1.1.73.2924. Дои:10.1023 / B: VISI.0000029664.99615.94.
^ ^а ^б ^c ^d ^е ^ж ^грамм ^час Т. Линдеберг, «Сопоставление изображений с использованием обобщенных точек интереса в масштабном пространстве», Journal of Mathematical Imaging and Vision, том 52, номер 1, страницы 3-36, 2015.
^ ^а ^б ^c ^d Т. Линдеберг "Свойства масштабного выбора детекторов точек интереса обобщенного масштабного пространства", Журнал математической визуализации и зрения, том 46, выпуск 2, страницы 177-210, 2013.
^ Линдеберг, Т. (1998). «Обнаружение края и обнаружение гребня с автоматическим выбором шкалы». Международный журнал компьютерного зрения. 30 (2): 117–154. Дои:10.1023 / А: 1008097225773.
^ Х. Ван и М. Брэди (1995). «Алгоритм определения угла в реальном времени для оценки движения». Вычисления изображений и зрения. 13 (9): 695–703. Дои:10.1016 / 0262-8856 (95) 98864-П.
^ С. М. Смит и Дж. М. Брэди (май 1997 г.). «SUSAN - новый подход к обработке изображений низкого уровня». Международный журнал компьютерного зрения. 23 (1): 45–78. Дои:10.1023 / А: 1007963824710.
С. М. Смит и Дж. М. Брэди (январь 1997 г.), «Метод цифровой обработки изображений для определения положения краев и / или углов в них для управления беспилотным транспортным средством». Патент Великобритании 2272285, владелец: министр обороны Великобритании.
^ Патент Великобритании 2272285, список изобретателей (свободный формат), "Определение положения краев и углов на изображениях", опубликовано 11 мая 1994 г., выпущено 11 мая 1994 г., поручено Secr Defense
^ "Детектор края SUSAN в деталях".
^ М. Трайкович и М. Хедли (1998). «Быстрое обнаружение углов». Вычисления изображений и зрения. 16 (2): 75–87. Дои:10.1016 / S0262-8856 (97) 00056-5.
^ ^а ^б Э. Ростен и Т. Драммонд (май 2006 г.). «Машинное обучение для высокоскоростного обнаружения углов». Европейская конференция по компьютерному зрению.
^ Леонардо Трухильо и Густаво Олаге (2008). «Автоматизированный дизайн операторов изображений, которые обнаруживают точки интереса» (PDF). Эволюционные вычисления. 16 (4): 483–507. Дои:10.1162 / evco.2008.16.4.483. PMID 19053496. Архивировано из оригинал (PDF) на 2011-07-17.
^ Иван Лаптев и Тони Линдеберг (2003). "Пространственно-временные точки интереса". Международная конференция по компьютерному зрению. IEEE. С. 432–439.
^ ^а ^б Герт Виллемс, Тинне Тайтелаарс и Люк ван Гул (2008). «Эффективный плотный и масштабно-инвариантный пространственно-временный детектор точек интереса». Европейская конференция по компьютерному зрению. Конспект лекций Springer по информатике. 5303. С. 650–663. Дои:10.1007/978-3-540-88688-4_48.
^ ^а ^б ^c Тони Линдеберг (2018). «Выбор пространственно-временного масштаба в видеоданных». Журнал математической визуализации и зрения. 60 (4). С. 525–562. Дои:10.1007 / s10851-017-0766-9.
^ И. Эвертс, Дж. Ван Гемерт и Т. Геверс (2014). «Оценка цветовых пространственно-временных точек интереса для распознавания действий человека». IEEE Transactions по обработке изображений. 23 (4). С. 1569–1589. Дои:10.1109 / TIP.2014.2302677.

Эталонные реализации

В этом разделе представлены внешние ссылки на эталонные реализации некоторых детекторов, описанных выше. Эти эталонные реализации предоставлены авторами статьи, в которой детектор впервые описывается. Они могут содержать детали, не представленные или явные в документах, описывающих функции.

Обнаружение DoG (в составе ПРОСЕЯТЬ система), Windows и x86 Linux исполняемые файлы
Харрис-Лаплас, статический Linux исполняемые файлы. Также содержит детекторы DoG и LoG и аффинную адаптацию для всех включенных детекторов.
БЫСТРЫЙ детектор, C, C ++, исходный код и исполняемые файлы MATLAB для различных операционных систем и архитектур.
Lip-vireo, [LoG, DoG, Харрис-лапласиан, гессиан и гессиан-лапласиан], [SIFT, инвариантный SIFT, PCA-SIFT, PSIFT, управляемые фильтры, SPIN] [Linux, Windows и SunOS] исполняемые файлы.
SUSAN Обработка изображений низкого уровня, Исходный код C.
Онлайн-реализация детектора угла Харриса - IPOL

Смотрите также

внешняя ссылка

Линдеберг, Тони (2001) [1994], «Угловое обнаружение», Энциклопедия математики, EMS Press
Бростоу, «Обнаружение углов - UCL Computer Science»

[willis-1] Эндрю Уиллис и Юньфэн Суй (2009). «Алгебраическая модель для быстрого обнаружения углов». 2009 12-я Международная конференция IEEE по компьютерному зрению. IEEE. С. 2296–2302. Дои:10.1109 / ICCV.2009.5459443. ISBN 978-1-4244-4420-5.

[2] Шапиро, Линда и Джордж К. Стокман (2001). Компьютерное зрение, п. 257. Prentice Books, Верхняя Седл-Ривер. ISBN 0-13-030796-3.

[moravec-3] Х. Моравец (1980). «Избегание препятствий и навигация в реальном мире с помощью робота-вездехода-видящего». Технический отчет CMU-RI-TR-3 Университет Карнеги-Меллона, Институт робототехники.

[4] Избегание препятствий и навигация в реальном мире с помощью видящего робота-вездехода, Ханс Моравец, март 1980 г., факультет компьютерных наук Стэнфордского университета (докторская диссертация)

[harris-5] К. Харрис и М. Стивенс (1988). «Комбинированный детектор угла и края» (PDF). Материалы 4-й конференции Alvey Vision. С. 147–151.

[sanchez-6] Хавьер Санчес, Нельсон Монсон и Агустин Сальгадо (2018). «Анализ и реализация детектора угла Харриса» (PDF). Обработка изображений в режиме онлайн. 8: 305–328. Дои:10.5201 / ipol.2018.229. Архивировано из оригинал на 2018-10-03.

[shitomasi-7] Дж. Ши и К. Томази (июнь 1994 г.). «Хорошие возможности для отслеживания». 9-я конференция IEEE по компьютерному зрению и распознаванию образов. Springer. С. 593–600. CiteSeerX 10.1.1.36.2669. Дои:10.1109 / CVPR.1994.323794.
{{cite techreport | автор = C. Томази и Т. Канаде | title = Обнаружение и отслеживание точечных объектов | год = 1991 | номер = CMU-CS-91-132 | учреждение = Школа компьютерных наук, Университет Карнеги-Меллона | citeseerx = 10.1.1.45.5770

[noble-8] А. Ноубл (1989). Описание поверхностей изображения (Кандидат наук.). Департамент инженерных наук Оксфордского университета. п. 45.

[9] Förstner, W; Гюльх (1987). «Быстрый оператор для обнаружения и точного определения местоположения отличных точек, углов и центров круговых объектов» (PDF). ISPRS.^{[постоянная мертвая ссылка ]}

[lindeberg94icip-10] а ^б ^c Т. Линдеберг (1994). «Обнаружение стыков с автоматическим выбором шкал обнаружения и шкал локализации». Proc. 1-я Международная конференция по обработке изображений. я. Остин, Техас. С. 924–928.

[lindeberg98-11] а ^б ^c ^d ^е ^ж ^грамм ^час ^я ^j ^k Тони Линдеберг (1998). «Обнаружение признаков с автоматическим выбором шкалы». Международный журнал компьютерного зрения. 30 (2). С. 77–116.

[lindeberg94book-12] а ^б ^c ^d ^е ^ж ^грамм ^час Т. Линдеберг (1994). Теория масштабного пространства в компьютерном зрении. Springer. ISBN 978-0-7923-9418-1.

[LinGar97-IVC-13] а ^б ^c ^d Т. Линдеберг и Дж. Гардинг "Сглаживание с учетом формы в оценке трехмерных сигналов глубины на основе аффинных искажений локальной двумерной структуры". Image and Vision Computing 15 (6): pp 415–434, 1997.

[lindeberg08enc-14] а ^б ^c ^d Т. Линдеберг (2008). «Масштаб-Пространство». В Бенджамине Ва (ред.). Энциклопедия компьютерных наук и инженерии Wiley. IV. Джон Уайли и сыновья. С. 2495–2504. Дои:10.1002 / 9780470050118.ecse609. ISBN 978-0-470-05011-8.

[schmid-15] а ^б ^c К. Миколайчик, К. и К. Шмид (2004). «Масштабные и аффинно-инвариантные детекторы точек интереса» (PDF). Международный журнал компьютерного зрения. 60 (1): 63–86. Дои:10.1023 / B: VISI.0000027790.02288.f2.

[kitchen82-16] Л. Китчен и А. Розенфельд (1982). «Определение углов на уровне серого». Письма с распознаванием образов. 1 (2). С. 95–102.

[richards88-17] Дж. Дж. Кендеринк и У. Ричардс (1988). «Двумерные операторы кривизны». Журнал Оптического общества Америки A. 5 (7). С. 1136–1141.

[brelin98feattrack-18] Л. Бретцнер и Т. Линдеберг (1998). «Отслеживание объектов с автоматическим выбором пространственных масштабов». Компьютерное зрение и понимание изображений. 71. С. 385–392.

[lindebergli97-19] Т. Линдеберг и М.-Х. Ли (1997). «Сегментация и классификация ребер с использованием аппроксимации минимальной длины описания и дополнительных точек соединения». Компьютерное зрение и понимание изображений. 67 (1). С. 88–98.

[sift-20] а ^б ^c Д. Лоу (2004). «Отличительные особенности изображения от ключевых точек, не зависящих от масштаба». Международный журнал компьютерного зрения. 60 (2): 91. CiteSeerX 10.1.1.73.2924. Дои:10.1023 / B: VISI.0000029664.99615.94.

[Lin15JMIV-21] а ^б ^c ^d ^е ^ж ^грамм ^час Т. Линдеберг, «Сопоставление изображений с использованием обобщенных точек интереса в масштабном пространстве», Journal of Mathematical Imaging and Vision, том 52, номер 1, страницы 3-36, 2015.

[Lin13JMIV-22] а ^б ^c ^d Т. Линдеберг "Свойства масштабного выбора детекторов точек интереса обобщенного масштабного пространства", Журнал математической визуализации и зрения, том 46, выпуск 2, страницы 177-210, 2013.

[23] Линдеберг, Т. (1998). «Обнаружение края и обнаружение гребня с автоматическим выбором шкалы». Международный журнал компьютерного зрения. 30 (2): 117–154. Дои:10.1023 / А: 1008097225773.

[wangbrady-24] Х. Ван и М. Брэди (1995). «Алгоритм определения угла в реальном времени для оценки движения». Вычисления изображений и зрения. 13 (9): 695–703. Дои:10.1016 / 0262-8856 (95) 98864-П.

[susan-25] С. М. Смит и Дж. М. Брэди (май 1997 г.). «SUSAN - новый подход к обработке изображений низкого уровня». Международный журнал компьютерного зрения. 23 (1): 45–78. Дои:10.1023 / А: 1007963824710.
С. М. Смит и Дж. М. Брэди (январь 1997 г.), «Метод цифровой обработки изображений для определения положения краев и / или углов в них для управления беспилотным транспортным средством». Патент Великобритании 2272285, владелец: министр обороны Великобритании.

[26] Патент Великобритании 2272285, список изобретателей (свободный формат), "Определение положения краев и углов на изображениях", опубликовано 11 мая 1994 г., выпущено 11 мая 1994 г., поручено Secr Defense

[27] "Детектор края SUSAN в деталях".

[hedley-28] М. Трайкович и М. Хедли (1998). «Быстрое обнаружение углов». Вычисления изображений и зрения. 16 (2): 75–87. Дои:10.1016 / S0262-8856 (97) 00056-5.

[fast-29] а ^б Э. Ростен и Т. Драммонд (май 2006 г.). «Машинное обучение для высокоскоростного обнаружения углов». Европейская конференция по компьютерному зрению.

[geneticprogramming-30] Леонардо Трухильо и Густаво Олаге (2008). «Автоматизированный дизайн операторов изображений, которые обнаруживают точки интереса» (PDF). Эволюционные вычисления. 16 (4): 483–507. Дои:10.1162 / evco.2008.16.4.483. PMID 19053496. Архивировано из оригинал (PDF) на 2011-07-17.

[laplin03-31] Иван Лаптев и Тони Линдеберг (2003). "Пространственно-временные точки интереса". Международная конференция по компьютерному зрению. IEEE. С. 432–439.

[willems08-32] а ^б Герт Виллемс, Тинне Тайтелаарс и Люк ван Гул (2008). «Эффективный плотный и масштабно-инвариантный пространственно-временный детектор точек интереса». Европейская конференция по компьютерному зрению. Конспект лекций Springer по информатике. 5303. С. 650–663. Дои:10.1007/978-3-540-88688-4_48.

[lindeberg18-33] а ^б ^c Тони Линдеберг (2018). «Выбор пространственно-временного масштаба в видеоданных». Журнал математической визуализации и зрения. 60 (4). С. 525–562. Дои:10.1007 / s10851-017-0766-9.

[everts14-34] И. Эвертс, Дж. Ван Гемерт и Т. Геверс (2014). «Оценка цветовых пространственно-временных точек интереса для распознавания действий человека». IEEE Transactions по обработке изображений. 23 (4). С. 1569–1589. Дои:10.1109 / TIP.2014.2302677.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]