Масштабирование пространства - Википедия - Scale space
Масштаб-пространство теория - это основа для многомасштабный сигнал представление разработан компьютерное зрение, обработка изображений и обработка сигналов сообщества с дополнительными мотивами от физика и биологическое видение. Это формальная теория для работы со структурами изображений в разных напольные весы, представляя изображение как однопараметрическое семейство сглаженных изображений, представление в масштабном пространстве, параметризованные размером сглаживание ядро используется для подавления мелкомасштабных структур.[1][2][3][4][5][6][7][8] Параметр в этом семействе именуется масштабный параметр, с интерпретацией, что структуры изображения пространственного размера меньше, чем примерно были в значительной степени сглажены на уровне масштабного пространства в масштабе .
Основным типом масштабного пространства является линейное (гауссово) масштабное пространство, который имеет широкую применимость, а также привлекательное свойство возможности извлекать из небольшого набора аксиомы масштабного пространства. Соответствующая структура масштабного пространства включает в себя теорию для операторов производных по Гауссу, которая может использоваться в качестве основы для выражения большого класса визуальных операций для компьютеризированных систем, обрабатывающих визуальную информацию. Эта структура также позволяет выполнять визуальные операции. масштабный инвариант, что необходимо для работы с изменениями размера, которые могут возникать в данных изображения, поскольку реальные объекты могут иметь разные размеры и, кроме того, расстояние между объектом и камерой может быть неизвестным и может варьироваться в зависимости от обстоятельств.[9][10]
Определение
Понятие масштабного пространства применяется к сигналам с произвольным числом переменных. Самый распространенный случай в литературе относится к двумерным изображениям, которые и представлены здесь. Для данного изображения , его линейный (гауссовский) представление в масштабном пространстве это семейство производных сигналов определяется свертка из с двумерным Гауссово ядро
такой, что
где точка с запятой в аргументе означает, что свертка выполняется только по переменным , а параметр масштаба после точки с запятой просто указывается, какой уровень шкалы определяется. Это определение работает для континуума шкал , но обычно фактически рассматривается только конечный дискретный набор уровней в представлении масштабного пространства.
Параметр масштаба это отклонение из Гауссов фильтр и как предел для фильтр становится импульсной функцией, такой что то есть представление масштабного пространства на уровне масштаба это изображение сам. В качестве увеличивается, это результат сглаживания с все более и более крупным фильтром, тем самым удаляя все больше и больше деталей, содержащихся в изображении. Поскольку стандартное отклонение фильтра равно , детали, которые значительно меньше этого значения, в значительной степени удаляются из изображения при параметре масштаба см. следующий рисунок и[11] для графических иллюстраций.
Представление в масштабном пространстве в масштабе , соответствующий исходному изображению
Представление в масштабном пространстве в масштабе
Представление в масштабном пространстве в масштабе
Представление в масштабном пространстве в масштабе
Представление в масштабном пространстве в масштабе
Представление в масштабном пространстве в масштабе
Почему фильтр Гаусса?
Столкнувшись с задачей создания многомасштабного представления, можно спросить: может ли какой-нибудь фильтр грамм низкочастотного типа и с параметром т который определяет его ширину, которая будет использоваться для создания масштабного пространства? Ответ - нет, поскольку крайне важно, чтобы сглаживающий фильтр не вводил новые ложные структуры в грубых масштабах, которые не соответствуют упрощениям соответствующих структур в более мелких масштабах. В литературе по масштабному пространству было выражено несколько различных способов сформулировать этот критерий в точных математических терминах.
Вывод из нескольких различных аксиоматических выводов, которые были представлены, заключается в том, что гауссово масштабное пространство составляет канонический способ создания пространства линейного масштаба, основанный на важном требовании, что новые структуры не должны создаваться при переходе от мелкого масштаба к любому более грубому масштабу.[1][3][4][6][9][12][13][14][15][16][17][18][19]Условия, именуемые аксиомы масштабного пространства, которые использовались для вывода уникальности гауссова ядра, включают линейность, инвариантность сдвига, полугруппа структура, без улучшения локальные экстремумы, масштабная инвариантность и вращательная инвариантность.В работах,[15][20][21] уникальность, заявленная в аргументах, основанных на масштабной инвариантности, подверглась критике, и были предложены альтернативные самоподобные ядра масштабного пространства. Однако гауссово ядро является уникальным выбором в соответствии с аксиоматикой масштабного пространства, основанной на причинности[3] или отсутствие усиления локальных экстремумов.[16][18]
Альтернативное определение
Эквивалентносемейство масштабных пространств можно определить как решение уравнение диффузии (например, с точки зрения уравнение теплопроводности ),
с начальным условием . Эта формулировка представления масштабного пространства L означает, что можно интерпретировать значения интенсивности изображения ж как «распределение температуры» в плоскости изображения и тот процесс, который генерирует представление масштабного пространства как функцию т соответствует диффузии тепла в плоскости изображения с течением времени т (при условии, что теплопроводность материала равна произвольно выбранной постоянной ½). Хотя эта связь может показаться поверхностной читателю, не знакомому с дифференциальные уравнения, действительно так, что основная формулировка масштабного пространства в терминах неусиления локальных экстремумов выражается в терминах условия знака на частные производные в объеме 2 + 1-D, порожденном масштабным пространством, таким образом, в рамках уравнения в частных производных. Более того, подробный анализ дискретного случая показывает, что уравнение диффузии обеспечивает объединяющую связь между непрерывными и дискретными масштабными пространствами, которые также обобщаются на нелинейные масштабные пространства, например, используя анизотропная диффузия. Следовательно, можно сказать, что основным способом создания масштабного пространства является уравнение диффузии, и что гауссово ядро возникает как Функция Грина этого конкретного уравнения в частных производных.
Мотивации
Мотивация к созданию пространственно-масштабного представления данного набора данных проистекает из основного наблюдения, что объекты реального мира состоят из разных структур в разных напольные весы. Это означает, что объекты реального мира, в отличие от идеализированных математических сущностей, таких как точки или же линии, могут проявляться по-разному в зависимости от масштаба наблюдения. Например, понятие «дерево» уместно в масштабе метров, тогда как такие понятия, как листья и молекулы, более уместны в более мелких масштабах. компьютерное зрение система, анализирующая неизвестную сцену, невозможно заранее узнать, что напольные весы подходят для описания интересных структур в данных изображения. Следовательно, единственный разумный подход - рассматривать описания в нескольких масштабах, чтобы иметь возможность уловить неизвестные вариации масштаба, которые могут произойти. рассматривает представления во всех масштабах.[9]
Еще одна мотивация концепции масштабного пространства проистекает из процесса выполнения физических измерений на реальных данных. Чтобы извлечь любую информацию из процесса измерения, необходимо применить операторы не бесконечно малого размера к данным. Во многих областях информатики и прикладной математики размер оператора измерения не принимается во внимание при теоретическом моделировании проблемы. С другой стороны, теория масштабного пространства явно включает необходимость не бесконечно малого размера операторов изображения как неотъемлемой части любого измерения, а также любой другой операции, которая зависит от реального измерения.[5]
Существует тесная связь между теорией масштабного пространства и биологическим видением. Многие масштабно-пространственные операции демонстрируют высокую степень сходства с профилями рецептивного поля, записанными на сетчатке млекопитающих и на первых этапах зрительной коры. В этом отношении масштабно-пространственная структура может рассматриваться как теоретически хорошо обоснованная парадигма для ранних стадий. зрение, которое вдобавок было тщательно проверено алгоритмами и экспериментами.[4][9]
Гауссовские производные
В любом масштабе в масштабном пространстве мы можем применить операторы локальной производной к представлению в масштабном пространстве:
Благодаря свойству коммутативности между оператором производной и оператором сглаживания Гаусса, такие производные в масштабном пространстве эквивалентно вычисляется путем свертки исходного изображения с помощью операторов производной Гаусса. По этой причине их часто также называют Гауссовские производные:
Уникальность операторов гауссовой производной как локальных операций, полученных из представления масштабного пространства, может быть получена с помощью аналогичных аксиоматических выводов, которые используются для вывода уникальности гауссовского ядра для сглаживания масштабного пространства.[4][22]
Визуальный интерфейс
Эти операторы производной Гаусса, в свою очередь, могут быть объединены линейными или нелинейными операторами в более широкий спектр различных типов детекторов признаков, которые во многих случаях могут быть хорошо смоделированы с помощью дифференциальная геометрия. В частности, инвариантность (или более уместно ковариация) к локальным геометрическим преобразованиям, таким как вращения или локальные аффинные преобразования, могут быть получены путем рассмотрения дифференциальных инвариантов в соответствующем классе преобразований или, альтернативно, путем нормализации операторов производной Гаусса к локально определенной системе координат, определенной, например, из предпочтительной ориентации в области изображения или путем применения предпочтительного локального аффинного преобразования к локальному фрагменту изображения (см. статью о адаптация аффинной формы для получения дополнительной информации).
Когда гауссовские производные операторы и дифференциальные инварианты используются таким образом в качестве детекторов основных признаков в нескольких масштабах, незафиксированные первые этапы визуальной обработки часто упоминаются как визуальный интерфейс. Эта общая структура была применена к большому количеству задач компьютерного зрения, включая обнаружение функции, классификация функций, сегментация изображения, сопоставление изображений, оценка движения, вычисление форма реплики и распознавание объекта. Набор операторов производной Гаусса до определенного порядка часто называют N-струя и представляет собой базовый тип объекта в рамках масштабного пространства.
Примеры детекторов
Следуя идее выражения визуальных операций в терминах дифференциальных инвариантов, вычисляемых в нескольких масштабах с использованием операторов производной Гаусса, мы можем выразить детектор края из множества точек, удовлетворяющих требованию, чтобы величина градиента
должен принимать локальный максимум в направлении градиента
Разработав дифференциальную геометрию, можно показать [4] что это дифференциальный детектор края эквивалентно выражается через переходы через нуль дифференциального инварианта второго порядка
удовлетворяющие следующему знаковому условию на дифференциальный инвариант третьего порядка:
Точно так же многомасштабный детекторы капель в любом заданном фиксированном масштабе[23][9] могут быть получены из локальных максимумов и локальных минимумов либо Лапласиан оператор (также называемый Лапласиан Гаусса )
или же определитель матрицы Гессе
Аналогичным образом детекторы углов и детекторы гребней и впадин могут быть выражены как локальные максимумы, минимумы или переходы через нуль многомасштабных дифференциальных инвариантов, определенных из производных Гаусса. Однако алгебраические выражения для операторов обнаружения углов и гребней несколько сложнее, и читателю отсылают к статьям по обнаружение угла и обнаружение гребня для получения дополнительной информации.
Операции масштабного пространства также часто использовались для выражения методов от грубого к точному, в частности, для таких задач, как сопоставление изображений и для многомасштабная сегментация изображения.
Выбор шкалы
Представленная теория описывает хорошо обоснованную основу для представляющий структуры изображения в нескольких масштабах. Однако во многих случаях также необходимо выбрать масштаб, соответствующий местным условиям, для дальнейшего анализа. Эта потребность в выбор шкалы происходит по двум основным причинам; (i) объекты реального мира могут иметь разный размер, и этот размер может быть неизвестен системе зрения, и (ii) расстояние между объектом и камерой может варьироваться, и эта информация о расстоянии также может быть неизвестна априори. Очень полезным свойством представления масштабного пространства является то, что представления изображений можно сделать инвариантными к масштабам, выполнив автоматический выбор локального масштаба.[9][10][23][24][25][26][27][28] на основе местных максимумы (или же минимумы ) по шкалам нормированных по масштабу производные
куда - параметр, связанный с размерностью объекта изображения. Это алгебраическое выражение для масштабно нормализованные операторы производной Гаусса происходит от введения -нормализованные производные в соответствии с
- и
Теоретически можно показать, что модуль выбора шкалы, работающий по этому принципу, будет удовлетворять следующим условиям: свойство ковариации масштаба: если для определенного типа функции изображения предполагается локальный максимум на определенном изображении в определенном масштабе , то при изменении масштаба изображения на коэффициент масштабирования локальный максимум по масштабам в масштабированном изображении будет преобразован в масштабный уровень .[23]
Обнаружение инвариантной функции масштабирования
Следуя этому подходу гамма-нормированных производных, можно показать, что различные типы масштабная адаптивность и масштабная инвариантность детекторы функций[9][10][23][24][25][29][30][27] можно выразить для таких задач, как обнаружение капли, обнаружение угла, обнаружение гребня, обнаружение края и пространственно-временные точки интереса (см. конкретные статьи по этим темам для подробного описания того, как сформулированы эти масштабно-инвариантные детекторы признаков) .Кроме того, масштабные уровни, полученные в результате автоматического выбора масштаба, могут использоваться для определения областей интереса для последующий адаптация аффинной формы[31] для получения аффинных инвариантных точек интереса[32][33] или для определения масштабных уровней для вычисления связанных дескрипторы изображений, например, адаптированные к местным условиям N-форсунки.
Недавние исследования показали, что и более сложные операции, такие как масштабно-инвариантные распознавание объекта может быть выполнено таким образом, путем вычисления локальных дескрипторов изображения (N-струй или локальных гистограмм направлений градиента) в точках интереса, адаптированных к масштабу, полученных из экстремумов масштабного пространства нормализованных Лапласиан оператор (см. также масштабно-инвариантное преобразование признаков[34]) или определитель гессиана (см. также СЕРФ );[35] см. также статью в Scholarpedia о масштабно-инвариантное преобразование признаков[36] для более общего взгляда на подходы к распознаванию объектов, основанные на ответах рецептивного поля[19][37][38][39] в терминах гауссовских производных операторов или их приближений.
Связанные многомасштабные представления
Изображение пирамида представляет собой дискретное представление, в котором пространство шкалы дискретизируется как в пространстве, так и в масштабе. Для масштабной инвариантности масштабные коэффициенты должны выбираться экспоненциально, например, как целые степени 2 или √2. При правильном построении соотношение частот дискретизации в пространстве и масштабе остается постоянным, так что импульсный отклик идентичен на всех уровнях пирамиды.[40][41][42] Существуют быстрые, O (N) алгоритмы для вычисления масштабно-инвариантной пирамиды изображений, в которой изображение или сигнал многократно сглаживаются, а затем субдискретизируются. Значения шкалы между образцами пирамиды можно легко оценить с помощью интерполяции внутри шкалы и между шкалами, а также с учетом оценок масштаба и положения с точностью до субразрешения.[42]
В представлении масштабного пространства наличие непрерывного параметра масштаба позволяет отслеживать пересечения нуля над масштабами, ведущие к так называемому глубокая структура.Для функций, определенных как нулевые переходы из дифференциальные инварианты, то теорема о неявной функции прямо определяет траектории в масштабе,[4][43] и в тех масштабах, где бифуркации возникают, локальное поведение может быть смоделировано теория сингулярности.[4][43][44][45]
Расширения теории линейного масштабного пространства касаются формулировки понятий нелинейного масштабного пространства, более ориентированных на конкретные цели.[46][47] Эти нелинейные масштабные пространства часто начинают с эквивалентной диффузной формулировки концепции масштабного пространства, которая впоследствии расширяется нелинейным образом. Таким образом было сформулировано большое количество уравнений эволюции, мотивированных различными конкретными требованиями (дополнительную информацию см. В упомянутых выше справочниках). Следует отметить, однако, что не все эти нелинейные масштабные пространства удовлетворяют тем же «хорошим» теоретическим требованиям, что и концепция линейного гауссовского масштабного пространства. Следовательно, иногда могут возникать неожиданные артефакты, и нужно быть очень осторожным, чтобы не использовать термин «масштабное пространство» только для любого типа однопараметрического семейства изображений.
А расширение первого порядка из изотропное гауссово масштабное пространство обеспечивается аффинное (гауссово) масштабное пространство.[4] Одна из причин для этого расширения проистекает из общей потребности в вычислении дескрипторов изображений для объектов реального мира, которые просматриваются под перспективная модель камеры. Чтобы обрабатывать такие нелинейные деформации локально, частичная инвариантность (или правильнее ковариация ) местным аффинные деформации может быть достигнута путем рассмотрения аффинных гауссовых ядер, форма которых определяется локальной структурой изображения,[31] см. статью о адаптация аффинной формы по теории и алгоритмам. В самом деле, это аффинное масштабное пространство также может быть выражено из неизотропного расширения линейного (изотропного) уравнения диффузии, все еще находясь в классе линейных уравнения в частных производных.
Существует более общее расширение модели гауссовского масштабного пространства на аффинные и пространственно-временные масштабные пространства.[18][19][48] В дополнение к изменчивости по сравнению с масштабом, для решения которой была разработана оригинальная теория масштабного пространства, это обобщенная теория масштабного пространства также включает другие типы изменчивости, вызванные геометрическими преобразованиями в процессе формирования изображения, в том числе вариации направления взгляда, аппроксимируемые локальными аффинными преобразованиями, и относительные движения между объектами в мире и наблюдателем, аппроксимируемые локальными преобразованиями Галилея. Эта обобщенная теория масштабного пространства приводит к предсказаниям о профилях рецептивного поля в хорошем качественном согласии с профилями рецептивного поля, измеренными с помощью записей клеток в биологическом зрении.[49][50][48]
Между теорией масштабного пространства и теория вейвлетов, хотя эти два понятия многомасштабного представления были разработаны из несколько разных предпосылок. многомасштабные подходы, такие как пирамиды и множество других ядер, которые не используют и не требуют тех же требований, что и истинные описания в масштабном пространстве.
Связь с биологическим зрением и слухом
Существуют интересные отношения между представлением масштабного пространства и биологическим зрением и слухом. Нейрофизиологические исследования биологического зрения показали, что существуют рецептивное поле профили у млекопитающих сетчатка и зрительная кора, которые могут быть хорошо смоделированы линейными операторами производной Гаусса, в некоторых случаях также дополненными неизотропной моделью аффинного масштабного пространства, пространственно-временной моделью масштабного пространства и / или нелинейными комбинациями таких линейных операторов.[18][49][50][48][51][52]Что касается биологического слуха, есть рецептивное поле профили в нижний бугорок и первичная слуховая кора которые могут быть хорошо смоделированы спектрально-временными восприимчивыми полями, которые могут быть хорошо смоделированы гауссовыми производными по логарифмическим частотам и оконным преобразованием Фурье во времени, причем оконные функции являются временными ядрами масштабного пространства.[53][54]
Нормативные теории для зрительных и слуховых рецептивных полей, основанные на масштабно-пространственном каркасе, описаны в статье о аксиоматическая теория рецептивных полей.
Проблемы реализации
При реализации сглаживания масштабного пространства на практике существует ряд различных подходов, которые можно использовать в терминах непрерывного или дискретного гауссовского сглаживания, реализации в области Фурье, в терминах пирамид на основе биномиальных фильтров, которые аппроксимируют гауссово, или с использованием рекурсивных фильтров. . Подробнее об этом читайте в отдельной статье на реализация масштабного пространства.
Смотрите также
Рекомендации
- ^ а б Иджима, Т. "Основная теория нормализации рисунка (в случае типичного одномерного рисунка)". Бык. Электротех. Лаборатория. 26, 368–388, 1962. (на яп.)
- ^ Виткин, А.П. «Масштабная фильтрация», Тр. 8-й Int. Совместная конф. Изобразительное искусство. Intell., Карлсруэ, Германия, 1019–1022, 1983.
- ^ а б c Кендеринк, Ян "Структура изображений ", Биологическая кибернетика, 50: 363–370, 1984.
- ^ а б c d е ж грамм час Линдеберг, Т., Теория масштабного пространства в компьютерном зрении, Kluwer Academic Publishers, 1994., ISBN 0-7923-9418-6
- ^ а б Т. Линдеберг (1994). «Теория масштабного пространства: основной инструмент для анализа структур в различных масштабах». Журнал прикладной статистики (Дополнение о достижениях в прикладной статистике: статистика и изображения: 2). 21 (2). С. 224–270. Дои:10.1080/757582976.
- ^ а б Флорак, Люк, Структура изображения, Kluwer Academic Publishers, 1997.
- ^ Спорринг, Джон и др. (Ред.), Гауссовская теория масштабного пространства, Kluwer Academic Publishers, 1997.
- ^ тер Хаар Ромени, Барт М. (2008). Front-End Vision и многомасштабный анализ изображений: многомасштабная теория компьютерного зрения и приложения, написанные в системе Mathematica. Springer Science & Business Media. ISBN 978-1-4020-8840-7.
- ^ а б c d е ж грамм Линдеберг, Тони (2008). «Масштаб-пространство». В Бенджамине Ва (ред.). Энциклопедия компьютерных наук и инженерии. IV. Джон Уайли и сыновья. С. 2495–2504. Дои:10.1002 / 9780470050118.ecse609. ISBN 978-0470050118.
- ^ а б c Т. Линдеберг (2014) «Выбор шкалы», Компьютерное зрение: Справочное руководство, (К. Икеучи, редактор), Springer, страницы 701–713.
- ^ Графическая иллюстрация основных идей представления масштабного пространства на http://www.csc.kth.se/~tony/cern-review/cern-html/node2.html
- ^ Ж. Бабо, А. П. Виткин, М. Боден, Р. О. Дуда, Единственность гауссовского ядра для фильтрации в масштабном пространстве. IEEE Trans. Pattern Anal. Machine Intell. 8 (1), 26–33, 1986.
- ^ А. Юилле, Т.А. Поджио: Теоремы о масштабировании для нулевых переходов. IEEE Trans. Анализ шаблонов и машинный интеллект, Vol. ПАМИ-8, № 1. С. 15–25, январь 1986 г.
- ^ Линдеберг, Т., "Масштабное пространство для дискретных сигналов", IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. ПАМИ-12, № 3, март 1990 г., стр. 234–254.
- ^ а б Пауэлс, Э., Ван Гул, Л., Фидделаерс, П. и Мунс, Т .: Расширенный класс масштабно-инвариантных и рекурсивных масштабных пространственных фильтров, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, No. 7, pp. 691–701, 1995.
- ^ а б Линдеберг, Т .: Об аксиоматических основах линейного масштабного пространства: сочетание структуры полугруппы с причинностью и масштабной инвариантностью. В: J. Sporring et al. (ред.) Гауссова теория масштабного пространства: Proc. Школа PhD по теории масштабного пространства (Копенгаген, Дания, май 1996 г.), страницы 75–98, Kluwer Academic Publishers, 1997.
- ^ Weickert, J. Пространство с линейным масштабом было впервые предложено в Японии. Журнал математической визуализации и зрения, 10 (3): 237–252, 1999.
- ^ а б c d Линдеберг, Т. Обобщенная аксиоматика гауссовского масштабного пространства, включающая линейное масштабное пространство, аффинное масштабное пространство и пространственно-временное масштабное пространство, Journal of Mathematical Imaging and Vision, 40 (1): 36–81, 2011.
- ^ а б c Линдеберг Т. Обобщенная аксиоматическая теория масштабного пространства., Достижения в области визуализации и электронной физики, Elsevier, том 178, страницы 1–96, 2013.
- ^ М. Фельсберг и Г. Соммер "Моногенное масштабное пространство: объединяющий подход к фазовой обработке изображений в масштабном пространстве ", Journal of Mathematical Imaging and Vision, 21 (1): 5–28, 2004.
- ^ Р. Дуитс, Л. Флорак, Дж. Де Грааф и Б. тер Хаар Ромени "Об аксиомах теории масштабного пространства ", Journal of Mathematical Imaging and Vision, 20 (3): 267–298, 2004.
- ^ Кендеринк, Ян и ван Дорн, Анс: «Общие операторы соседства», IEEE Transactions on Pattern Analysis and Machine Intelligence, vol 14, pp 597–605, 1992
- ^ а б c d Линдеберг, Тони «Обнаружение признаков с автоматическим выбором шкалы», Международный журнал компьютерного зрения, 30, 2, стр. 77–116, 1998.
- ^ а б Линдеберг, Тони «Обнаружение краев и обнаружение выступов с автоматическим выбором шкалы», Международный журнал компьютерного зрения, 30, 2, стр 117–154, 1998.
- ^ а б Линдеберг, Тони, «Принципы автоматического выбора шкалы», В: Б. Яне (и др., Ред.), Справочник по компьютерному зрению и приложениям, том 2, стр. 239-274, Academic Press, Бостон, США, 1999.
- ^ Т. Линдеберг «Выбор временной шкалы в пространстве шкалы времени и причинности», Журнал математической визуализации и зрения, 58 (1): 57–101, 2017.
- ^ а б Т. Линдеберг «Выбор пространственно-временного масштаба в видеоданных», Journal of Mathematical Imaging and Vision, 60 (4): 525–562, 2018.
- ^ Т. Линдеберг «Выбор плотной шкалы в пространстве, времени и пространстве-времени», SIAM Journal on Imaging Sciences, 11 (1): 407–441, 2018.
- ^ Т. Линдеберг. «Свойства масштабного выбора детекторов точек интереса с обобщенным масштабным пространством», Journal of Mathematical Imaging and Vision, 46 (2): 177–210, 2013.
- ^ Т. Линдеберг. «Сопоставление изображений с использованием обобщенных точек интереса в масштабном пространстве», Journal of Mathematical Imaging and Vision, 52 (1): 3–36, 2015.
- ^ а б Линдеберг, Т. и Гардинг, Дж .: Сглаживание, адаптированное к форме, при оценке трехмерных сигналов глубины на основе аффинных искажений локальной двумерной структуры, Image and Vision Computing, 15, ~ 415–434, 1997.
- ^ Баумберг, А .: Надежное сопоставление функций в широко разделенных представлениях, Proc. Распознавание образов компьютерного зрения, I: 1774–1781, 2000.
- ^ Миколайчик, К. и Шмид, Ч .: Масштабные и аффинно-инвариантные детекторы точки интереса, Int. Журнал компьютерного зрения, 60: 1, 63 - 86, 2004.
- ^ Лоу, Д. Г., «Отличительные особенности изображения от масштабно-инвариантных ключевых точек», Международный журнал компьютерного зрения, 60, 2, стр. 91–110, 2004.
- ^ Х. Бэй, А. Эсс, Т. Туйтелаарс и Л. ван Гул, «Ускоренные надежные функции (SURF)», Компьютерное зрение и понимание изображений, 110: 3, 2008 г., страницы 346–359
- ^ Линдеберг, Т. «Масштабно-инвариантное преобразование признаков», Scholarpedia, 7 (5): 10491, 2012.
- ^ Б. Шиле и Дж. Л. Кроули "Распознавание без соответствия с использованием многомерных гистограмм рецептивного поля", Международный журнал компьютерного зрения, 36: 1, 31–50, 2000
- ^ О. Линде и Т. Линдеберг "Распознавание объектов с использованием составных гистограмм рецептивного поля более высокой размерности", Proc. Международная конференция по распознаванию образов (ICPR'04), Кембридж, Великобритания II: 1–6, 2004.
- ^ О. Линде и Т. Линдеберг «Составленные гистограммы сложных сигналов: исследование информационного содержания в дескрипторах изображения на основе рецептивного поля для распознавания объектов», Computer Vision and Image Understanding, 116: 4, 538–560, 2012.
- ^ Берт, Питер и Адельсон, Тед "Пирамида Лапласа как компактный код изображения ", IEEE Trans. Communications, 9: 4, 532–540, 1983.
- ^ Кроули, Дж. Л. и Сандерсон, А. С. «Представление с множественным разрешением и вероятностное сопоставление двухмерной серой шкалы», IEEE Transactions on Pattern Analysis and Machine Intelligence, 9 (1), pp 113–121, 1987.
- ^ а б Т. Линдеберг и Л. Бретцнер (2003) «Выбор масштаба в реальном времени в гибридных многомасштабных представлениях», Proc. Scale-Space'03, остров Скай, Шотландия, Springer Lecture Notes по информатике, том 2695, страницы 148–163.
- ^ а б Т. Линдеберг (1992) ''Масштабное поведение локальных экстремумов и капель, J. of Mathematical Imaging and Vision, 1 (1), pages 65–99.
- ^ Ян Кендеринк и Андреа ван Дорн, А. Дж. (1986), ‘Динамическая форма ’, Биологическая кибернетика 53, 383–396.
- ^ Дэймон, Дж. (1995), ‘Локальная теория Морса для решений уравнения теплопроводности и размытие по Гауссу ', Журнал дифференциальных уравнений 115 (2), 386–401.
- ^ тер Хаар Ромени, Барт М. (редактор), Диффузия на основе геометрии в компьютерном зрении, Kluwer Academic Publishers, 1994.
- ^ Вайкерт, Дж. Анизотропная диффузия в обработке изображений, Teuber Verlag, Штутгарт, 1998.
- ^ а б c Т. Линдеберг (2016) «Временно-причинные и временно-рекурсивные пространственно-временные рецептивные поля», Journal of Mathematical Imaging and Vision, 55 (1): 50–88.
- ^ а б Линдеберг, Т. Вычислительная теория зрительных рецептивных полей, Биологическая кибернетика, 107 (6): 589–635, 2013.
- ^ а б Линдеберг, Т. Инвариантность зрительных операций на уровне рецептивных полей, PLoS ONE 8 (7): e66990, 2013
- ^ Янг, Р. А. "Модель производной Гаусса для пространственного зрения: механизмы сетчатки ", Пространственное видение, 2: 273–293, 1987.
- ^ ДеАнгелис, Г. К., Охава, И., и Фриман, Р. Д., "Динамика рецептивного поля в центральных зрительных путях", Trends Neurosci. 18: 451–458, 1995.
- ^ Т. Линдеберг и А. Фриберг «Идеализированные вычислительные модели слуховых рецептивных полей», PLOS ONE, 10 (3): e0119032, страницы 1–58, 2015
- ^ Т. Линдеберг и А. Фриберг (2015) «Теория масштабного пространства для слуховых сигналов», Proc. SSVM 2015: масштабно-пространственные и вариационные методы в компьютерном зрении, Springer LNCS 9087: 3–15.
дальнейшее чтение
Этот дальнейшее чтение раздел может содержать несоответствующие или чрезмерные предложения, которые могут не соответствовать рекомендациям Википедии. руководящие указания. Убедитесь, что только разумное количество из сбалансированный, актуальный, надежный, и даны важные предложения для дальнейшего чтения; удаление менее актуальных или повторяющихся публикаций с помощью та же точка зрения где это уместно. Рассмотрите возможность использования соответствующих текстов в качестве встроенные источники или создание отдельная библиографическая статья. (Сентябрь 2020) (Узнайте, как и когда удалить этот шаблон сообщения) |
- Линдеберг, Тони (2008). «Масштаб-пространство». В Бенджамине Ва (ред.). Энциклопедия компьютерных наук и инженерии. IV. Джон Уайли и сыновья. С. 2495–2504. Дои:10.1002 / 9780470050118.ecse609. ISBN 978-0470050118.
- Линдеберг, Тони, "Масштабное пространство: структура для обработки структур изображений в различных масштабах", В: Proc. Компьютерная школа ЦЕРН, Эгмонд-ан-Зее, Нидерланды, 8-21 сентября 1996 г. (онлайн-учебник)
- Линдеберг, Тони: Теория масштабного пространства: основной инструмент для анализа структур в различных масштабах, в J. of Applied Statistics, 21 (2), pp. 224–270, 1994. (более длинный учебник в формате PDF по масштабному пространству)
- Линдеберг, Тони, «Принципы автоматического выбора шкалы», В: Б. Яне (и др., Ред.), Справочник по компьютерному зрению и приложениям, том 2, стр. 239-274, Academic Press, Бостон, США, 1999. (учебник по подходам к автоматическому выбору шкалы)
- Линдеберг, Тони: "Теория масштабного пространства" В: Энциклопедия математики, (Мишель Хазевинкель, ред) Клувер, 1997
- Резервное копирование веб-архива: Лекция о масштабном пространстве в Массачусетском университете (pdf)
- Мультимасштабный анализ для оптимизации сегментации сосудов на изображениях глазного дна сетчатки Кандидатская диссертация
внешняя ссылка
- Интерактивное руководство по Java Powers of Ten на веб-сайте Molecular Expressions
- Он-лайн ресурс с пространственно-временными рецептивными полями зрительных нейронов, предоставленный Идзуми Охзава из Университета Осаки
- Обнаружение пиков в одномерных данных с использованием подхода масштабного пространства Код MATLAB под лицензией BSD