Сегментация масштабного пространства - Scale-space segmentation
Сегментация масштабного пространства или же многомасштабная сегментация представляет собой общую структуру для сегментации сигналов и изображений, основанную на вычислении дескрипторов изображения при различных масштабах сглаживания.
Одномерная иерархическая сегментация сигналов
Основополагающая работа Виткина в масштабное пространство[1][2] Включено понятие, что одномерный сигнал может быть однозначно сегментирован на области с одним параметром масштаба, контролирующим масштаб сегментации.
Ключевое наблюдение состоит в том, что пересечения нуля вторых производных (минимумов и максимумов первой производной или наклона) многомасштабных сглаженных версий сигнала образуют дерево вложенности, которое определяет иерархические отношения между сегментами на разных масштабах. В частности, экстремумы наклона на крупных масштабах можно проследить до соответствующих особенностей на мелких масштабах. Когда максимум наклона и минимум наклона аннигилируют друг друга в большем масштабе, три сегмента, которые они разделяют, сливаются в один сегмент, тем самым определяя иерархию сегментов.
Сегментация изображения и первичный эскиз
В этой области было проведено множество исследовательских работ, из которых некоторые сейчас достигли состояния, когда они могут применяться либо с интерактивным вмешательством вручную (обычно с применением к медицинская визуализация ) или полностью автоматически. Ниже приводится краткий обзор некоторых основных исследовательских идей, на которых основаны современные подходы.
Однако структура вложенности, описанная Уиткиным, специфична для одномерных сигналов и нетривиально переносится на изображения более высокой размерности. Тем не менее эта общая идея вдохновила нескольких других авторов на исследование схем от грубого к точному для сегментации изображений. Koenderink[3] предложили изучить, как изоинтенсивные контуры эволюционируют по масштабам, и этот подход был более подробно исследован Лифшицем и Пизером.[4] К сожалению, однако, интенсивность элементов изображения меняется в зависимости от масштаба, что означает, что трудно отследить крупномасштабные элементы изображения до более мелких масштабов, используя информацию об изоинтенсивности.
Lindeberg[5] изучил проблему связывания локальных экстремумов и седловых точек на масштабах и предложил представление изображений, называемое первичный эскиз в масштабном пространстве который делает явными отношения между структурами в различных масштабах, а также делает явным, какие функции изображения являются стабильными в больших диапазонах масштабов, включая локально соответствующие масштабы для них. Бергхольм [6] предложено обнаруживать края в грубых масштабах в пространстве шкалы, а затем прослеживать их до более мелких масштабов с ручным выбором шкалы грубого обнаружения и шкалы точной локализации.
Гауч и Пайзер[7] изучили дополнительную проблему хребтов и долин в различных масштабах и разработали инструмент для интерактивной сегментации изображений на основе многомасштабных водоразделов. Использование многомасштабного водораздела с приложением к карте градиентов также исследовали Олсен и Нильсен.[8] и был перенесен в клиническое использование Dam et al.[9] Vincken et al.[10] предложил гиперстек для определения вероятностных отношений между структурами изображений в различных масштабах. Ахуджа и его сотрудники способствовали использованию стабильных структур изображения в масштабе.[11][12] в полностью автоматизированную систему. Полностью автоматический алгоритм сегментации мозга, основанный на тесно связанных идеях многомасштабных водоразделов, был представлен Ундеманом и Линдебергом. [13] и был тщательно протестирован в базах данных мозга.
Эти идеи многомасштабной сегментации изображения путем связывания структур изображения по масштабам также были подхвачены Флорак и Куиджпер.[14] Биджауи и Руэ [15] Свяжите структуры, обнаруженные в масштабном пространстве выше минимального порога шума, в дерево объектов, которое охватывает несколько масштабов и соответствует некоторому типу функции в исходном сигнале. Извлеченные объекты точно реконструируются с использованием итеративного метода матрицы сопряженных градиентов.
Сегментация векторных функций времени
Сегментация масштабного пространства была расширена в другом направлении Лионом.[16] к векторным функциям времени, где производная вектора не имеет максимумов и минимумов, а вторая производная не имеет пересечений нуля, путем помещения границ сегментов вместо максимумов евклидовой величины производной вектора сглаженных векторных сигналов. Этот метод был применен к сегментации речи и текста.[17]
Рекомендации
- ^ Виткин, А. П. "Масштабная фильтрация ", Материалы 8-й Международной совместной конференции Art. Intell., Карлсруэ, Германия, 1019-1022, 1983.
- ^ А. Виткин, "Масштабная фильтрация: новый подход к многомасштабному описанию", Proc. IEEE Int. Конф. Акуст., Речь, Обработка сигналов (ICASSP ), т. 9, Сан-Диего, Калифорния, март 1984 г., стр. 150--153.
- ^ Кендеринк, Ян "Структура изображений ", Биологическая кибернетика, 50: 363-370, 1984
- ^ Лифшиц, Л. и Пайзер, С .: Иерархический подход с несколькими разрешениями к сегментации изображений на основе экстремумов интенсивности, IEEE Transactions on Pattern Analysis and Machine Intelligence, 12: 6, 529-540, 1990.
- ^ Линдеберг, Т .: Обнаружение заметных каплевидных структур изображений и их масштабов с помощью первичного эскиза в масштабном пространстве: метод фокусировки внимания, Международный журнал компьютерного зрения, 11 (3), 283-318, 1993.
- ^ Бергхолм, Ф: Фокусировка на грани, IEEE Transactions on Pattern Analysis and Machine Intelligence, 9: 6, страницы 726-741, 1987.
- ^ Гауч, Дж. И Пайзер, С .: Анализ гребней и впадин в полутоновых изображениях с множественным разрешением, IEEE Transactions on Pattern Analysis and Machine Intelligence, 15: 6 (июнь 1993 г.), страницы: 635 - 646, 1993.
- ^ Олсен, О. и Нильсен, М .: Сегментация водоразделов по многомасштабным градиентам, Proc. of ICIAP 97, Флоренция, Италия, Конспект лекций по информатике, стр. 6–13. Springer Verlag, сентябрь 1997 г.
- ^ Dam, E., Johansen, P., Olsen, O. Thomsen, A. Darvann, T., Dobrzenieck, A., Hermann, N., Kitai, N., Kreiborg, S., Larsen, P., Nielsen , М .: «Интерактивная многомасштабная сегментация в клиническом использовании» на Европейском конгрессе радиологов 2000 г.
- ^ Винкен, К., Костер, А. и Фиргевер, М .: Вероятностная многомасштабная сегментация изображения, IEEE Transactions on Pattern Analysis and Machine Intelligence, 19: 2, pp. 109-120, 1997.]
- ^ М. Табб и Н. Ахуджа, Неконтролируемая многомасштабная сегментация изображений с помощью интегрированного обнаружения краев и областей, IEEE Transactions on Image Processing, Vol. 6, No. 5, 642-655, 1997. В архиве 2011-07-20 на Wayback Machine
- ^ Э. Акбас и Н. Ахуджа, «От разрывов рампы к дереву сегментации», Азиатская конференция по компьютерному зрению, 2009 г., Сиань, Китай.
- ^ К. Ундеман и Т. Линдеберг (2003) "Полностью автоматическая сегментация МРТ-изображений мозга с использованием вероятностной анизотропной диффузии и многомасштабных водоразделов", Proc. Scale-Space'03, Остров Скай, Шотландия, Springer Lecture Notes in Computer Science, volume 2695, pages 641-656.
- ^ Флорак, Л. и Куиджпер, А .: Топологическая структура пространственно-масштабных изображений, Journal of Mathematical Imaging and Vision, 12: 1, 65-79, 2000.
- ^ Биджауи, А., Руэ, Ф .: 1995, многомасштабная модель зрения, Обработка сигналов 46, 345
- ^ Ричард Ф. Лайон. «Распознавание речи в масштабном пространстве», Тр. 1987 ICASSP. Сан-Диего, март, стр. 29.3.14, 1987.
- ^ Слейни, М. Понселеон, Д., "Иерархическая сегментация с использованием скрытой семантической индексации в пространстве масштабов", Proc. Intl. Конф. по акустике, речи и обработке сигналов (ICASSP '01) 2001 г.