Геометрическое хеширование - Википедия - Geometric hashing
В Информатика, геометрическое хеширование - это метод эффективного поиска двумерных объектов, представленных дискретными точками, которые подверглись аффинное преобразование, хотя существуют расширения для других представлений и преобразований объектов. В автономном режиме объекты кодируются путем обработки каждой пары точек как геометрического объекта. основа. Остальные точки можно представить в виде инвариантный мода относительно этой основы с использованием двух параметров. Для каждой точки свой квантованный преобразованные координаты сохраняются в хеш-таблица как ключ, а индексы базисных точек как значение. Затем выбирается новая пара базисных точек, и процесс повторяется. На этапе онлайн (распознавания) случайно выбранные пары точек данных рассматриваются как базы-кандидаты. Для каждой основы-кандидата оставшиеся точки данных кодируются в соответствии с основанием, и возможные соответствия объекта находятся в ранее созданной таблице. Основа-кандидат принимается, если достаточно большое количество точек данных указывает на непротиворечивую основу объекта.
Первоначально геометрическое хеширование было предложено в компьютерное зрение за распознавание объекта в 2D и 3D,[1] но позже был применен к различным задачам, таким как структурное выравнивание из белки.[2][3]
Геометрическое хеширование в компьютерном зрении
Геометрическое хеширование - это метод, используемый для распознавания объектов. Допустим, мы хотим проверить, можно ли увидеть изображение модели во входном изображении. Этого можно добиться с помощью геометрического хеширования. Этот метод может использоваться для распознавания одного из нескольких объектов в базе, в этом случае хеш-таблица должна хранить не только информацию о позе, но и индекс объектной модели в базе.
Пример
Для простоты в этом примере не будет использоваться слишком много точечные особенности и предположим, что их дескрипторы заданы только их координатами (на практике локальные дескрипторы Такие как ПРОСЕЯТЬ может использоваться для индексации).
Фаза обучения
- Найдите характерные черты модели. Предположим, что на изображении модели обнаружены 5 характерных точек с координатами , смотрите картинку.
- Введите основу для описания расположения характерных точек. Для 2D-пространства и преобразование подобия базис определяется парой точек. Исходная точка находится в середине отрезка, соединяющего две точки (P2, P4 в нашем примере), ось направлена к одному из них, ортогонален и проходит через начало координат. Масштаб выбран таким, чтобы абсолютное значение для обеих базисных точек равно 1.
- Опишите расположение пространственных объектов относительно этого базиса, то есть вычислите проекции на новые оси координат. Координаты должны быть дискретизированы для распознавания крепкий к шуму берем размер бина 0,25. Таким образом, мы получаем координаты
- Храните основу в хеш-таблица индексируется по объектам (в данном случае только преобразованные координаты). Если бы было больше объектов для сопоставления, мы также должны сохранить номер объекта вместе с базовой парой.
- Повторите процесс для другой пары базисов (шаг 2). Это необходимо для обработки окклюзии. В идеале все не-коллинеарный пары должны быть пронумерованы. Предоставляем хеш-таблицу после двух итераций, для второй выбирается пара (P1, P3).
Хеш-таблица:
Вектор (, ) | основа |
---|---|
(P2, P4) | |
(P2, P4) | |
(P2, P4) | |
(P2, P4) | |
(P2, P4) | |
(P1, P3) | |
(P1, P3) | |
(P1, P3) | |
(P1, P3) | |
(P1, P3) |
В большинстве хеш-таблиц не может быть одинаковых ключей, сопоставленных с разными значениями. Таким образом, в реальной жизни нельзя кодировать базовые ключи (1.0, 0.0) и (-1.0, 0.0) в хеш-таблице.
Фаза признания
- Найдите интересные особенности во входном изображении.
- Выбираем произвольную основу. Если подходящей произвольной основы нет, то вполне вероятно, что входное изображение не содержит целевой объект.
- Опишите координаты характерных точек в новом базисе. Квантовать полученные координаты, как это делалось ранее.
- Сравните все преобразованные точечные объекты на входном изображении с хеш-таблицей. Если точечные объекты идентичны или похожи, увеличьте счетчик для соответствующего базиса (и типа объекта, если таковой имеется).
- Для каждого базиса, в котором счет превышает определенный порог, проверьте гипотезу о том, что он соответствует базису изображения, выбранному на шаге 2. Перенесите систему координат изображения в модельную (для предполагаемого объекта) и попытайтесь сопоставить их. В случае успеха объект найден. В противном случае вернитесь к шагу 2.
Поиск зеркального рисунка
Похоже, что этот метод может обрабатывать только масштабирование, перемещение и вращение. Однако входное изображение может содержать объект в зеркальном преобразовании. Следовательно, геометрическое хеширование также должно иметь возможность найти объект. Есть два способа обнаружить зеркальные объекты.
- Для векторного графика сделайте левую часть положительной, а правую - отрицательной. Умножение позиции x на -1 даст тот же результат.
- Используйте 3 точки за основу. Это позволяет обнаруживать зеркальные изображения (или объекты). Собственно, использование трех точек за основу - это еще один подход к геометрическому хешированию.
Геометрическое хеширование в более высоких измерениях
Как и в примере выше, хеширование применяется к многомерным данным. Для трехмерных точек данных также необходимы три точки в качестве основы. Первые две точки определяют ось x, а третья точка определяет ось y (с первой точкой). Ось z перпендикулярна созданной оси с использованием правила правой руки. Обратите внимание, что порядок точек влияет на итоговую основу
Смотрите также
Рекомендации
- ^ В КАЧЕСТВЕ. Миан, М. Беннамун и Р. Оуэнс, Распознавание и сегментация объектов на основе трехмерных моделей в загроможденных сценах., IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 28 октября 2006 г., стр. 1584-601.
- ^ Молл, Марк; Брайант, Дрю Х .; Кавраки, Лидия Э. (11.11.2010). «Алгоритм LabelHash для сопоставления субструктур». BMC Bioinformatics. 11: 555. Дои:10.1186/1471-2105-11-555. ISSN 1471-2105. ЧВК 2996407. PMID 21070651.
- ^ Нусинов, Р .; Вольфсон, Х. Дж. (1991-12-01). «Эффективное обнаружение трехмерных структурных мотивов в биологических макромолекулах методами компьютерного зрения». Труды Национальной академии наук Соединенных Штатов Америки. 88 (23): 10495–10499. Дои:10.1073 / pnas.88.23.10495. ISSN 0027-8424. ЧВК 52955. PMID 1961713.
- Вольфсон, H.J. и Rigoutsos, I. (1997). Геометрическое хеширование: обзор. IEEE Computational Science and Engineering, 4 (4), 10-21.