Геометрическое хеширование - Википедия - Geometric hashing

В Информатика, геометрическое хеширование - это метод эффективного поиска двумерных объектов, представленных дискретными точками, которые подверглись аффинное преобразование, хотя существуют расширения для других представлений и преобразований объектов. В автономном режиме объекты кодируются путем обработки каждой пары точек как геометрического объекта. основа. Остальные точки можно представить в виде инвариантный мода относительно этой основы с использованием двух параметров. Для каждой точки свой квантованный преобразованные координаты сохраняются в хеш-таблица как ключ, а индексы базисных точек как значение. Затем выбирается новая пара базисных точек, и процесс повторяется. На этапе онлайн (распознавания) случайно выбранные пары точек данных рассматриваются как базы-кандидаты. Для каждой основы-кандидата оставшиеся точки данных кодируются в соответствии с основанием, и возможные соответствия объекта находятся в ранее созданной таблице. Основа-кандидат принимается, если достаточно большое количество точек данных указывает на непротиворечивую основу объекта.

Первоначально геометрическое хеширование было предложено в компьютерное зрение за распознавание объекта в 2D и 3D,[1] но позже был применен к различным задачам, таким как структурное выравнивание из белки.[2][3]

Геометрическое хеширование в компьютерном зрении

Геометрическое хеширование - это метод, используемый для распознавания объектов. Допустим, мы хотим проверить, можно ли увидеть изображение модели во входном изображении. Этого можно добиться с помощью геометрического хеширования. Этот метод может использоваться для распознавания одного из нескольких объектов в базе, в этом случае хеш-таблица должна хранить не только информацию о позе, но и индекс объектной модели в базе.

Пример

Для простоты в этом примере не будет использоваться слишком много точечные особенности и предположим, что их дескрипторы заданы только их координатами (на практике локальные дескрипторы Такие как ПРОСЕЯТЬ может использоваться для индексации).

Фаза обучения

Точки объекта в системе координат изображения и оси для системы координат за основу (P2, P4)
  1. Найдите характерные черты модели. Предположим, что на изображении модели обнаружены 5 характерных точек с координатами , смотрите картинку.
  2. Введите основу для описания расположения характерных точек. Для 2D-пространства и преобразование подобия базис определяется парой точек. Исходная точка находится в середине отрезка, соединяющего две точки (P2, P4 в нашем примере), ось направлена ​​к одному из них, ортогонален и проходит через начало координат. Масштаб выбран таким, чтобы абсолютное значение для обеих базисных точек равно 1.
  3. Опишите расположение пространственных объектов относительно этого базиса, то есть вычислите проекции на новые оси координат. Координаты должны быть дискретизированы для распознавания крепкий к шуму берем размер бина 0,25. Таким образом, мы получаем координаты
  4. Храните основу в хеш-таблица индексируется по объектам (в данном случае только преобразованные координаты). Если бы было больше объектов для сопоставления, мы также должны сохранить номер объекта вместе с базовой парой.
  5. Повторите процесс для другой пары базисов (шаг 2). Это необходимо для обработки окклюзии. В идеале все не-коллинеарный пары должны быть пронумерованы. Предоставляем хеш-таблицу после двух итераций, для второй выбирается пара (P1, P3).

Хеш-таблица:

Вектор (, )основа
(P2, P4)
(P2, P4)
(P2, P4)
(P2, P4)
(P2, P4)
(P1, P3)
(P1, P3)
(P1, P3)
(P1, P3)
(P1, P3)

В большинстве хеш-таблиц не может быть одинаковых ключей, сопоставленных с разными значениями. Таким образом, в реальной жизни нельзя кодировать базовые ключи (1.0, 0.0) и (-1.0, 0.0) в хеш-таблице.

Фаза признания

  1. Найдите интересные особенности во входном изображении.
  2. Выбираем произвольную основу. Если подходящей произвольной основы нет, то вполне вероятно, что входное изображение не содержит целевой объект.
  3. Опишите координаты характерных точек в новом базисе. Квантовать полученные координаты, как это делалось ранее.
  4. Сравните все преобразованные точечные объекты на входном изображении с хеш-таблицей. Если точечные объекты идентичны или похожи, увеличьте счетчик для соответствующего базиса (и типа объекта, если таковой имеется).
  5. Для каждого базиса, в котором счет превышает определенный порог, проверьте гипотезу о том, что он соответствует базису изображения, выбранному на шаге 2. Перенесите систему координат изображения в модельную (для предполагаемого объекта) и попытайтесь сопоставить их. В случае успеха объект найден. В противном случае вернитесь к шагу 2.

Поиск зеркального рисунка

Похоже, что этот метод может обрабатывать только масштабирование, перемещение и вращение. Однако входное изображение может содержать объект в зеркальном преобразовании. Следовательно, геометрическое хеширование также должно иметь возможность найти объект. Есть два способа обнаружить зеркальные объекты.

  1. Для векторного графика сделайте левую часть положительной, а правую - отрицательной. Умножение позиции x на -1 даст тот же результат.
  2. Используйте 3 точки за основу. Это позволяет обнаруживать зеркальные изображения (или объекты). Собственно, использование трех точек за основу - это еще один подход к геометрическому хешированию.

Геометрическое хеширование в более высоких измерениях

Как и в примере выше, хеширование применяется к многомерным данным. Для трехмерных точек данных также необходимы три точки в качестве основы. Первые две точки определяют ось x, а третья точка определяет ось y (с первой точкой). Ось z перпендикулярна созданной оси с использованием правила правой руки. Обратите внимание, что порядок точек влияет на итоговую основу

Смотрите также

Рекомендации

  1. ^ В КАЧЕСТВЕ. Миан, М. Беннамун и Р. Оуэнс, Распознавание и сегментация объектов на основе трехмерных моделей в загроможденных сценах., IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 28 октября 2006 г., стр. 1584-601.
  2. ^ Молл, Марк; Брайант, Дрю Х .; Кавраки, Лидия Э. (11.11.2010). «Алгоритм LabelHash для сопоставления субструктур». BMC Bioinformatics. 11: 555. Дои:10.1186/1471-2105-11-555. ISSN  1471-2105. ЧВК  2996407. PMID  21070651.
  3. ^ Нусинов, Р .; Вольфсон, Х. Дж. (1991-12-01). «Эффективное обнаружение трехмерных структурных мотивов в биологических макромолекулах методами компьютерного зрения». Труды Национальной академии наук Соединенных Штатов Америки. 88 (23): 10495–10499. Дои:10.1073 / pnas.88.23.10495. ISSN  0027-8424. ЧВК  52955. PMID  1961713.