Поза (компьютерное зрение) - Pose (computer vision)

В компьютерное зрение и робототехника, типичная задача - идентифицировать конкретные объекты на изображении и для определения положения каждого объекта и ориентация относительно некоторой системы координат. Затем эту информацию можно использовать, например, чтобы позволить роботу манипулировать объектом или избежать проникновения в объект. Сочетание позиция и ориентация называется поза объекта, хотя это понятие иногда используется только для описания ориентации. Внешняя ориентация и перевод также используются как синонимы позы.

Данные изображения, на основе которых определяется поза объекта, могут быть либо одиночным изображением, парой стереоизображений, либо последовательностью изображений, где обычно камера движется с известной скоростью. Рассматриваемые объекты могут быть довольно общими, включая живое существо или части тела, например, голову или руки. Однако методы, которые используются для определения позы объекта, обычно специфичны для определенного класса объектов, и, как правило, нельзя ожидать, что они будут хорошо работать для других типов объектов.

Поза может быть описана с помощью преобразования вращения и перемещения, которое переводит объект из исходной позы в наблюдаемую.[требуется разъяснение ]. Это преобразование поворота можно представить по-разному, например, как матрица вращения или кватернион.

Оценка позы

Конкретная задача определения позы объекта на изображении (или стереоизображениях, последовательности изображений) называется оценка позы. Проблема оценки позы может быть решена по-разному в зависимости от конфигурации датчика изображения и выбора методологии. Можно выделить три класса методологий:

  • Аналитические или геометрические методы: при условии, что датчик изображения (камера) откалиброван и сопоставление трехмерных точек сцены и двухмерных точек изображения известно. Если также известна геометрия объекта, это означает, что проецируемое изображение объекта на изображении камеры является хорошо известной функцией позы объекта. После определения набора контрольных точек на объекте, обычно углов или других характерных точек, можно решить преобразование позы из набора уравнений, которые связывают трехмерные координаты точек с координатами их двухмерного изображения. Алгоритмы, определяющие позу облако точек по отношению к другому облаку точек известны как регистрация набора точек алгоритмы, если соответствия между точками еще не известны.
  • Генетический алгоритм методы: Если положение объекта не нужно вычислять в реальном времени, генетический алгоритм может быть использовано. Этот подход надежен, особенно когда изображения не откалиброваны идеально. В этом конкретном случае поза представляет собой генетическое представление а ошибка между проекцией контрольных точек объекта на изображение - это фитнес-функция.
  • Методы, основанные на обучении: эти методы используют систему на основе искусственного обучения, которая изучает отображение на основе функций 2D-изображения для преобразования позы. Короче говоря, это означает, что достаточно большой набор изображений объекта в разных позах должен быть представлен системе на этапе обучения. После завершения фазы обучения система должна быть способна представить оценку позы объекта с учетом изображения объекта.

Смотрите также

Рекомендации

  • Линда Г. Шапиро и Джордж К. Стокман (2001). Компьютерное зрение. Прентис Холл. ISBN  0-13-030796-3.