D * - D*

D * (произносится как «звезда D») - это любой из следующих трех связанных алгоритмы инкрементального поиска:

  • Оригинальный D *,[1] Энтони Стенц, это информированный алгоритм инкрементального поиска.
  • Сфокусированный D *[2] представляет собой алгоритм инкрементного эвристического поиска Энтони Стенца, который объединяет идеи А *[3] и оригинальный D *. Сфокусированный D * возник в результате дальнейшего развития оригинального D *.
  • D * Lite[4] представляет собой алгоритм возрастающего эвристического поиска по Свен Кениг и Максим Лихачев, опирающийся на LPA *,[5] алгоритм инкрементального эвристического поиска, который объединяет идеи А * и динамический SWSF-FP.[6]

Все три алгоритма поиска решают одни и те же предположения. планирование пути проблемы, включая планирование с предположением о свободном пространстве,[7] где робот должен перейти к заданным координатам цели на неизвестной местности. Он делает предположения о неизвестной части местности (например, что на ней нет препятствий) и находит кратчайший путь от ее текущих координат до координат цели при этих предположениях. Затем робот следует по пути. Когда он наблюдает новую информацию на карте (например, ранее неизвестные препятствия), он добавляет эту информацию на свою карту и, при необходимости, перепланировывает новый кратчайший путь от его текущих координат до заданных координат цели. Он повторяет процесс до тех пор, пока не достигнет координат цели или не определит, что координаты цели не могут быть достигнуты. При пересечении неизвестной местности могут часто обнаруживаться новые препятствия, поэтому такое перепланирование должно быть быстрым. Алгоритмы инкрементального (эвристического) поиска ускорить поиск последовательностей схожих задач поиска, используя опыт решения предыдущих задач, чтобы ускорить поиск текущей. Если предположить, что координаты цели не меняются, все три алгоритма поиска более эффективны, чем повторные поиски A *.

D * и его варианты широко используются для мобильный робот и автономный автомобиль навигация. Современные системы обычно основаны на D * Lite, а не на оригинальном D * или Focussed D *. Фактически, даже лаборатория Стенца в некоторых реализациях использует D * Lite, а не D *.[8] К таким навигационным системам относится опытный образец системы, испытанный на марсоходах. Возможность и Дух и система навигации по победившей записи в DARPA Urban Challenge, оба разработаны в Университет Карнеги Меллон.

Оригинальный D * был представлен Энтони Стенцем в 1994 году. Название D * происходит от термина «Dynamic A *»,[9] потому что алгоритм ведет себя как A *, за исключением того, что стоимость дуги может изменяться по мере выполнения алгоритма.

Операция

Основная работа D * описана ниже.

Подобно алгоритму Дейкстры и A *, D * поддерживает список узлов для оценки, известный как «OPEN list». Узлы помечаются как имеющие одно из нескольких состояний:

  • НОВИНКА, то есть никогда не помещалась в ОТКРЫТЫЙ список
  • ОТКРЫТО, то есть в настоящее время находится в списке ОТКРЫТО.
  • ЗАКРЫТО, то есть его больше нет в списке ОТКРЫТО.
  • ПОДНЯТЬ, указывая на то, что его стоимость выше, чем в последний раз, когда он был в списке ОТКРЫТО.
  • НИЖНИЙ, что указывает на то, что его стоимость ниже, чем в последний раз, когда он был в списке ОТКРЫТО.

Расширение

Алгоритм работает путем итеративного выбора узла из списка OPEN и его оценки. Затем он распространяет изменения узла на все соседние узлы и помещает их в список OPEN. Этот процесс распространения называется «расширением». В отличие от канонического A *, который следует по пути от начала до конца, D * начинает поиск в обратном направлении от целевого узла. Каждый расширенный узел имеет обратный указатель, который относится к следующему узлу, ведущему к цели, и каждый узел знает точную стоимость для цели. Когда начальный узел является следующим расширяемым узлом, алгоритм выполнен, и путь к цели можно найти, просто следуя обратным указателям.

Преодоление препятствий

Когда на заданном пути обнаруживается препятствие, все затронутые точки снова помещаются в список ОТКРЫТО, на этот раз с пометкой ПОДНЯТЬ. Однако перед увеличением стоимости узла RAISED алгоритм проверяет его соседей и проверяет, может ли он снизить стоимость узла. В противном случае состояние RAISE распространяется на все потомки узлов, то есть узлы, на которые есть обратные указатели. Затем эти узлы оцениваются, и состояние RAISE передается, формируя волну. Когда узел RAISED может быть уменьшен, его обратный указатель обновляется и передает состояние LOWER своим соседям. Эти волны состояний RAISE и LOWER являются сердцем D *.

К этому моменту волны не могут «коснуться» целого ряда других точек. Следовательно, алгоритм работал только с точками, на которые влияет изменение стоимости.

Возникает очередной тупик

На этот раз невозможно так элегантно выйти из тупика. Ни одна из точек не может найти новый маршрут через соседа к месту назначения. Поэтому они продолжают распространять свое повышение стоимости. Можно найти только точки за пределами канала, которые могут привести к месту назначения по жизнеспособному маршруту. Так развиваются две нижние волны, которые расширяются в виде точек, отмеченных как недостижимые с новой информацией о маршруте.

Псевдокод

пока (!openList.пусто()) {    точка = openList.getFirst();    расширять(точка);}

Расширять

пустота расширять(currentPoint) {    логический isRaise = isRaise(currentPoint);    двойной Стоимость;    за каждый (сосед в currentPoint.getNeighbours()) {        если (isRaise) {            если (сосед.nextPoint == currentPoint) {                сосед.setNextPointAndUpdateCost(currentPoint);                openList.Добавить(сосед);            } еще {                Стоимость = сосед.calculateCostVia(currentPoint);                если (Стоимость < сосед.getCost()) {                    currentPoint.setMinimumCostToCurrentCost();                    openList.Добавить(currentPoint);                }            }        } еще {            Стоимость = сосед.calculateCostVia(currentPoint);            если (Стоимость < сосед.getCost()) {                сосед.setNextPointAndUpdateCost(currentPoint);                openList.Добавить(сосед);            }        }    }}

Проверить на повышение

логический isRaise(точка) {    двойной Стоимость;    если (точка.getCurrentCost() > точка.getMinimumCost()) {        за каждый(сосед в точка.getNeighbours()) {            Стоимость = точка.calculateCostVia(сосед);            если (Стоимость < точка.getCurrentCost()) {                точка.setNextPointAndUpdateCost(сосед);            }        }    }    возвращаться точка.getCurrentCost() > точка.getMinimumCost();}

Варианты

Сфокусированный D *

Как следует из названия, Focused D * является расширением D *, которое использует эвристику, чтобы сфокусировать распространение RAISE и LOWER в направлении робота. Таким образом обновляются только те состояния, которые имеют значение, так же как A * вычисляет затраты только для некоторых узлов.

D * Lite

D * Lite не основан на исходном D * или Focused D *, но реализует то же поведение. Это проще для понимания и может быть реализовано меньшим количеством строк кода, отсюда и название «D * Lite». По производительности он не хуже Focused D *. D * Lite основан на Планирование на всю жизнь A *, который был введен Кенигом и Лихачевым несколькими годами ранее. D * Lite

Минимальная стоимость по сравнению с текущей стоимостью

Для D * важно различать текущие и минимальные затраты. Первый важен только во время сбора, а второй критичен, потому что сортирует OpenList. Функция, которая возвращает минимальную стоимость, всегда является наименьшей стоимостью для текущей точки, так как это первая запись в OpenList.

Рекомендации

  1. ^ Стенц, Энтони (1994), "Оптимальное и эффективное планирование пути для частично известных сред", Материалы Международной конференции по робототехнике и автоматизации: 3310–3317, CiteSeerX  10.1.1.15.3683
  2. ^ Стенц, Энтони (1995), "Сфокусированный алгоритм D * для перепланирования в реальном времени", Труды Международной совместной конференции по искусственному интеллекту: 1652–1659, CiteSeerX  10.1.1.41.8257
  3. ^ Hart, P .; Nilsson, N .; Рафаэль, Б. (1968), "Формальная основа для эвристического определения путей минимальной стоимости", IEEE Trans. Syst. Наука и кибернетика, ССК-4 (2): 100–107, Дои:10.1109 / TSSC.1968.300136
  4. ^ Koenig, S .; Лихачев, М. (2005), "Быстрое перепланирование навигации в неизвестной местности", Сделки по робототехнике, 21 (3): 354–363, CiteSeerX  10.1.1.65.5979, Дои:10.1109 / tro.2004.838026
  5. ^ Koenig, S .; Лихачев, М .; Фурси, Д. (2004), «Планирование на всю жизнь A *», Искусственный интеллект, 155 (1–2): 93–146, Дои:10.1016 / j.artint.2003.12.001
  6. ^ Ramalingam, G .; Репс, Т. (1996), "Инкрементальный алгоритм для обобщения задачи поиска кратчайшего пути", Журнал алгоритмов, 21 (2): 267–305, CiteSeerX  10.1.1.3.7926, Дои:10.1006 / jagm.1996.0046
  7. ^ Koenig, S .; Смирнов, Ю .; Тови, К. (2003), «Границы производительности для планирования в неизвестной местности», Искусственный интеллект, 147 (1–2): 253–279, Дои:10.1016 / с0004-3702 (03) 00062-6
  8. ^ Вуден, Д. (2006). Планирование пути для мобильных роботов на основе графиков (Тезис). Технологический институт Джорджии.
  9. ^ Стенц, Энтони (1995), "Сфокусированный алгоритм D * для перепланирования в реальном времени", Труды Международной совместной конференции по искусственному интеллекту: 1652–1659, CiteSeerX  10.1.1.41.8257

внешняя ссылка