Метод Нелдера – Мида - Nelder–Mead method

Нелдер-Мид Rosenbrock.gif
Нелдер-Мид Himmelblau.gif

Симплексный поиск Нелдера – Мида по Розенброк банановая функция(над) и Функция Химмельблау (ниже)

Минимальный поиск Нелдера – Мида Функция Симионеску. Вершины симплекса упорядочены по их значению, причем 1 имеет наименьшее (лучшее) значение.

В Метод Нелдера – Мида (также односторонний спуск, метод амебы, или же многогранник) широко применяется численный метод используется для нахождения минимума или максимума целевая функция в многомерном пространстве. Это метод прямого поиска (основан на сравнении функций) и часто применяется к нелинейным оптимизация проблемы, для которых производные могут быть неизвестны. Однако метод Нелдера – Мида - это эвристический метод поиска, который может сходиться к нестационарным точкам[1] о проблемах, которые можно решить альтернативными методами.[2]

Техника Нелдера – Мида была предложена Джон Нелдер и Роджер Мид в 1965 г.,[3] как развитие метода Spendley et al.[4]

Обзор

В методе используется концепция симплекс, что является особенным многогранник из п + 1 вершина в п Габаритные размеры. Примеры симплексов включают отрезок на прямой, треугольник на плоскости, тетраэдр в трехмерном пространстве и так далее.

Метод аппроксимирует локальный оптимум задачи с п переменных, когда целевая функция изменяется плавно и одномодальный. Типичные реализации минимизируют функции, а мы максимизируем минимизируя .

Например, инженер по подвесному мосту должен выбрать толщину каждой стойки, троса и опоры. Эти элементы взаимозависимы, но непросто представить себе влияние изменения какого-либо конкретного элемента. Моделирование таких сложных структур часто требует чрезвычайно больших вычислительных затрат и, возможно, занимает более часов на выполнение. Метод Нелдера – Мида в исходном варианте требует не более двух вычислений на итерацию, за исключением сокращаться описанная ниже операция, которая привлекательна по сравнению с некоторыми другими методами оптимизации прямого поиска. Однако общее количество итераций до предложенного оптимума может быть большим.

Нелдер – Мид ин п размеры поддерживает набор п + 1 контрольная точка в виде симплекс. Затем он экстраполирует поведение целевой функции, измеренной в каждой контрольной точке, чтобы найти новую контрольную точку и заменить одну из старых контрольных точек на новую, и таким образом методика прогрессирует. Самый простой подход - заменить худшую точку точкой, отраженной через центроид из оставшихся п точки. Если эта точка лучше, чем лучшая текущая точка, мы можем попробовать экспоненциально растянуться вдоль этой линии. С другой стороны, если эта новая точка не намного лучше, чем предыдущее значение, то мы переходим через долину, поэтому мы сжимаем симплекс в сторону лучшей точки. Интуитивное объяснение алгоритма из «Численных рецептов»:[5]

Симплексный метод спуска теперь включает серию шагов, большинство из которых просто перемещают точку симплекса, где функция наибольшая («самая высокая точка»), через противоположную сторону симплекса в нижнюю точку. Эти шаги называются отражениями, и они построены так, чтобы сохранить объем симплекса (и, следовательно, сохранить его невырожденность). Когда это возможно, метод расширяет симплекс в том или ином направлении, делая более крупные шаги. Когда он достигает «дна долины», метод сжимается в поперечном направлении и пытается просочиться вниз по долине. Если возникает ситуация, когда симплекс пытается «пройти сквозь игольное ушко», он сжимается во всех направлениях, втягиваясь вокруг своей самой нижней (лучшей) точки.

В отличие от современных методов оптимизации, эвристика Нелдера – Мида может сходиться к нестационарной точке, если только задача не удовлетворяет более строгим условиям, чем это необходимо для современных методов.[1] Современные усовершенствования эвристики Нелдера – Мида известны с 1979 года.[2]

Существует множество вариаций, зависящих от реальной природы решаемой проблемы. В распространенном варианте используется небольшой симплекс постоянного размера, который примерно следует направлению градиента (что дает крутой спуск ). Визуализируйте маленький треугольник на карте высот, переворачивающийся вниз по долине к местному дну. Этот метод также известен как метод гибкого многогранника. Это, однако, имеет тенденцию плохо работать по сравнению с методом, описанным в этой статье, поскольку он выполняет небольшие ненужные шаги в областях, которые не представляют особого интереса.

Один из возможных вариантов алгоритма NM

(Это примерно соответствует процедуре, описанной в исходной статье Нелдера – Мида.)

Метод Нелдера – Мида, примененный к Функция Розенброка

Мы пытаемся минимизировать функцию , куда . Наши текущие контрольные точки: .

1. Заказать по значениям в вершинах:

Проверьте, должен ли метод останавливаться. Видеть Прекращение ниже. Иногда неуместно называют «конвергенцией».

2. Рассчитать , то центроид всех пунктов, кроме .

3. Отражение

Вычислить отраженную точку с .
Если отраженная точка лучше второй худшей, но не лучше лучшей, т.е. ,
затем получить новый симплекс, заменив худшую точку с отраженной точкой и перейдите к шагу 1.

4. Расширение

Если отраженная точка пока лучшая, ,
затем вычислите расширенную точку с .
Если расширенная точка лучше отраженной точки, ,
затем получить новый симплекс, заменив худшую точку с расширенной точкой и перейти к шагу 1;
иначе получить новый симплекс, заменив худшую точку с отраженной точкой и переходите к шагу 1.

5. Сокращение

Здесь несомненно, что . (Обратите внимание, что является вторым или «ближайшим к высшему».)
Вычислить сокращенную точку с .
Если сжатая точка лучше худшей, т.е. ,
затем получить новый симплекс, заменив худшую точку со сжатой точкой и перейти к шагу 1;

6. Усадка

Заменить все точки кроме лучшего () с
и переходите к шагу 1.

Примечание: , , и являются соответственно коэффициентами отражения, расширения, сжатия и сжатия. Стандартные значения: , , и .

Для отражение, поскольку является вершиной с более высоким ассоциированным значением среди вершин, мы можем ожидать найти более низкое значение при отражении на противоположной грани, образованной всеми вершинами Кроме .

Для расширение, если точка отражения - новый минимум по вершинам, мы можем ожидать найти интересные значения по направлению от к .

Касательно сокращение, если , можно ожидать, что лучшее значение будет внутри симплекса, образованного всеми вершинами .

Наконец, сокращаться справляется с редким случаем, когда сокращение от самой большой точки увеличивает , то, что не может произойти достаточно близко к неособому минимуму. В этом случае мы приближаемся к самой низкой точке в ожидании более простого ландшафта. Тем не менее, Нэш отмечает, что арифметика конечной точности иногда может не сжимать симплекс, и реализовал проверку того, что размер действительно уменьшается.[6]

Начальный симплекс

Начальный симплекс важен. Действительно, слишком маленький начальный симплекс может привести к локальному поиску, следовательно, NM может легко застрять. Таким образом, этот симплекс должен зависеть от характера проблемы. Однако в исходной статье предлагался симплекс, в котором начальная точка задается как , а остальные генерируются с фиксированным шагом по каждому измерению по очереди. Таким образом, метод чувствителен к масштабированию переменных, составляющих .

Прекращение

Критерии необходимы, чтобы разорвать итерационный цикл. Нелдер и Мид использовали стандартное отклонение выборки значений функции текущего симплекса. Если они падают ниже некоторого допуска, то цикл останавливается, и самая низкая точка в симплексе возвращается как предложенный оптимум. Обратите внимание, что очень «плоская» функция может иметь почти равные значения функции в большой области, так что решение будет чувствительно к допуску. Нэш добавляет тест на усадку в качестве еще одного критерия завершения.[6] Обратите внимание, что программы завершаются, а итерации могут сходиться.

Смотрите также

Рекомендации

  1. ^ а б
    • Пауэлл, Майкл Дж. Д. (1973). «О направлениях поиска алгоритмов минимизации». Математическое программирование. 4: 193–201. Дои:10.1007 / bf01584660. S2CID  45909653.
    • Маккиннон, К. И. М. (1999). «Сходимость симплекс-метода Нелдера – Мида к нестационарной точке». SIAM Journal по оптимизации. 9: 148–158. CiteSeerX  10.1.1.52.3900. Дои:10.1137 / S1052623496303482. (краткое изложение алгоритма онлайн).
  2. ^ а б
    • Ю, Вэнь Ци. 1979. «Позитивная основа и класс методов прямого поиска». Scientia Sinica [Чжунго Кэсюэ]: 53—68.
    • Ю, Вэнь Ци. 1979. "Конвергентное свойство симплексной эволюционной техники". Scientia Sinica [Чжунго Кэсюэ]: 69–77.
    • Колда, Тамара Г.; Льюис, Роберт Майкл; Торчон, Вирджиния (2003). «Оптимизация прямым поиском: новые взгляды на некоторые классические и современные методы». SIAM Rev. 45 (3): 385–482. CiteSeerX  10.1.1.96.8672. Дои:10.1137 / S003614450242889.
    • Льюис, Роберт Майкл; Шеперд, Энн; Торчон, Вирджиния (2007). «Реализация методов поиска генераторных установок для линейно ограниченной минимизации». SIAM J. Sci. Вычислить. 29 (6): 2507–2530. CiteSeerX  10.1.1.62.8771. Дои:10.1137/050635432.
  3. ^ Нелдер, Джон А .; Р. Мид (1965). «Симплексный метод минимизации функции». Компьютерный журнал. 7 (4): 308–313. Дои:10.1093 / comjnl / 7.4.308.
  4. ^ Spendley, W .; Hext, G. R .; Химсворт, Ф. Р. (1962). «Последовательное применение симплексных схем в оптимизации и эволюционной работе». Технометрика. 4 (4): 441–461. Дои:10.1080/00401706.1962.10490033.
  5. ^
  6. ^ а б Нэш, Дж. К. (1979). Компактные численные методы: линейная алгебра и минимизация функций. Бристоль: Адам Хильгер. ISBN  978-0-85274-330-0.

дальнейшее чтение

внешняя ссылка