Многоканонический ансамбль - Multicanonical ensemble

В статистика и физика, мультиканонический ансамбль (также называемый многоканоническая выборка или же плоская гистограмма) это Цепь Маркова Монте-Карло метод отбора проб, использующий Алгоритм Метрополиса – Гастингса вычислить интегралы где подынтегральная функция имеет грубый ландшафт с несколькими локальные минимумы. Он производит выборку состояний согласно инверсии плотность состояний,[1] который должен быть известен априори или вычисляться с использованием других методов, таких как Алгоритм Ванга и Ландау.[2] Мультиканоническая выборка - важный метод для вращение такие системы, как Модель Изинга или же спиновые очки.[1][3][4]

Мотивация

В системах с большим количеством степеней свободы, например вращение системы, Интеграция Монте-Карло необходимо. В этой интеграции выборка по важности и в частности Алгоритм мегаполиса, это очень важная техника.[3] Тем не менее, алгоритм Metropolis выборки состояний согласно где бета - величина, обратная температуре. Это означает, что энергетический барьер из на энергетическом спектре экспоненциально трудно преодолеть.[1] Системы с множественными локальными минимумами энергии, такими как Модель Поттса становится трудным для выборки, поскольку алгоритм застревает в локальных минимумах системы.[3] Это мотивирует другие подходы, а именно другие распределения выборки.

Обзор

Мультиканонический ансамбль использует алгоритм Метрополиса – Гастингса с распределением выборки, заданным обратной плотностью состояний системы, в отличие от распределения выборки алгоритма Метрополис.[1] При таком выборе в среднем количество состояний, отобранных для каждой энергии, является постоянным, то есть это моделирование с «плоской гистограммой» по энергии. Это приводит к алгоритму, для которого уже нетрудно преодолеть энергетические барьеры. Еще одно преимущество перед алгоритмом Метрополиса состоит в том, что отбор проб не зависит от температуры системы, что означает, что одно моделирование позволяет оценить термодинамические переменные для всех температур (отсюда и название «многоканонический»: несколько температур). Это большое улучшение в изучении первого порядка. фазовые переходы.[1]

Самая большая проблема при выполнении мультиканонического ансамбля состоит в том, что необходимо знать плотность состояний. априори.[2][3] Одним из важных вкладов в мультиканоническую выборку была Алгоритм Ванга и Ландау, который асимптотически сходится к многоканоническому ансамблю при вычислении плотности состояний при сходимости.[2]

Мультиканонический ансамбль не ограничивается физическими системами. Его можно использовать в абстрактных системах, которые имеют функцию стоимости F. Используя плотность состояний по отношению к F, метод становится общим для вычисления многомерных интегралов или нахождения локальных минимумов.[5]

Мотивация

Рассмотрим систему и ее фазовое пространство характеризуется конфигурацией в и функция "стоимости" F из фазового пространства системы в одномерное пространство : , спектр F.

пример:

В Модель Изинга с N сайты - пример такой системы; фазовое пространство - это дискретное фазовое пространство, определяемое всеми возможными конфигурациями N спины куда . Функция стоимости - это Гамильтониан системы:

куда это сумма по окрестностям и - матрица взаимодействия.

Энергетический спектр которое в данном случае зависит от конкретного использовал. Я упал равны 1 (ферромагнитная модель Изинга), (например, все вращения равны 1.) и (половину вращения вверх, половину вращения вниз). Также обратите внимание, что в этой системе

Вычисление средней величины по фазовому пространству требует вычисления интеграла:

куда вес каждого состояния (например, соответствуют равномерно распределенным состояниям).

Когда Q не зависит от конкретного состояния, а только от конкретного значения F состояния , формула для может быть интегрирован ж добавив дельта-функция Дирака и будет написано как

куда

- маргинальное распределение F.

пример:

Система, контактирующая с термостатом при обратной температуре является примером для вычисления такого интеграла. Например, средняя энергия системы взвешивается Фактор Больцмана:

куда

Предельное распределение дан кем-то

куда - плотность состояний.

Средняя энергия тогда дается

Когда система имеет большое количество степеней свободы, аналитическое выражение для часто бывает трудно получить, и Интеграция Монте-Карло обычно используется при вычислении . В простейшей формулировке метод выбирает N равномерно распределенные состояния , и использует оценщик

для вычислений потому что почти наверняка сходится к посредством сильный закон больших чисел:

Одна типичная проблема такой конвергенции состоит в том, что дисперсия Q может быть очень высоким, что требует больших вычислительных затрат для достижения разумных результатов.

пример

В предыдущем примере наибольший вклад в интеграл вносят состояния с низкой энергией. Если состояния отбираются равномерно, в среднем количество состояний, которые отбираются с энергией E дается плотностью состояний. Эта плотность состояний может быть центрирована далеко от минимумов энергии, и поэтому получить среднее значение может быть трудно.

Чтобы улучшить эту сходимость, Алгоритм Метрополиса – Гастингса было предложено. Как правило, идея методов Монте-Карло заключается в использовании выборка по важности для улучшения сходимости оценки путем выборки состояний в соответствии с произвольный распределение , и используйте соответствующую оценку:

.

Эта оценка обобщает оценку среднего для выборок, взятых из произвольного распределения. Следовательно, когда - это равномерное распределение, оно соответствует тому, которое использовалось для однородной выборки выше.

Когда система представляет собой физическую систему, контактирующую с термостатом, каждое состояние взвешивается в соответствии с Фактор Больцмана, .В Монте-Карло канонический ансамбль определяется выбором быть пропорциональным . В этой ситуации оценка соответствует простому среднему арифметическому:

Исторически это произошло потому, что оригинальная идея[6] было использовать Алгоритм Метрополиса – Гастингса для вычисления средних значений для системы, контактирующей с термостатом, где вес определяется коэффициентом Больцмана, .[3]

Хотя часто бывает, что распределение выборки выбрано в качестве распределения веса Это не обязательно. Одна ситуация, когда канонический ансамбль не является эффективным выбором, - это когда для схождения требуется сколь угодно много времени.[1]Одна из ситуаций, когда это происходит, - это когда функция F имеет несколько локальных минимумов. Вычислительные затраты для алгоритма, чтобы покинуть конкретную область с локальным минимумом, экспоненциально возрастают с увеличением значения функции стоимости минимума. То есть, чем глубже минимум, тем больше времени алгоритм там проводит, и тем сложнее будет уйти (экспоненциально возрастает с глубиной локального минимума).

Один из способов избежать застревания в локальных минимумах функции стоимости - сделать метод выборки «невидимым» для локальных минимумов. Это основа мультиканонического ансамбля.

Многоканонический ансамбль

Мультиканонический ансамбль определяется выбором распределения выборки

куда предельное распределение F, определенное выше. Следствием этого выбора является то, что среднее количество выборок с заданным значением ж, m (f), определяется выражением

то есть среднее количество выборок не зависит от ж: все затраты ж выбираются одинаково, независимо от того, более или менее вероятны они. Это мотивирует название «плоская гистограмма». Для систем, находящихся в контакте с термостатом, отбор проб не зависит от температуры, и одно моделирование позволяет изучить все температуры.

пример:

О ферромагнетике Модель Изинга с N сайтов (пример в предыдущем разделе), плотность состояний может быть вычислена аналитически. В этом случае многоканонический ансамбль может использоваться для вычисления любой другой величины. Q путем отбора проб системы в соответствии с и используя правильную оценку определено в предыдущем разделе.

Время туннелирования и критическое замедление

Как и в любом другом методе Монте-Карло, есть корреляции выборок, взятых из . Типичным измерением корреляции является время туннелирования. Время туннелирования определяется количеством марковских шагов (марковской цепи), которое необходимо моделированию для выполнения обхода между минимумом и максимумом спектра F. Одним из мотивов использования времени туннелирования является то, что, когда оно пересекает спектр, оно проходит через область максимума плотности состояний, тем самым декоррелируя процесс. С другой стороны, использование круговых обходов гарантирует, что система посещает весь спектр.

Поскольку гистограмма плоская по переменной F, мультиканонический ансамбль можно рассматривать как процесс диффузии (т. е. случайная прогулка ) на одномерной линии F значения. Детальный баланс процесса диктует, что нет дрейф о процессе.[7] Это означает, что время туннелирования в локальной динамике должно масштабироваться как процесс диффузии, и, следовательно, время туннелирования должно масштабироваться квадратично с размером спектра, N:

Однако в некоторых системах (модель Изинга является наиболее парадигматической) масштабирование страдает от критического замедления: это куда зависит от конкретной системы.[4]

Нелокальная динамика была разработана для улучшения масштабирования до квадратичного масштабирования.[8] (см. Алгоритм Вольфа ), преодолевая критическое замедление. Однако остается открытым вопрос, существует ли локальная динамика, которая не страдает от критического замедления в спиновых системах, подобных модели Изинга.

Рекомендации

  1. ^ а б c d е ж Berg, B .; Neuhaus, T. (1992). «Мультиканонический ансамбль: новый подход к моделированию фазовых переходов первого рода». Письма с физическими проверками. 68 (1): 9–12. arXiv:hep-lat / 9202004. Bibcode:1992ПхРвЛ..68 .... 9Б. Дои:10.1103 / PhysRevLett.68.9. PMID  10045099.
  2. ^ а б c Wang, F .; Ландау, Д. (2001). «Эффективный алгоритм случайного блуждания с множеством диапазонов для вычисления плотности состояний». Письма с физическими проверками. 86 (10): 2050–2053. arXiv:cond-mat / 0011174. Bibcode:2001ПхРвЛ..86.2050Вт. Дои:10.1103 / PhysRevLett.86.2050. PMID  11289852.
  3. ^ а б c d е Ньюманн, М. Э. Дж; Баркема, Г. Т. (2002). Методы Монте-Карло в статистической физике. США: Издательство Оксфордского университета. ISBN  0198517971.
  4. ^ а б Dayal, P .; Trebst, S .; Wessel, S .; Würtz, D .; Troyer, M .; Sabhapandit, S .; Медник, С. (2004). «Ограничения производительности методов плоской гистограммы». Письма с физическими проверками. 92 (9): 097201. arXiv:cond-mat / 0306108. Bibcode:2004PhRvL..92i7201D. Дои:10.1103 / PhysRevLett.92.097201. PMID  15089505.
  5. ^ Lee, J .; Чой, М. (1994). «Оптимизация многоканоническим отжигом и задача коммивояжера». Физический обзор E. 50 (2): R651 – R654. Bibcode:1994PhRvE..50..651L. Дои:10.1103 / PhysRevE.50.R651. PMID  9962167.
  6. ^ Метрополис, N .; Розенблют, А. В .; Розенблют, М. Н .; Teller, A.H .; Теллер, Э. (1953). «Уравнение состояний на быстрых вычислительных машинах». Журнал химической физики. 21 (6): 1087. Bibcode:1953ЖЧФ..21.1087М. Дои:10.1063/1.1699114.
  7. ^ Роберт, Кристиан; Казелла, Джордж (2004). Статистические методы Монте-Карло. Springer. ISBN  978-0-387-21239-5.
  8. ^ Вольф, У. (1989). «Коллективное обновление Монте-Карло для спиновых систем». Письма с физическими проверками. 62 (4): 361–364. Bibcode:1989PhRvL..62..361W. Дои:10.1103 / PhysRevLett.62.361. PMID  10040213.