Термодинамика максимальной энтропии - Maximum entropy thermodynamics

В физика, термодинамика максимальной энтропии (в просторечии, MaxEnt термодинамика ) взгляды равновесная термодинамика и статистическая механика в качестве вывод процессы. В частности, MaxEnt применяет методы логического вывода, основанные на Теория информации Шеннона, Байесовская вероятность, а принцип максимальной энтропии. Эти методы применимы к любой ситуации, требующей прогнозирования на основе неполных или недостаточных данных (например, реконструкция изображения, обработка сигналов, спектральный анализ, и обратные задачи ). Термодинамика MaxEnt началась с двух статей Эдвин Т. Джейнс опубликовано в 1957 г. Физический обзор.[1][2]

Максимальная энтропия Шеннона

Центральным в тезисе MaxEnt является принцип максимальной энтропии. Он требует, как дано, некоторую частично заданную модель и некоторые определенные данные, относящиеся к модели. Он выбирает предпочтительное распределение вероятностей для представления модели. Приведенные данные представляют собой «проверяемую информацию».[3][4] о распределение вероятностей, например, в частности ожидание значения, но сами по себе недостаточны для его однозначного определения. Принцип гласит, что следует предпочесть распределение, которое максимизирует Информационная энтропия Шеннона,

.

Это известно как Алгоритм Гиббса, представленный Дж. Уиллард Гиббс в 1878 г., чтобы создать статистические ансамбли прогнозировать свойства термодинамических систем в состоянии равновесия. Это краеугольный камень статистико-механического анализа термодинамических свойств равновесных систем (см. функция распределения ).

Таким образом, устанавливается прямая связь между равновесными термодинамическая энтропия SЧт, а государственная функция давления, объема, температуры и т. д., а также информационная энтропия для прогнозируемого распределения с максимальной неопределенностью, обусловленной только ожидаемыми значениями этих переменных:

kB, Постоянная Больцмана, не имеет здесь фундаментального физического значения, но необходимо для сохранения согласованности с предыдущим историческим определением энтропии Клаузиус (1865 г.) (см. Постоянная Больцмана ).

Тем не менее Школа MaxEnt утверждают, что подход MaxEnt - это общий метод статистического вывода, с приложениями, выходящими далеко за рамки этого. Следовательно, его также можно использовать для прогнозирования распределения «траекторий» Γ «за период времени» путем максимизации:

Эта «информационная энтропия» нет обязательно иметь простое соответствие с термодинамической энтропией. Но его можно использовать для прогнозирования особенностей неравновесная термодинамика системы по мере их развития с течением времени.

Для неравновесных сценариев в приближении, предполагающем локальное термодинамическое равновесие, при максимальном энтропийном подходе Взаимные отношения Онзагера и Отношения Грин-Кубо выпадают прямо. Этот подход также создает теоретическую основу для изучения некоторых очень частных случаев сценариев, далеких от равновесия, что приводит к выводу теорема о флуктуациях производства энтропии простой. Для неравновесных процессов, как и для макроскопических описаний, также отсутствует общее определение энтропии для микроскопических статистических механических счетов.

Техническое примечание: По причинам, изложенным в статье дифференциальная энтропия, простое определение энтропии Шеннона перестает быть непосредственно применимым для случайные переменные с непрерывным функции распределения вероятностей. Вместо этого подходящей величиной для максимизации является «относительная информационная энтропия»,

ЧАСc это негатив Дивергенция Кульбака – Лейблера или информация о дискриминации м(Икс) из п(Икс), куда м(Икс) является предварительным инвариантная мера для переменной (ов). Относительная энтропия ЧАСc всегда меньше нуля, и его можно рассматривать как (отрицательное) количество биты неопределенности, утраченной за счет фиксации на п(Икс) скорее, чем м(Икс). В отличие от энтропии Шеннона относительная энтропия ЧАСc имеет то преимущество, что остается конечным и четко определенным для непрерывных Икс, и инвариантен относительно преобразований координат один в один. Два выражения совпадают для дискретные распределения вероятностей, если можно предположить, что м(Икся) равномерно - т.е. принцип равной априорной вероятности, лежащая в основе статистической термодинамики.

Философские последствия

Приверженцы точки зрения MaxEnt занимают четкую позицию по некоторым концептуальные / философские вопросы в термодинамике. Эта позиция изображена ниже.

Природа вероятностей в статистической механике

Джейнс (1985,[5] 2003,[6] et passim) обсудил понятие вероятности. Согласно точке зрения MaxEnt, вероятности в статистической механике определяются совместно двумя факторами: соответственно заданными конкретными моделями для основного пространства состояний (например, лиувиллианской фазовое пространство ); и соответственно определенными частными описаниями системы (макроскопическое описание системы, используемое для ограничения присвоения вероятностей MaxEnt). Вероятности цель в том смысле, что с учетом этих входных данных будет получено однозначно определенное распределение вероятностей, одинаковое для каждого рационального исследователя, независимо от субъективности или произвольного мнения конкретных людей. Вероятности являются эпистемическими в том смысле, что они определены в терминах определенных данных и выведены из этих данных с помощью определенных и объективных правил вывода, одинаковых для каждого рационального исследователя.[7] Здесь слово эпистемическое, которое относится к объективному и безличному научному знанию, одинаковому для каждого рационального исследователя, используется в том смысле, который противопоставляет его мнению, которое относится к субъективным или произвольным убеждениям конкретных людей; этот контраст был использован Платон и Аристотель, и сегодня стоит надежно.

Джейнс также использовал слово «субъективный» в этом контексте, потому что другие использовали его в этом контексте. Он признал, что в некотором смысле состояние знания имеет субъективный аспект просто потому, что оно относится к мысли, которая является ментальным процессом. Но он подчеркнул, что принцип максимальной энтропии относится только к мысли, которая является рациональной и объективной, независимой от личности мыслителя. В целом, с философской точки зрения, слова «субъективный» и «объективный» не противоречат друг другу; часто сущность имеет как субъективные, так и объективные аспекты. Джейнс недвусмысленно отверг критику некоторых авторов, которые утверждали, что только потому, что можно сказать, что мысль имеет субъективный аспект, мысль автоматически является необъективной. Он открыто отверг субъективность как основу научного мышления, эпистемологию науки; он требовал, чтобы научные рассуждения имели полностью и строго объективную основу.[8] Тем не менее критики продолжают нападать на Джейнса, утверждая, что его идеи «субъективны». Один писатель даже назвал подход Джейнса "ультрасубъективистским".[9] и упомянуть «панику, которую термин субъективизм вызвал среди физиков».[10]

Вероятности представляют как степень знания, так и недостаток информации в данных и модели, использованной в макроскопическом описании системы аналитиком, а также то, что эти данные говорят о природе лежащей в основе реальности.

Соответствие вероятностей зависит от того, являются ли ограничения указанной макроскопической модели достаточно точным и / или полным описанием системы, чтобы охватить все экспериментально воспроизводимое поведение. Это не может быть гарантировано, априори. По этой причине сторонники MaxEnt также называют метод предсказательная статистическая механика. Прогнозы могут не оправдаться. Но если они это сделают, это информативно, потому что это сигнализирует о наличии новых ограничений, необходимых для фиксации воспроизводимого поведения в системе, которое не было принято во внимание.

Энтропия «реальна»?

Термодинамическая энтропия (в состоянии равновесия) является функцией переменных состояния в описании модели. Следовательно, он такой же «реальный», как и другие переменные в описании модели. Если ограничения модели в присвоении вероятности представляют собой «хорошее» описание, содержащее всю информацию, необходимую для предсказания воспроизводимых экспериментальных результатов, тогда оно включает в себя все результаты, которые можно было бы предсказать, используя формулы, включающие энтропию из классической термодинамики. В этом смысле MaxEnt SЧт так же «реально», как энтропия в классической термодинамике.

Конечно, в действительности существует только одно реальное состояние системы. Энтропия не является прямой функцией этого состояния. Это функция реального состояния только через (субъективно выбранное) описание макроскопической модели.

Актуальна ли эргодическая теория?

Гиббсовский ансамбль идеализирует идею повторения эксперимента снова и снова на разные системы, а не снова и снова на одно и тоже система. Так что долгосрочные средние значения и эргодическая гипотеза, несмотря на интенсивный интерес к ним в первой половине двадцатого века, строго говоря, они не имеют отношения к вероятностному присвоению состояния, в котором может находиться система.

Однако это изменяется, если есть дополнительные сведения о том, что система готовится определенным образом за некоторое время до измерения. Затем необходимо подумать, дает ли это дополнительную информацию, которая все еще актуальна во время измерения. Тогда вопрос о том, насколько «быстро смешиваются» различные свойства системы, становится очень интересным. Информация о некоторых степенях свободы комбинированной системы может очень быстро прийти в негодность; информация о других свойствах системы может оставаться актуальной в течение значительного времени.

По крайней мере, средние и долгосрочные корреляционные свойства системы сами по себе являются интересными объектами для экспериментов. Неспособность их точно предсказать - хороший индикатор того, что соответствующая макроскопически определяемая физика может отсутствовать в модели.

Второй закон

В соответствии с Теорема Лиувилля за Гамильтонова динамика, гиперобъем облака точек в фазовое пространство остается постоянным по мере развития системы. Следовательно, информационная энтропия также должна оставаться постоянной, если мы опираемся на исходную информацию, а затем проследим за каждым из этих микросостояний вперед во времени:

Однако с течением времени эта исходная информация становится менее доступной. Вместо того, чтобы быть легко резюмируемым в макроскопическом описании системы, оно все больше относится к очень тонким корреляциям между положениями и импульсами отдельных молекул. (Сравните с Больцмановским H-теорема.) Эквивалентно, это означает, что распределение вероятностей для всей системы в 6N-мерном фазовом пространстве становится все более нерегулярным, растекаясь на длинные тонкие пальцы, а не на начальный строго определенный объем возможностей.

Классическая термодинамика построена на предположении, что энтропия есть государственная функция из макроскопические переменные - то есть, что никакая история системы не имеет значения, так что все это можно игнорировать.

Расширенное, тонкое, развитое распределение вероятностей, которое все еще имеет начальную энтропию Шеннона SЧт(1), должен воспроизводить ожидаемые значения наблюдаемых макроскопических переменных во время т2. Однако это больше не обязательно будет максимальным распределением энтропии для этого нового макроскопического описания. С другой стороны, новая термодинамическая энтропия SЧт(2) несомненно буду измерить максимальное распределение энтропии по построению. Поэтому мы ожидаем:

На абстрактном уровне этот результат подразумевает, что некоторая информация, которую мы изначально имели о системе, стала «больше не полезной» на макроскопическом уровне. На уровне 6N-мерное распределение вероятностей, этот результат представляет крупнозернистый - то есть потеря информации из-за сглаживания очень мелких деталей.

Предостережения с аргументом

В связи с вышеизложенным следует учитывать некоторые предостережения.

1. Как и все статистические механические результаты в соответствии со школой MaxEnt, это увеличение термодинамической энтропии - всего лишь прогноз. В частности, предполагается, что исходное макроскопическое описание содержит всю информацию, относящуюся к предсказанию более позднего макроскопического состояния. Это может быть не так, например, если первоначальное описание не отражает какой-либо аспект подготовки системы, который позже становится актуальным. В этом случае «провал» прогноза MaxEnt говорит нам, что есть кое-что еще, что имеет значение, что мы, возможно, упустили из виду в физике системы.

Также иногда предполагается, что квантовое измерение, особенно в декогеренция Интерпретация, может дать очевидно неожиданное уменьшение энтропии в соответствии с этим аргументом, поскольку это, по-видимому, связано с появлением макроскопической информации, которая ранее была недоступна. (Однако учет энтропии квантовых измерений сложен, потому что для достижения полной декогеренции можно предположить бесконечную среду с бесконечной энтропией).

2. Споры до сих пор не затрагивали вопрос о колебания. Также неявно предполагалось, что неопределенность, прогнозируемая во время т1 для переменных во время т2 будет намного меньше погрешности измерения. Но если измерения действительно обновляют наши знания о системе, наша неопределенность относительно ее состояния снижается, давая новое Sя(2) который меньше чем Sя(1). (Обратите внимание, что если мы позволим себе возможности Демон лапласа, последствия этой новой информации также могут быть отображены в обратном направлении, поэтому наша неуверенность в динамическом состоянии во времени т1 сейчас также уменьшено с Sя(1) к Sя(2) ).

Мы знаем это SЧт(2) > Sя(2); но теперь мы не можем быть уверены, что он больше, чем SЧт(1) = Sя(1). Это оставляет открытой возможность для колебаний SЧт. Термодинамическая энтропия может идти как вверх, так и вниз. Более сложный анализ дает энтропия Теорема флуктуации, который может быть установлен как следствие зависящего от времени изображения MaxEnt.

3. Как только что указывалось, вывод MaxEnt одинаково хорошо работает и в обратном направлении. Итак, учитывая конкретное конечное состояние, мы можем спросить, что мы можем "ретродировать", чтобы улучшить наши знания о более ранних состояниях? Однако приведенный выше аргумент Второго закона также работает в обратном направлении: заданная макроскопическая информация во времени т2, мы должны ожидать, что он тоже станет менее полезным. Две процедуры симметричны по времени. Но теперь информация будет становиться все менее и менее полезной в прежние времена. (Сравнить с Парадокс лошмидта.) Вывод MaxEnt предсказывает, что наиболее вероятным источником текущего состояния с низкой энтропией может быть спонтанное колебание от более раннего состояния с высокой энтропией. Но это противоречит тому, что, как мы знаем, произошло, а именно, что энтропия неуклонно увеличивалась даже в прошлом.

Сторонники MaxEnt ответят на это, что такая систематическая ошибка в предсказании вывода MaxEnt - это «хорошо».[11] Это означает, что имеется явное свидетельство того, что некоторая важная физическая информация была упущена в спецификации проблемы. Если правильно то динамика "есть" симметричный во времени, оказывается, нам нужно вручную вставить априорная вероятность что начальные конфигурации с низкой термодинамической энтропией более вероятны, чем начальные конфигурации с высокой термодинамической энтропией. Это нельзя объяснить непосредственной динамикой. Вполне возможно, что он возникает как отражение очевидной асимметричной во времени эволюции Вселенной в космологическом масштабе (см. стрела времени ).

Критика

Термодинамика максимальной энтропии имеет некоторые важные возражения, отчасти из-за относительной малочисленности опубликованных результатов школы MaxEnt, особенно в отношении новых проверяемых предсказаний, далеких от равновесия.[12]

Теория также подвергалась критике за внутреннюю непротиворечивость. Например, Раду Балеску подвергает резкой критике школу MaxEnt и работу Джейнса. Балеску утверждает, что теория Джейнса и его коллег основана на непереходном законе эволюции, который дает неоднозначные результаты. Хотя некоторые трудности теории можно устранить, теория «не имеет прочного основания» и «не привела к какому-либо новому конкретному результату».[13]

Хотя подход максимальной энтропии основан непосредственно на информационной энтропии, он применим к физике только при наличии четкого физического определения энтропии. Нет четкого единственного общего физического определения энтропии для неравновесных систем, которые представляют собой общие физические системы, рассматриваемые в процессе, а не термодинамические системы в их собственных внутренних состояниях термодинамического равновесия.[14] Отсюда следует, что подход максимальной энтропии не будет применим к неравновесным системам, пока не будет найдено четкое физическое определение энтропии. Эта проблема связана с тем фактом, что тепло может передаваться от более горячей физической системе к более холодной, даже если локальное термодинамическое равновесие не поддерживается, так что ни одна из систем не имеет четко определенной температуры. Классическая энтропия определяется для системы в ее собственном внутреннем состоянии термодинамического равновесия, которое определяется переменными состояния, без ненулевых потоков, так что переменные потока не появляются как переменные состояния. Но для сильно неравновесной системы во время процесса переменные состояния должны включать ненулевые переменные потока. Классические физические определения энтропии не охватывают этот случай, особенно когда потоки достаточно велики, чтобы нарушить локальное термодинамическое равновесие. Другими словами, для энтропии для неравновесных систем в целом определение должно, по крайней мере, включать спецификацию процесса, включая ненулевые потоки, помимо классических статических термодинамических переменных состояния. «Энтропия», которая максимизируется, должна быть определена в соответствии с рассматриваемой проблемой. Если несоответствующая «энтропия» максимизирована, вероятен неправильный результат. В принципе, термодинамика максимальной энтропии не относится узко, а относится только к классической термодинамической энтропии. Речь идет об информационной энтропии, применяемой к физике, явно зависящей от данных, используемых для постановки задачи. Согласно Аттарду, для физических проблем, анализируемых с помощью сильно неравновесной термодинамики, необходимо учитывать несколько физически различных видов энтропии, включая то, что он называет второй энтропией. Аттард пишет: «Максимизация второй энтропии микросостояний в данном начальном макросостоянии дает наиболее вероятное целевое макросостояние».[15] Физически определенная вторая энтропия также может рассматриваться с информационной точки зрения.

Смотрите также

Рекомендации

  1. ^ Джейнс, Э. (1957). «Теория информации и статистическая механика» (PDF). Физический обзор. 106 (4): 620–630. Bibcode:1957PhRv..106..620J. Дои:10.1103 / PhysRev.106.620.
  2. ^ — (1957). «Теория информации и статистическая механика II» (PDF). Физический обзор. 108 (2): 171–190. Bibcode:1957PhRv..108..171J. Дои:10.1103 / PhysRev.108.171.
  3. ^ Джейнс, Э. (1968), стр. 229.
  4. ^ Джейнс, Э. (1979), стр.30, 31, 40.
  5. ^ Джейнс, Э. (1985).
  6. ^ Джейнс, Э. (2003).
  7. ^ Джейнс, Э. (1979), стр. 28.
  8. ^ Джейнс, Э. (1968), стр. 228.
  9. ^ Гуттманн, Ю. (1999), стр.28, 36, 38, 57, 61.
  10. ^ Гуттманн, Ю. (1999), стр. 29.
  11. ^ Джейнс, Э. (1979).
  12. ^ Клейдон, А., Лоренц, Р.Д. (2005).
  13. ^ Балеску, Р. (1997).
  14. ^ Либ, Э. Х., Ингвасон, Дж. (2003). Энтропия классической термодинамики, глава 8 Гревен, А., Келлер, Г., Варнеке (редакторы) (2003). Энтропия, Princeton University Press, Принстон, штат Нью-Джерси, ISBN  0-691-11338-6, стр.190.
  15. ^ Аттард, П. (2012). Неравновесная термодинамика и статистическая механика: основы и приложения, Oxford University Press, Oxford UK, ISBN  978-0-19-966276-0, п. 161.

Библиография цитируемых ссылок

дальнейшее чтение