Алгоритм Лемке – Хаусона - Lemke–Howson algorithm
В Алгоритм Лемке – Хаусона[1] является алгоритм который вычисляет равновесие по Нэшу из биматрикс игра, названный в честь его изобретателей, Карлтон Э. Лемке и Дж. Т. Хаусон.Он считается «самым известным из комбинаторных алгоритмов для нахождения равновесия по Нэшу».[2]
Описание
Вход в алгоритм - это игра на двоих. грамм.грамм представлен двумя м × п игровые матрицы A и B, содержащие выплаты для игроков 1 и 2 соответственно, которые имеют м и п чистые стратегии соответственно. Далее мы предполагаем, что все выплаты положительны. (Изменив масштаб, любую игру можно превратить в стратегически эквивалентную игру с положительными выплатами.)
грамм имеет два соответствующих многогранники (называется многогранники наилучшего отклика)П1 и P2, в м размеры и п размеры соответственно определены следующим образом.
п1 в рм; позволять {Икс1,...,Иксм} обозначим координаты. P1 определяется м неравенство Икся ≥ 0 для всех я ∈ {1,...,м}, и еще п неравенстваB1,jИкс1+ ... + Bм,jИксм ≤ 1, для всех j ∈ {1,...,п}.
п2 в рп; позволять {Иксм+1,...,Иксм+п} обозначим координаты. P2 определяется п неравенство Иксм+я ≥ 0 для всех я ∈ {1,...,п}, и еще м неравенстваAя,1Иксм+1+ ... + Ая,пИксм+п ≤ 1, для всех я ∈ {1,...,м}.
п1 представляет собой набор ненормализованных распределений вероятностей для игрока 1м чистые стратегии, такие, что ожидаемый выигрыш игрока 2 составляет не более 1. Первый м ограничения требуют, чтобы вероятности были неотрицательными, а другие п ограничения требуют каждого из п чистые стратегии игрока 2 с ожидаемым выигрышем не более 1.P2 имеет аналогичное значение, меняя роли игроков.
Каждая вершина v из P1 связан с набором меток из множества {1, ...,м + п} следующим образом. я ∈ {1, ..., м}, вершина v получает ярлык я если Икся = 0 в вершине v.За j ∈ {1, ..., п}, вершина v получает ярлык м + j если B1,jИкс1 + ... + Bм,jИксм = 1. Предполагая, что п1 невырожден, каждая вершина инцидентна мграни п1 и имеет м Отметим, что начало координат, являющееся вершиной P1, имеет метки {1, ...,м}.
Каждая вершина ш из п2 связан с набором меток из множества {1, ...,м + п} следующим образом. j ∈ {1, ..., п}, вершина ш получает ярлык м + j если Иксм+j = 0 в вершинеш.За я ∈ {1, ..., м}, вершина ш получает ярлык я еслиАя,1Иксм+1 + ... + Ая,пИксм+п = 1. Предполагая, что P2 невырожден, каждая вершина инцидентна пграни P2 и имеет п Отметим, что начало координат, являющееся вершиной P2, имеет ярлыки {м + 1, ..., м + п}.
Рассмотрим пары вершин (v,ш), v ∈ P1, ш ∈ п2.Мы говорим, что (v,ш) является полностью маркированный если наборы, связанные с v и шсодержат все метки {1, ...,м + п}. Обратите внимание, что если v и ш являются истоками рм и рпсоответственно, то (v,ш) полностью помечен. Мы говорим, что (v,ш) является почти полностью маркирован (относительно некоторого отсутствующего ярлыка грамм), если множества, ассоциированные с v и шсодержат все метки в {1, ...,м + п} Кроме как грамм. Обратите внимание, что в этом случае будет повторяющаяся этикетка что связано с обоимиv и ш.
А поворотная операция состоит из взятия некоторой пары (v,ш) и заменив v с некоторой вершиной, смежной с v в P1, или, альтернативно, замена ш с некоторой вершиной, смежной с ш в P2. Это имеет эффект (в случае, еслиv заменяется) замены некоторой метки v с другой меткой. Замененная метка называется упавший. Учитывая любой ярлык v, можно отбросить эту метку, переместившись в вершину, смежную с v который не содержит гиперплоскости, связанной с этой меткой.
Алгоритм начинается с полностью помеченной пары (v,ш), состоящий из пары источников. Произвольная метка грамм отбрасывается с помощью операции поворота, что приводит нас к почти полностью помеченной паре (v ′,w ′). Любая почти полностью помеченная pairad допускает две опорные операции, соответствующие отбрасыванию той или иной копии ее дублированной метки, и каждая из этих операций может привести к другой почти полностью помеченной паре или полностью помеченной паре. В итоге алгоритм находит полностью помеченную пару (v*,ш*), который не является источником. (v*,ш*) соответствует паре ненормированных распределений вероятностей, в которых каждая стратегия я игрока 1 либо платит этому игроку 1, либо платит меньше 1, и этот игрок играет с вероятностью 0 (аналогичное наблюдение справедливо и для игрока 2). Нормализуя эти значения к распределениям вероятностей, мы получаем равновесие по Нэшу (выигрыши которого для игроков являются обратными коэффициентам нормализации).
Характеристики
Алгоритм может найти не более п + м различные равновесия по Нэшу. Любой выбор изначально отброшенной метки определяет равновесие, которое в конечном итоге будет найдено алгоритмом.
Алгоритм Лемке – Хаусона эквивалентен следующему гомотопия -основанный подход. грамм путем выбора произвольной чистой стратегии грамм, и давая игроку, владеющему этой стратегией, крупный платеж B играть в это. В модифицированной игре эта стратегия граммиграется с вероятностью 1, и другой игрок сыграет свой лучший ответ грамм с вероятностью 1. Рассмотрим континуум игр, в которых B непрерывно сводится к 0. Существует путь равновесий Нэша, соединяющий единственное равновесие модифицированной игры с равновесием грамм.Чистая стратегия грамм выбран для получения бонуса B соответствует первоначально отброшенной метке.[3]
Хотя алгоритм эффективен на практике, в худшем случае может потребоваться, чтобы количество опорных операций было экспоненциальным по отношению к количеству чистых стратегий в игре.[4]Впоследствии было показано, что это PSPACE-полный найти любое из решений, которые могут быть получены с помощью алгоритма Лемке – Хаусона.[5]
Рекомендации
- ^ К. Э. Лемке и Дж. Т. Хаусон (1964). «Точки равновесия биматричных игр». Журнал SIAM по прикладной математике. 12 (2): 413–423. Дои:10.1137/0112033.
- ^ Нисан, Ноам; Roughgarden, Тим; Тардос, Ива; Вазирани, Виджай В. (2007). Алгоритмическая теория игр (PDF). Кембридж, Великобритания: Издательство Кембриджского университета. п. 33. ISBN 978-0-521-87282-9. Архивировано из оригинал (PDF) на 2015-02-11.
- ^ П.Дж. Херингс и Р. Петерс (2010). «Гомотопические методы для вычисления равновесий в теории игр». Экономическая теория. 42 (1): 119–156. Дои:10.1007 / s00199-009-0441-5.
- ^ Р. Савани и Б. фон Стенгель (2006). «Биматричные игры, которые сложно решить». Econometrica. 74 (2): 397–429. CiteSeerX 10.1.1.63.1548. Дои:10.1111 / j.1468-0262.2006.00667.x.
- ^ П.В. Гольдберг, C.H. Пападимитриу и Р. Савани (2011). Сложность метода гомотопии, равновесного выбора и решений Лемке – Хаусона. Proc. 52-й FOCS. С. 67–76. arXiv:1006.5352. Дои:10.1109 / FOCS.2011.26.