Соответствующие пенни - Matching pennies
Головы | Хвосты | |
Головы | +1, −1 | −1, +1 |
Хвосты | −1, +1 | +1, −1 |
Соответствующие пенни |
Соответствующие пенни это название простой игры, используемой в теория игры. В нее играют между двумя игроками, четным и нечетным. У каждого игрока есть пенни и должен тайно повернуть пенни в орел или решку. Затем игроки одновременно раскрывают свой выбор. Если монеты совпадают (обе орлы или решки), то чет оставляет оба пенни, поэтому выигрывает один из нечетных (+1 для четных, -1 для нечетных). Если монеты не совпадают (один орел и один решка), Odd сохраняет оба пенни, поэтому получает один от четного (-1 для четного, +1 для нечетного).
Теория
Соответствующие пенни - это игра с нулевой суммой потому что выгода или потеря полезности каждого участника точно уравновешиваются потерями или выгодами полезности других участников. Если сложить общую прибыль участников и вычесть их общие убытки, сумма будет равна нулю.
Игра может быть написана на матрица выплат (на фото справа - с точки зрения Эвена). Каждая ячейка матрицы показывает выплаты двух игроков, причем выплаты Эвена указаны первыми.
Соответствующие пенни используются в основном для иллюстрации концепции смешанные стратегии и смешанная стратегия равновесие по Нэшу.[1]
В этой игре нет чистая стратегия равновесие по Нэшу поскольку не существует чистой стратегии (орла или решки), лучший ответ к лучшему ответу. Другими словами, не существует пары чистых стратегий, из которых ни один из игроков не захотел бы переключиться, если бы ему сказали, что будет делать другой. Вместо этого уникальное равновесие по Нэшу в этой игре находится в смешанные стратегии: каждый игрок выбирает орел или решку с равной вероятностью.[2] Таким образом, каждый игрок делает другого безразличным между выбором орла или решки, поэтому ни у одного из игроков нет стимула пробовать другую стратегию. Функции наилучшего отклика для смешанных стратегий показаны на Рисунке 1 ниже:
Когда любой из игроков играет в равновесие, ожидаемый выигрыш для всех равен нулю.
Варианты
Головы | Хвосты | |
Головы | +7, -1 | -1, +1 |
Хвосты | -1, +1 | +1, -1 |
Соответствующие пенни |
Изменение выплат в матрице может изменить точку равновесия. Например, в таблице справа у Четного есть шанс выиграть 7, если и он, и Нечетный играют решками. Чтобы вычислить точку равновесия в этой игре, обратите внимание, что игрок, играющий по смешанной стратегии, должен безразлично выбирать между двумя своими действиями (иначе он переключился бы на чистую стратегию). Это дает нам два уравнения:
- Для четного игрока ожидаемая выплата при розыгрыше головы равна и при игре решкой , и они должны быть равны, поэтому .
- Для нечетного игрока ожидаемая выплата при розыгрыше голов составляет и при игре решкой , и они должны быть равны, поэтому .
Обратите внимание, что это вероятность того, что Странный и это вероятность того, что Четное. Таким образом, изменение выплаты Эвена влияет на стратегию Одда, а не на его собственную стратегию.
Лабораторные эксперименты
Люди-игроки не всегда придерживаются стратегии равновесия. Лабораторные эксперименты выявляют несколько факторов, которые заставляют игроков отклоняться от стратегии равновесия, особенно если совпадение пенни разыгрывается неоднократно:
- Люди не умеют рандомизировать. Они могут пытаться создать "случайные" последовательности, переключая свои действия с орла на решку и наоборот, но они меняют свои действия слишком часто (из-за заблуждение игрока ). Это позволяет опытным игрокам предсказывать свои следующие действия с вероятностью успеха более 50%. Таким образом, положительный ожидаемая выплата может быть достижимым.
- Люди обучены обнаруживать закономерности. Они пытаются обнаружить закономерности в последовательности действий оппонента, даже если таких схем не существует, и соответствующим образом корректировать свою стратегию.[3]
- На поведение людей влияют обрамляющие эффекты.[4] Когда нечетного игрока называют «вводящим в заблуждение», а четного игрока - «угадывающим», первый фокусируется на попытке рандомизировать, а второй - на попытке обнаружить закономерность, и это увеличивает шансы на успех угадывающего. Кроме того, тот факт, что Эвен выигрывает при совпадении, дает ему преимущество, так как люди лучше умеют сопоставить, чем не совпадать (из-за Совместимость стимул-реакция эффект).
Более того, когда матрица выплат асимметрична, на поведение человека влияют другие факторы, даже если игра не повторяется:
- Игроки склонны увеличивать вероятность совершения действия, которое дает им более высокий выигрыш, например в приведенной выше матрице выплат Эвен будет играть больше голов. Это интуитивно понятно, но это не равновесие по Нэшу: как объяснялось выше, вероятность смешивания игрока должна зависеть только от Другой выигрыш игрока, а не его собственный выигрыш. Это отклонение можно объяснить как квантовый отклик равновесие.[5][6] В равновесии квантового отклика кривые наилучшего отклика не являются резкими, как в стандартном равновесии Нэша. Скорее, они плавно переходят от действия, вероятность которого равна 0, к действию, вероятность которого равна 1 (другими словами, в то время как в равновесии Нэша игрок выбирает лучший ответ с вероятностью 1 и худший ответ с вероятностью 0 в квантовой -response-equilibrium игрок выбирает лучший ответ с высокой вероятностью, которая меньше 1, и худший ответ с меньшей вероятностью, которая больше 0). Точка равновесия - это точка пересечения сглаженных кривых двух игроков, которая отличается от точки равновесия по Нэшу.
- Эффект собственного выигрыша смягчается за счет предотвращение риска.[7] Игроки склонны недооценивать высокие выигрыши и переоценивать большие потери; это сдвигает кривые квантового отклика и изменяет точку равновесия квантового отклика. Это явно противоречит теоретическим результатам о несоответствии неприятия риска в играх с конечным числом повторений и нулевой суммой.[8]
Реальные данные
Выводы лабораторных экспериментов подвергались критике по нескольким причинам.[9][10]
- Игры в лабораторных экспериментах искусственны и упрощены и не имитируют поведение в реальной жизни.
- Результаты лабораторных экспериментов невелики, поэтому у испытуемых нет особого стимула для оптимальной игры. В реальной жизни рынок может «наказать» такую иррациональность и заставить игроков вести себя более рационально.
- У испытуемых есть другие соображения, помимо максимизации денежных выплат, например, чтобы не выглядеть глупо или доставить удовольствие экспериментатору.
- Лабораторные эксперименты непродолжительны, и у испытуемых не хватает времени, чтобы изучить оптимальную стратегию.
Чтобы преодолеть эти трудности, несколько авторов провели статистический анализ профессиональных спортивных игр. Это игры с нулевой суммой и очень высокими выплатами, и игроки посвятили свою жизнь тому, чтобы стать экспертами. Часто такие игры стратегически похожи на сопоставление монет:
- В футбольный пенальти, у игрока, выполняющего удар, есть два варианта: удар влево или вправо, а у вратаря два варианта: прыжок влево или вправо.[11] Вероятность забить гол выше, если варианты выбора не совпадают, и ниже, когда варианты совпадают. В общем, выплаты асимметричны, потому что у каждого кикера более сильная нога (обычно правая нога), и его шансы выше при ударе ногой в противоположном направлении (влево). При внимательном рассмотрении действий нападающих и вратарей выяснилось, что[9][10] что их действия существенно не отклоняются от предсказания равновесия по Нэшу.
- В теннис Подача-возврат, ситуация аналогичная. Было обнаружено[12] что процент побед соответствует гипотезе минимакса, но выбор игроков не случаен: даже профессиональные теннисисты не умеют рандомизировать и слишком часто меняют свои действия.
Смотрите также
- Шансы и эвенты - игра с той же стратегической структурой, в которой играют пальцами, а не монетами.
- Камень ножницы Бумага - аналогичная игра, в которой у каждого игрока есть три стратегии вместо двух.
- Паритетная игра - несвязанная (и намного более сложная) логическая игра для двух игроков, играемая на цветном графе.
Рекомендации
- ^ Гиббонс, Роберт (1992). Теория игр для экономистов-прикладников. Издательство Принстонского университета. С. 29–33. ISBN 978-0-691-00395-5.
- ^ «Соответствующие пенни». GameTheory.net. Архивировано из оригинал на 2006-10-01.
- ^ Мукхерджи, Дилип; Софер, Барри (1994). «Обучение поведению в экспериментальной игре на сопоставление пенни». Игры и экономическое поведение. 7: 62–91. Дои:10.1006 / игра.1994.1037.
- ^ Элиаз, Кфир; Рубинштейн, Ариэль (2011). «Загадка Эдгара Аллана По: эффекты обрамления в повторяющихся играх на сопоставление пенсов». Игры и экономическое поведение. 71: 88–99. Дои:10.1016 / j.geb.2009.05.010.
- ^ Охс, Джек (1995). «Игры с уникальными смешанными стратегиями равновесия: экспериментальное исследование». Игры и экономическое поведение. 10: 202–217. Дои:10.1006 / игра.1995.1030.
- ^ Маккелви, Ричард; Палфри, Томас (1995). «Равновесия с квантовым откликом для игр нормальной формы». Игры и экономическое поведение. 10: 6–38. CiteSeerX 10.1.1.30.5152. Дои:10.1006 / игра.1995.1023.
- ^ Goeree, Jacob K .; Холт, Чарльз А .; Палфри, Томас Р. (2003). «Не склонное к риску поведение в обобщенных играх на совпадение пенсов» (PDF). Игры и экономическое поведение. 45: 97–113. Дои:10.1016 / s0899-8256 (03) 00052-6.
- ^ Вудерс, Джон; Шахат, Джейсон М. (2001). «О неуместности отношения к риску в повторных играх с двумя исходами». Игры и экономическое поведение. 34 (2): 342. Дои:10.1006 / игра.2000.0808. S2CID 2401322.
- ^ а б Chiappori, P .; Левитт, С.; Гросеклоуз Т. (2002). «Проверка равновесия смешанной стратегии, когда игроки неоднородны: случай штрафных ударов в футболе» (PDF). Американский экономический обзор. 92 (4): 1138–1151. CiteSeerX 10.1.1.178.1646. Дои:10.1257/00028280260344678. JSTOR 3083302.
- ^ а б Паласиос-Уэрта, И. (2003). «Профессионалы играют в Минимакс». Обзор экономических исследований. 70 (2): 395–415. CiteSeerX 10.1.1.127.9097. Дои:10.1111 / 1467-937X.00249.
- ^ Также есть вариант пнуть / стоять посередине, но он используется реже.
- ^ Уокер, Марк; Вудерс, Джон (2001). «Minimax Play на Уимблдоне». Американский экономический обзор. 91 (5): 1521–1538. CiteSeerX 10.1.1.614.5372. Дои:10.1257 / aer.91.5.1521. JSTOR 2677937.