Мрачный спусковой крючок - Grim trigger
В теория игры, мрачный спусковой крючок (также называемый мрачная стратегия или просто мрачный) это стратегия запуска для повторной игры.
Первоначально игрок, использующий мрачный триггер, будет сотрудничать, но как только противник откажется (таким образом удовлетворяя условию триггера), игрок, использующий мрачный триггер, откажется от оставшейся части повторяющейся игры. Поскольку один-единственный дефект оппонента вызывает отступничество навсегда, мрачный спусковой крючок - самая жесткая из стратегий в повторяющейся игре.
В Роберт Аксельрод книга Эволюция сотрудничества мрачный триггер назван «Фридман» в статье Джеймса Фридмана 1971 года, в которой используется эта концепция.[1]
Бесконечно повторяющаяся дилемма заключенных
Бесконечно повторяющийся Дилемма заключенного - хорошо известный пример стратегии мрачного триггера. Обычная игра для двух заключенных выглядит следующим образом:
Заключенный B Заключенный А | Остается молчать (Сотрудничать) | Предать (дефект) |
Остается молчать (Сотрудничать) | 1, 1 | -1, 2 |
Предать (дефект) | 2, -1 | 0, 0 |
В дилемме заключенных у каждого игрока есть два варианта выбора на каждом этапе:
- Сотрудничать
- Дефект ради немедленной выгоды
Если игрок ошибается, он будет наказан до конца игры. На самом деле, обоим игрокам лучше молчать (сотрудничать), чем предавать друг друга, поэтому игра (C, C) - это кооперативный профиль во время игры (D, D), а также уникальный равновесие по Нэшу в этой игре - профиль наказания.
В стратегии мрачного триггера игрок сотрудничает в первом и последующих раундах до тех пор, пока его противник не нарушит соглашение. Как только игрок обнаруживает, что противник предал в предыдущей игре, он навсегда дезертирует.
Чтобы оценить идеальное равновесие в подиграх (SPE) для следующей мрачной триггерной стратегии игры стратегия S * для игроков я и j как следует:
- Играйте C в каждом периоде, если кто-то никогда не играл D в прошлом
- Играть D вечно, если кто-то играл в D в прошлом[2]
Тогда стратегия является SPE, только если коэффициент дисконтирования равен . Другими словами, ни Игрок 1, ни Игрок 2 не заинтересованы в отказе от профиля сотрудничества, если коэффициент скидки больше половины.[3]
Чтобы доказать, что стратегия является SPE, сотрудничество должно быть лучшим ответом на сотрудничество другого игрока, а отступление должно быть лучшим ответом на отступничество другого игрока.[2]
Шаг 1: Предположим, что D до сих пор не играл.
- Выплата игрока i от C:
- Выплата игрока i от D:
Тогда C лучше, чем D, если . Это показывает, что если , игра C - это Парето оптимальный.
Шаг 2: Предположим, что кто-то ранее играл D, тогда Игрок j будет играть D, несмотря ни на что.
- Выплата игрока i от C:
- Выплата игрока i от D:
С , игра D оптимальна.
Предыдущий аргумент подчеркивает, что нет стимула отклоняться (без выгодного отклонения) от профиля сотрудничества, если , и это верно для каждой вспомогательной игры. Следовательно, стратегия для бесконечно повторяющейся дилеммы заключенного - это идеальное равновесие по Нэшу.
В повторяющихся соревнованиях по стратегии дилеммы заключенного мрачный триггер плохо работает даже без шум, а добавление ошибок сигнала делает его еще хуже. Его способность угрожать безвозвратным бегством дает ему теоретически эффективный способ поддерживать доверие, но из-за его неумолимого характера и неспособности сообщить об этой угрозе заранее, он работает плохо.[4]
Мрачный спусковой крючок в международных отношениях
Под мрачным спусковым крючком с точки зрения международных отношений нация сотрудничает только в том случае, если ее партнер никогда не подвергался эксплуатации в прошлом. Поскольку нация будет отказываться от сотрудничества во все будущие периоды, если ее партнер однажды откажется от сотрудничества, бессрочное прекращение сотрудничества становится угрозой, которая делает такую стратегию ограничивающим случаем.[5] Хотя мрачный спусковой крючок - это ограничивающий случай, Народная теорема утверждает, что идеальное равновесие может быть достигнуто, если обе нации проявят терпение.[6]
Мрачный триггер во взаимодействии пользователя и сети
Теория игр недавно использовалась при разработке будущих систем связи, и пользователь в игре взаимодействия пользователя с сетью, использующий стратегию мрачного триггера, является одним из таких примеров.[7] Если решено использовать мрачный триггер в игре взаимодействия пользователя с сетью, пользователь остается в сети (сотрудничает), если сеть поддерживает определенное качество, но наказывает сеть, останавливая взаимодействие и покидая сеть, как только пользователь обнаруживает недостатки оппонента.[8] Антониу и др. поясняет, что «при такой стратегии у сети появляется более сильный стимул выполнять обещание, данное в отношении определенного качества, поскольку она сталкивается с угрозой навсегда потерять своего клиента».[7]
Сравнение с другими стратегиями
Око за око и стратегии мрачного триггера схожи по своей природе в том, что обе являются триггерной стратегией, когда игрок отказывается сначала отступить, если у него есть возможность наказать оппонента за отступление. Разница, однако, в том, что мрачный спусковой крючок требует максимального наказания за одно отступничество, в то время как «око за око» более снисходительно, предлагая одно наказание за каждое отступничество.[9]
Смотрите также
- Народная теорема (теория игр)
- Взаимно гарантированное разрушение
- Повторная игра
- Стратегия запуска
- Око за око
Рекомендации
- ^ Фридман, Джеймс У. (1971). «Некооперативное равновесие для суперигр». Обзор экономических исследований. 38 (1): 1–12. Дои:10.2307/2296617.
- ^ а б Аджемоглу, Дарон (2 ноября 2009 г.). «Повторные игры и сотрудничество».
- ^ Левин, Джонатан (май 2006 г.). «Повторные игры I: идеальный мониторинг» (PDF).
- ^ Аксельрод, Роберт (2000). «О шести достижениях в теории сотрудничества» (PDF). Получено 2007-11-02. (стр.13)
- ^ Макгилливра, Фиона; Смит, Аластер (2000). «Доверие и сотрудничество через агентурные наказания». Международная организация. 54 (4): 809–824. Дои:10.1162/002081800551370.
- ^ Фуденберг, Дрю; Маскин, Эрик (май 1986). «Народная теорема в повторяющихся играх с дисконтом или с неполной информацией». Econometrica. 54 (3): 533–554. CiteSeerX 10.1.1.308.5775. Дои:10.2307/1911307.
- ^ а б Антониу, Жозефина; Пападопулу, Вики (ноябрь 2009 г.). «Совместные пользовательско-сетевые взаимодействия в сетях связи нового поколения». Компьютерная сеть. 54 (13): 2239–2255. Дои:10.1016 / j.comnet.2010.03.013.
- ^ Антониу, Жозефина; Петрос А. Иоанну (2016). Теория игр в коммуникационных сетях: совместное решение сценариев интерактивных сетей. CRC Press. ISBN 9781138199385.
- ^ Баурманн, Майкл; Лейст, Антон (май 2016 г.). «О шести достижениях теории кооперации». Журнал философии и социальной теории. 22 (1): 130–151.