Рационализируемость - Rationalizability
Рационализируемость | |
---|---|
А концепция решения в теория игры | |
Отношение | |
Надмножество | равновесие по Нэшу |
Значимость | |
Предложено | Д. Бернхейм и Д. Пирс |
Пример | Соответствующие пенни |
В теория игры, рационализируемость это концепция решения. Общая идея состоит в том, чтобы обеспечить самые слабые ограничения для игроков, при этом требуя, чтобы игроки рациональный и эта рациональность всем известный факт среди игроков. Это более снисходительно, чем равновесие по Нэшу. Оба требуют, чтобы игроки оптимально реагировали на некоторые убеждения о действиях их оппонентов, но равновесие по Нэшу требует, чтобы эти убеждения были правильными, а рациональность - нет. Рационализируемость была впервые независимо определена Бернхеймом (1984) и Пирсом (1984).
Определение
Учитывая игра в нормальной форме, рационализируемый набор действий можно вычислить следующим образом: Начните с полного набора действий для каждого игрока. Затем удалите все действия, которые никогда не являются лучшим ответом на какое-либо мнение о действиях оппонентов - мотивация для этого шага заключается в том, что ни один рациональный игрок не может выбрать такие действия. Затем удалите все действия, которые никогда не являются лучшим ответом на какое-либо мнение о противниках. осталось действия - этот второй шаг оправдан, потому что каждый игрок знает что другие игроки рациональны. Продолжайте процесс, пока не прекратите дальнейшие действия. В игре с конечным числом действий этот процесс всегда завершается и оставляет непустой набор действий для каждого игрока. Это рациональные действия.
Ограничения на убеждения
А | B | |
---|---|---|
а | 1, 1 | 0, 0 |
б | 0, 0 | 1, 1 |
Рассмотрим простой координационная игра (в матрица выплат находится справа). Рядовой игрок может играть а если он может разумно полагать, что игрок колонны может играть А, поскольку а это лучший ответ к А. Он может обоснованно полагать, что игрок колонны может играть А если игрок столбца имеет основания полагать, что игрок строки может играть а. Она может поверить, что он будет играть а если для нее есть основания полагать, что он мог играть а, так далее.
C | D | |
---|---|---|
c | 2, 2 | 0, 3 |
d | 3, 0 | 1, 1 |
Это обеспечивает бесконечную цепочку последовательных убеждений, в результате которых игроки играют (а, А). Это делает (а, А) рациональную пару действий. Аналогичный процесс можно повторить для (б, B).
В качестве примера, когда не все стратегии можно рационализировать, рассмотрим Дилемма заключенного на фото слева. Рядовой игрок никогда не будет играть c, поскольку c не лучший ответ на любую стратегию игрока колонны. По этой причине, c не поддается рационализации.
L | р | |
---|---|---|
т | 3, - | 0, - |
м | 0, - | 3, - |
б | 1, - | 1, - |
И наоборот, для игр двух игроков набор всех рационализируемых стратегий может быть найден путем повторного исключения строго доминируемых стратегий. Однако для того, чтобы этот метод работал, необходимо также учитывать строгое господство смешанные стратегии. Рассмотрим игру справа, в которой для простоты опущены выплаты игрока из столбца. Обратите внимание, что «b» не находится под строгим преобладанием ни «t», ни «m» в смысле чистой стратегии, но все же преобладает стратегия, которая смешала бы «t» и «m» с вероятностью каждого, равной 1 / 2. Это связано с тем, что при любом представлении о действиях игрока в столбце смешанная стратегия всегда будет давать более высокий ожидаемый выигрыш.[1] Это означает, что «b» не поддается рационализации.
Более того, «б» не является лучший ответ либо "L", либо "R", либо любое их сочетание. Это связано с тем, что действие, которое невозможно рационализировать, никогда не может быть лучшим ответом на любую стратегию оппонента (чистую или смешанную). Это подразумевает другую версию предыдущего метода поиска рационализируемых стратегий, таких как стратегии, которые выживают после повторного исключения стратегий, которые никогда не являются лучшим ответом (в чистом или смешанном смысле).
Однако в играх с более чем двумя игроками могут быть стратегии, в которых нет строгого доминирования, но которые никогда не могут быть лучшим ответом. Путем повторного исключения всех таких стратегий можно найти рациональные стратегии для многопользовательской игры.
Рационализируемость и равновесия по Нэшу
Легко доказать, что любое равновесие по Нэшу является рациональным равновесием; однако обратное неверно. Некоторые рациональные равновесия не являются равновесиями по Нэшу. Это делает концепцию рационализируемости обобщением концепции равновесия по Нэшу.
ЧАС | Т | |
---|---|---|
час | 1, -1 | -1, 1 |
т | -1, 1 | 1, -1 |
В качестве примера рассмотрим игру совпадающие пенни на фото справа. В этой игре единственное равновесие по Нэшу - это игра в ряд. час и т с равной вероятностью и игрой по столбцу ЧАС и Т с равной вероятностью. Однако все чистые стратегии в этой игре можно рационализировать.
Рассмотрим следующую аргументацию: строка может играть час если для нее есть основания полагать, что эта колонка будет играть ЧАС. Колонка может играть ЧАС если для него разумно полагать, что эта строка сыграет т. Ряд может играть т если для нее есть основания полагать, что эта колонка будет играть Т. Колонка может играть Т если у него есть основания полагать, что эта строка сыграет час (начало цикла снова). Это обеспечивает бесконечный набор последовательных убеждений, что приводит к игре в ряд. час. Аналогичный аргумент можно привести для игры в ряд т, а для воспроизведения в колонке либо ЧАС или же Т.
Смотрите также
Сноски
- ^ Гиббонс, Роберт (1992). Учебник по теории игр. С. 32–33.
Рекомендации
- Бернхейм, Д. (1984) Рационализируемое стратегическое поведение. Econometrica 52: 1007-1028.
- Фуденберг, Дрю и Жан Тироль (1993) Теория игры. Кембридж: MIT Press.
- Пирс, Д. (1984) Рационализируемое стратегическое поведение и проблема совершенства. Econometrica 52: 1029-1050.
- Рэтклифф, Дж. (1992–1997), конспекты лекций по теории игр, §2.2: «Повторяющееся господство и рациональность»