Сверхрациональность - Superrationality

В экономика и теория игры, участник считается имеющим сверхрациональность (или же перенормированная рациональность) если у них есть совершенная рациональность (и, таким образом, максимизируют их полезность), но предполагайте, что все другие игроки тоже сверхрациональны и что сверхрациональная личность всегда будет предлагать ту же стратегию, что и любой другой сверхрациональный мыслитель, когда сталкивается с той же проблемой. Применяя это определение, суперрациональный игрок, играющий против сверхрационального оппонента в Дилемма заключенного будут сотрудничать, в то время как рационально эгоистичный игрок уйдет.

Этот правило принятия решения не является основной моделью в теория игры и был предложен Дуглас Хофштадтер в своей статье, серии и книге Метамагические темы[1] как альтернативный тип рационального принимать решение отличается от широко распространенных теоретико-игровой один. Сверхрациональность - это форма Иммануил Кант с категорический императив,[2][3] и тесно связан с концепцией Кантовское равновесие предложенный экономистом и аналитический марксист Джон Ремер.[4] Хофштадтер дал такое определение: «Сверхрациональные мыслители, по рекурсивному определению, включают в свои вычисления тот факт, что они находятся в группе сверхрациональных мыслителей».[1] Это равносильно рассуждению о том, что все в группе подчиняются категорическому императиву Канта: «нужно предпринимать те действия, и только те действия, за которые он хотел бы выступать, все остальные также должны предпринимать».[4]

В отличие от Homo взаимно, сверхрациональный мыслитель не всегда будет играть в равновесие, которое максимизирует общую социальную полезность и, следовательно, не является филантроп.

Дилемма заключенного

Идея сверхрациональности состоит в том, что два логических мыслителя, анализирующих одну и ту же проблему, придут к одному и тому же правильному ответу. Например, если два человека хорошо разбираются в математике и оба получили одну и ту же сложную задачу, оба получат одинаковый правильный ответ. В математике знание того, что два ответа будут одинаковыми, не меняет ценности проблемы, но в теории игр знание того, что ответ будет одинаковым, может изменить сам ответ.

В Дилемма заключенного обычно формулируется в виде тюремного заключения для преступников, но с тем же успехом его можно сформулировать и с денежными призами. Каждому из двух игроков предоставляется выбор: сотрудничать (C) или дезертировать (D). Игроки выбирают, не зная, что собирается делать другой. Если оба будут сотрудничать, каждый получит по 100 долларов. Если они оба откажутся, каждый получит по 1 доллару. Если один сотрудничает, а другой отказывает, то проигравший игрок получает 200 долларов, а сотрудничающий игрок ничего не получает.

Четыре исхода и выплаты каждому игроку перечислены ниже.

Игрок B сотрудничаетДефекты игрока B
Игрок А сотрудничаетОба получают по 100 долларовИгрок A: 0 долларов
Игрок B: 200 долларов
Игрок А дефектыИгрок A: 200 долларов
Игрок B: 0 долларов
Оба получают 1 доллар

Один из действенных способов рассуждать для игроков заключается в следующем:

  1. Предполагая, что другой игрок ошибается, если я буду сотрудничать, я ничего не получу, а если я откажусь, я получу доллар.
  2. Предполагая, что другой игрок сотрудничает, я получаю 100 долларов, если я буду сотрудничать, и 200 долларов, если я откажусь.
  3. Итак, что бы ни делал другой игрок, мой выигрыш увеличивается за счет отказа, хотя бы на один доллар.

Вывод таков: разумнее всего отступить. Этот тип рассуждений определяет теоретико-игровую рациональность, и два теоретико-игровых рациональных игрока, играющих в эту игру, оба ошибаются и получают по доллару каждый.

Сверхрациональность - альтернативный метод рассуждений. Во-первых, предполагается, что ответ на симметричную задачу будет одинаковым для всех суперрациональных игроков. Таким образом учитывается одинаковость перед зная, какой будет стратегия. Стратегия находится путем максимизации выигрыша для каждого игрока при условии, что все они используют одну и ту же стратегию. Поскольку сверхрациональный игрок знает, что другой суперрациональный игрок сделает то же самое, что бы это ни было, есть только два варианта для двух сверхрациональных игроков. Оба будут сотрудничать или оба откажутся, в зависимости от ценности сверхрационального ответа. Таким образом, оба суперрациональных игрока будут сотрудничать, поскольку этот ответ максимизирует их выигрыш. Два суперрациональных игрока, играющих в эту игру, уйдут со 100 долларами каждый.

Обратите внимание, что суперрациональный игрок, играющий против теоретико-игрового рационального игрока, ошибается, поскольку стратегия только предполагает, что сверхрациональные игроки согласятся. Сверхрациональный игрок, играющий против игрока с неопределенной сверхрациональностью, будет иногда отказываться от него, а иногда сотрудничать, исходя из вероятности того, что другой игрок сверхрациональный.[нужна цитата ]

Хотя стандартная теория игр предполагает общепринятое знание рациональности, она делает это по-другому. Теоретико-игровой анализ максимизирует выигрыши, позволяя каждому игроку изменять стратегии независимо от других, даже если в конечном итоге он предполагает, что ответ в симметричной игре будет одинаковым для всех. Это определение теоретико-игрового равновесие по Нэшу, который определяет стабильную стратегию как стратегию, при которой ни один игрок не может улучшить выплаты, изменив курс в одностороннем порядке. Суперрациональное равновесие в симметричной игре - это такое, при котором стратегии всех игроков должны быть одинаковыми до шага максимизации. (Согласованного распространения концепции сверхрациональности на асимметричные игры нет.)

Некоторые утверждают, что сверхрациональность подразумевает своего рода магическое мышление в котором каждый игрок предполагает, что его решение сотрудничать заставит другого игрока сотрудничать, даже если нет связи. Хофштадтер отмечает, что концепция «выбора» неприменима, когда цель игрока состоит в том, чтобы что-то выяснить, и что решение не побуждает другого игрока к сотрудничеству, а скорее та же логика приводит к тому же ответу независимо от общения. или причина и следствие. Эти дебаты касаются того, разумно ли для людей действовать сверхрациональным образом, а не того, что означает сверхрациональность, и аналогичны спорам о том, разумно ли для людей действовать «рациональным» образом, как это описано в теории игр. (где они могут выяснить, что другие игроки сделают или сделают, спросив себя, что бы я сделал на их месте, и применив обратная индукция и повторное исключение доминирующих стратегий ).

Вероятностные стратегии

Для простоты предыдущее описание сверхрациональности игнорировалось. смешанные стратегии: возможность того, что лучшим выбором будет подбросить монетку или, в более общем смысле, выбрать разные исходы с некоторой вероятностью. в Дилемма заключенного, сверхрационально сотрудничать с вероятностью 1, даже когда допускаются смешанные стратегии, потому что средний выигрыш, когда один игрок сотрудничает, а другие дефекты такие же, как когда оба сотрудничают, и поэтому отказ увеличивает риск отказа обоих, что снижает ожидаемую выплату . Но в некоторых случаях сверхрациональная стратегия бывает смешанной.

Например, если выплаты следующие:

CC - 100 долларов США / 100 долларов США
CD - $ 0 / $ 1 000 000
DC - 1000000 долларов США / 0 долларов США
DD - 1 доллар / 1 доллар

Так что отказ приносит огромную награду, сверхрациональная стратегия - это отказ с вероятностью 499 900/99 9 899 или немногим более 49,995%. Когда вознаграждение увеличивается до бесконечности, вероятность приближается только к 1/2, а потери от принятия более простой стратегии 1/2 (которые уже минимальны) приближаются к нулю. В менее экстремальном примере, если выигрыш для одного кооператора и один перебежчик стоил 400 и 0 долларов соответственно, мир сверхрациональной смешанной стратегии будет сбегать с вероятностью 100/299 или около 1/3.

В подобных ситуациях с большим количеством игроков использование устройства рандомизации может быть важным. Одним из примеров, обсуждаемых Хофштадтером, является дилемма платонии: эксцентричный триллионер связывается с 20 людьми и говорит им, что если один и только один из них отправит ему или ей телеграмму (предположительно ничего не стоит) к полудню следующего дня, этот человек получит миллиард долларов. Если они получат более одной телеграммы или вообще не получат ни одной, никто не получит никаких денег, а общение между игроками запрещено. В этой ситуации суперрациональная вещь (если известно, что все 20 сверхрациональных) - это отправить телеграмму с вероятностью p = 1/20, то есть каждый получатель, по сути, выбрасывает 20-гранная матрица и отправляет телеграмму только в том случае, если выпадает «1». Это максимизирует вероятность того, что будет получена ровно одна телеграмма.

Заметьте, однако, что это не решение в традиционном теоретико-игровом анализе. Каждый из двадцати теоретически рациональных игроков отправит телеграммы и, следовательно, ничего не получит. Это потому, что отправка телеграмм - это доминирующая стратегия; если отдельный игрок отправляет телеграммы, у него есть шанс получить деньги, но если он не отправляет телеграмм, он ничего не может получить. (Если бы все телеграммы были гарантированы, они отправили бы только одну, и никто не ожидал бы получить никаких денег).

Смотрите также

Рекомендации

  1. ^ а б Хофштадтер, Дуглас (июнь 1983 г.). «Дилеммы для сверхрациональных мыслителей, ведущие к заманчивой лотерее». Scientific American. 248 (6). - перепечатано в: Хофштадтер, Дуглас (1985). Метамагические темы. Основные книги. С. 737–755. ISBN  0-465-04566-9.
  2. ^ Кэмпбелл, Пол Дж. (Январь 1984 г.). «Обзоры». Математический журнал. 57 (1): 51–55. Дои:10.2307/2690298. JSTOR  2690298.
  3. ^ Дикманн, Андреас (декабрь 1985 г.). «Дилемма волонтера». Журнал разрешения конфликтов. 29 (4): 605–610. Дои:10.1177/0022002785029004003. JSTOR  174243.
  4. ^ а б Ремер, Джон Э. (2010). «Кантовское равновесие». Скандинавский журнал экономики. 112 (1): 1–24. Дои:10.1111 / j.1467-9442.2009.01592.x. ISSN  1467-9442.