Теория поведенческих игр - Behavioral game theory
Теория поведенческих игр анализирует интерактивные стратегический решения и поведение с использованием методы из теория игры,[1] экспериментальная экономика, и экспериментальная психология. Эксперименты включают проверку отклонений от типичных упрощений экономической теории, таких как аксиома независимости[2] и пренебрежение альтруизм,[3] справедливость,[4] и обрамляющие эффекты.[5] Как исследовательская программа, предмет является разработкой последних трех десятилетий.[6]
Традиционная теория игр фокусируется на математической структуре равновесий и, как правило, использует базовый рациональный выбор, включающий полезность максимизация. Напротив, теория поведенческих игр фокусируется на том, как реальное поведение имеет тенденцию отклоняться от стандартных прогнозов: как мы можем объяснить и смоделировать эти отклонения и как мы можем сделать более точные прогнозы, используя более точные модели?[7] Выборы, изучаемые в теории поведенческих игр, не всегда рациональны и не всегда отражают выбор, максимизирующий полезность.[8]
Теория поведенческих игр использует лабораторные и полевые эксперименты, а также теоретическое и компьютерное моделирование.[8] В последнее время методы от машинное обучение были применены в работе на пересечении экономика, психология, и Информатика для улучшения предсказания и понимания поведения в играх.[9][10]
История
Теория поведенческих игр началась с работ Алле в 1953 г. и Эллсберга в 1961 г. Они открыли Парадокс Алле и Парадокс Эллсберга, соответственно.[7] Оба парадокса показывают, что выбор, сделанный участниками игры, не отражает выгоду, которую они ожидают получить от этого выбора. В 1970-х годах работы Вернона Смита показали, что экономические рынки можно исследовать экспериментально, а не только теоретически.[7] В то же время несколько экономистов провели эксперименты, обнаружившие вариации традиционных моделей принятия решений, таких как теория сожаления, теория перспектив, и гиперболическое дисконтирование.[7] Эти открытия показали, что лица, принимающие решения, принимают во внимание множество факторов при выборе. Например, человек может стремиться свести к минимуму количество сожалений, которые он испытает после принятия решения, и взвесить свои варианты, исходя из количества сожалений, которые он ожидает от каждого из них. Поскольку они ранее не изучались традиционной экономической теорией, такие факторы, как сожаление, а также многие другие, стимулировали дальнейшие исследования.
Начиная с 1980-х годов экспериментаторы начали исследовать условия, вызывающие расхождение рациональный выбор. Ультиматум и торги исследовали влияние эмоций на предсказания поведения оппонента. Один из самых известных примеров игры в ультиматум - телешоу. Сделка или нет в котором участники должны принимать решения о продаже или продолжении игры на основании денежных ультиматумов, данных им «банкиром». В этих играх также исследовалось влияние доверия на результаты принятия решений и поведение, направленное на максимизацию полезности.[11] Игры с общими ресурсами использовались для экспериментальной проверки того, как сотрудничество и социальная желательность влияют на выбор субъекта. Реальным примером игры с обычными ресурсами может быть решение гостя вечеринки взять с собой блюдо. На решения гостей будет влиять не только то, насколько они голодны, но и то, сколько общего ресурса, еды, осталось, и если гость считает, что другие будут осуждать их за то, что они съели больше. Экспериментаторы в этот период считали поведение, не обеспечивающее максимальной полезности, результатом ошибочных рассуждений участников.[7] На рубеже веков экономисты и психологи расширили это исследование. Модели на основе теория рационального выбора были адаптированы для отражения предпочтений лиц, принимающих решения, и попытки рационализировать выбор, не обеспечивающий максимальной полезности.[7]
Сравнение с традиционной теорией игр
Традиционная теория игр использует теоретические модели для определения наиболее выгодного выбора для всех участников игры.[12] Теория игр использует теорию рационального выбора наряду с предположениями, которые являются общеизвестными игроками, чтобы предсказать решения, максимизирующие полезность.[12] Это также позволяет игрокам предсказывать стратегии своих противников.[13] Традиционная теория игр - это прежде всего нормативная теория поскольку он пытается определить решение, которое должны выбрать рациональные игроки, но не пытается объяснить, почему было принято это решение.[13] Рациональность - это основное предположение теории игр, поэтому нет объяснений различным формам рациональных решений или иррациональных решений.[13]
Теория поведенческих игр - это прежде всего позитивная теория а не нормативная теория.[13] Положительная теория стремится описывать явления, а не предписывать правильные действия. Положительные теории должны быть проверены и могут быть доказаны как истинные, так и ложные. Нормативная теория субъективна и основана на мнениях. Из-за этого нормативные теории не могут быть доказаны истинными или ложными. Теория поведенческих игр пытается объяснить принятие решений с помощью экспериментальных данных.[13] Теория допускает рациональные и иррациональные решения, потому что и то, и другое проверяется с помощью реальных экспериментов. В частности, теория поведенческих игр пытается объяснить факторы, влияющие на решения в реальном мире.[13] Эти факторы не исследуются в области традиционной теории игр, но их можно постулировать и наблюдать с использованием эмпирических данных.[13] Результаты теории поведенческих игр будут иметь более высокую оценку. внешняя валидность и может быть лучше применен к поведению принятия решений в реальном мире.[13]
Примеры игр, используемых в исследованиях поведенческой теории игр
- Сигнальная игра
- Диктаторская игра[14][15]
- Ультиматум игра[14][15][16]
- Кейнсианский конкурс красоты[14][15]
- Игра в нормальной форме[14]
- Кооперативная игра[14]
- Игра по обмену подарками[14]
Факторы, влияющие на рациональность в играх
Верования
Предполагается, что представления о других людях в игре по принятию решений будут влиять на их способность делать рациональный выбор. Однако убеждения других также могут привести к отклонению экспериментальных результатов от равновесных решений, максимизирующих полезность. В эксперименте, проведенном Коста-Гомес (2008), участникам задавали вопросы об их убеждениях первого порядка о действиях своего оппонента перед завершением серии игр нормальной формы с другими участниками.[17] Участники соблюдали равновесие по Нэшу только в 35% случаев. Кроме того, участники только заявили, что их противники будут соблюдать равновесие традиционной теории игр в 15% случаев.[17] Это означает, что участники считали, что их противники будут менее рациональными, чем они были на самом деле. Результаты этого исследования показывают, что участники не выбирают действие, максимизирующее полезность, и ожидают, что их оппоненты поступят так же.[17] Кроме того, результаты показывают, что участники не выбрали действие, максимизирующее полезность, которое соответствовало их представлениям о действиях оппонента.[17] Хотя участники могли полагать, что их противник с большей вероятностью примет определенное решение, они все же принимали решения, как если бы их оппонент выбирал случайно.[17] Другое исследование, в котором изучались участники телешоу Deal or No Deal, обнаружило расхождения с рациональным выбором.[18] При прохождении игры участники с большей вероятностью основывали свои решения на предыдущих результатах.[18] Предотвращение риска уменьшается, когда ожидания участников не оправдались в игре. Например, субъект, получивший череду положительных результатов, с меньшей вероятностью согласился на сделку и закончил игру. То же самое можно сказать и о субъекте, который в начале игры испытал преимущественно отрицательные результаты.[18]
Социальное сотрудничество
Социальное поведение и сотрудничество с другими участниками - это два фактора, которые не моделируются в традиционной теории игр, но часто наблюдаются в экспериментальных условиях. В моделях принятия решений не учитывалась эволюция социальных норм, но эти нормы влияют на то, как реальные люди взаимодействуют друг с другом и делают выбор.[11] Одна из тенденций состоит в том, что человек решительно отвечает взаимностью.[11] Этот тип людей вступает в игру с предрасположенностью к сотрудничеству с другими игроками. Они будут повышать уровень своего сотрудничества в ответ на сотрудничество с другими игроками и снижать уровень своего сотрудничества, даже за свой счет, чтобы наказать игроков, которые не сотрудничают.[11] Это не поведение, направленное на максимизацию отдачи, поскольку сильный ответчик готов уменьшить свою отдачу, чтобы поощрять сотрудничество с другими.
Дюфвенберг и Кирхштайгер (2004) разработали модель, основанную на взаимности, названную равновесием последовательной взаимности. Эта модель адаптирует традиционную логику теории игр к идее о том, что игроки отвечают взаимностью в целях сотрудничества.[19] Модель использовалась для более точного прогнозирования экспериментальных результатов классических игр, таких как дилемма заключенного и игра с многоножкой. Рабин (1993) также создал равновесие справедливости, которое измеряет влияние альтруизма на выбор.[20] Он обнаружил, что когда игрок альтруистичен по отношению к другому игроку, второй игрок с большей вероятностью ответит на этот альтруизм взаимностью.[20] Это связано с идеей справедливости.[20] Равновесие справедливости принимает форму взаимного максимума, когда оба игрока выбирают результат, который приносит им обоим наибольшую пользу, или взаимного минимума, когда оба игрока выбирают исход, который больше всего вредит им обоим.[20] Эти равновесия также Равновесия по Нэшу, но они включают готовность участников к сотрудничеству и честной игре.
Стимулы, последствия и обман
Роль стимулов и последствий в принятии решений интересна теоретикам поведенческих игр, поскольку они влияют на рациональное поведение. Пост (2008) проанализировал поведение участников «Сделка или не сделка», чтобы сделать выводы о принятии решений, когда ставки высоки.[18] Изучение выбора конкурсанта позволило сделать вывод, что в последовательная игра с высокими ставками решения были основаны на предыдущих результатах, а не на рациональности.[18] Игроки, которые сталкиваются с чередой хороших исходов, в этом случае исключают из игры малоценные случаи, или игроки, столкнувшиеся с чередой плохих исходов, становятся менее склонными к риску.[18] Это означает, что игроки, которые имеют исключительно хорошие или исключительно плохие результаты, с большей вероятностью будут играть и продолжать играть, чем средние игроки. Удачливые или неудачливые игроки были готовы отклонить предложения на сумму, превышающую сто процентов ожидаемой стоимости их кейса, чтобы продолжить игру.[18] Это показывает переход от поведения, избегающего риска, к поведению, стремящемуся к риску. Это исследование выявляет поведенческие предубеждения, которые не учитываются традиционной теорией игр. Более рискованное поведение незадачливых участников может быть связано с эффектом безубыточности, который гласит, что игроки будут продолжать принимать рискованные решения, чтобы отыграть деньги.[18] С другой стороны, более рискованное поведение удачливых участников можно объяснить эффектом домашних денег, который гласит, что выигравшие игроки с большей вероятностью примут рискованные решения, потому что они считают, что играют не на свои деньги.[18] Этот анализ показывает, что стимулы влияют на рациональный выбор, особенно когда игроки принимают серию решений.
Стимулы и последствия также играют большую роль в обмане в играх. Гнизи (2005) изучал обман, используя дешевую игру «разговор отправитель-получатель».[21] В этом типе игры игрок получает информацию о выплатах по варианту А и варианту Б. Затем первый игрок дает рекомендации второму игроку о том, какой вариант выбрать. Первый игрок может обмануть второго игрока, а второй игрок может отказаться от его совета. Гнизи обнаружил, что участники более чувствительны к своей выгоде от лжи, чем к поражению оппонента.[21] Он также обнаружил, что участники не были полностью эгоистичны и заботились о том, сколько их оппоненты потеряли от их обмана, но этот эффект уменьшался по мере увеличения их собственных выплат.[21] Эти результаты показывают, что лица, принимающие решения, рассматривают как стимулы лгать, так и последствия лжи, чтобы решить, лгать или нет. В целом люди не любят лгать, но при наличии правильных стимулов они склонны игнорировать последствия.[21] Ван (2009) также использовал дешевую разговорную игру, чтобы изучить обман у участников, у которых есть стимул к обману.[22] Используя отслеживание взгляда, он обнаружил, что участники, получившие информацию о выплатах, в два раза чаще, чем их оппоненты, сосредотачивались на собственном выигрыше.[22] Это предполагает минимальное стратегическое мышление. Кроме того, зрачки участников расширились, когда они послали обман, и они расширились еще больше, когда они рассказали большую ложь.[22] С помощью этих физических сигналов Ван пришел к выводу, что обман когнитивно сложно.[22] Эти результаты показывают, что такие факторы, как стимулы, последствия и обман, могут привести к иррациональным решениям и повлиять на ход игры.
Групповые решения
Теория поведенческих игр рассматривает влияние групп на рациональность. В реальном мире многие решения принимаются командами, но традиционная теория игр использует человека в качестве лица, принимающего решения. Это создало потребность в моделировании группового поведения при принятии решений. Борнштейн и Янив (1998) исследовали разницу в рациональности между группами и отдельными людьми в игре ультиматумов.[23] В этой игре первый игрок (или группа один) решает, какой процент выплаты отдать второму игроку (или группе два), а затем второй игрок решает, принять или отклонить это предложение. Участники группового условия были разделены на группы по три человека и позволили обдумать свои решения.[23] Совершенно рационально в этой игре было бы, если бы первый игрок не предлагал второму игроку никакой выплаты, но это почти никогда не бывает в случае наблюдаемых предложений. Борнштейн и Янив обнаружили, что группы были менее щедрыми, готовы отдать меньшую часть выигрыша при условии «один игрок» и более склонны принимать низкие предложения при условии «второй игрок», чем отдельные лица.[23] Эти результаты показывают, что группы более рациональны, чем отдельные лица.[23]
Кохер и Саттер (2005) использовали игру-конкурс красоты для изучения и сравнения индивидуального и группового поведения.[24] Конкурс красоты - это игра, в которой все участники выбирают число от нуля до ста. Победителем становится участник, который выбирает число, наиболее близкое к двум третям среднего числа. В первом раунде рациональным выбором будет тридцать три, так как это две трети среднего числа, пятьдесят. Учитывая бесконечное количество раундов, все участники должны выбрать ноль согласно теории игр. Кочер и Саттер обнаружили, что в первом раунде игры группы не действовали более рационально, чем отдельные участники.[24] Однако в последующих раундах группы выступали более рационально, чем отдельные участники.[24] Это показывает, что группы могут изучать игру и адаптировать свою стратегию быстрее, чем отдельные лица.
Смотрите также
Рекомендации
- ^ Р. Дж. Ауманн (2008). "теория игры," Новый экономический словарь Пэлгрейва, 2-е издание. Абстрактный.
- ^ Камерер, Колин; Хо, Тек-Хуа (март 1994 г.). «Нарушение аксиомы промежуточности и нелинейности в вероятности». Журнал рисков и неопределенностей. 8 (2): 167–196. Дои:10.1007 / bf01065371. S2CID 121396120.CS1 maint: ref = harv (связь)
- ^ Джеймс Андреони и другие. (2008). «альтруизм в экспериментах», Новый экономический словарь Пэлгрейва, 2-е издание. Абстрактный.
- ^ Х. Пейтон Янг (2008). "социальные нормы," Новый экономический словарь Пэлгрейва, 2-е издание. Абстрактный.
- ^ Камерер, Колин (1997). «Прогресс в теории поведенческих игр». Журнал экономических перспектив. 11 (4): 172. Дои:10.1257 / jep.11.4.167. Архивировано из оригинал на 2017-12-23. Получено 2015-04-27.CS1 maint: ref = harv (связь) Версия в формате PDF.
- ^ • Камерер, Колин (2003). Теория поведенческих игр: эксперименты в стратегическом взаимодействии. Нью-Йорк, Нью-Йорк, Принстон, Нью-Джерси: Фонд Рассела Сейджа, Издательство Принстонского университета. ISBN 9780691090399. Описание, предварительный просмотр ([ctrl] +) и гл. 1 связь.
* _____, Джордж Лёвенштейн, и Мэтью Рабин, изд. (2003). Успехи в поведенческой экономике, Принстон. Статьи 1986–2003 гг. Описание, содержание, и предварительный просмотр.
* Дрю Фуденберг (2006). "Продвигаясь дальше Достижения в Поведенческая экономика," Журнал экономической литературы, 44 (3), с. 694 –711.
* Винсент П. Кроуфорд (1997). «Теория и эксперимент в анализе стратегического взаимодействия». Успехи в экономике и эконометрике: теория и приложения, стр. 206–242. Кембридж. Перепечатано в Camerer и другие. (2003), Успехи в поведенческой экономике, Принстон, гл. 12.
* Мартин Шубик (2002). «Теория игр и экспериментальные игры», под ред. Р. Аумана и С. Харта, Справочник по теории игр с экономическими приложениями, Elsevier, v. 3, pp. 2327–2351. Абстрактный.
• Чарльз Р. Плотт и Вернон Л. Смит, изд. (2008). Справочник результатов экспериментальной экономики, v. 1, Elsevier, Часть 4, Игры предварительный просмотр и гл. 45–66 превью ссылки.
* Игры и экономическое поведение, Эльзевир. Цели и масштабы. - ^ а б c d е ж Гинтис, Х. (2005). Теория поведенческих игр и современная экономическая теория. Анализируйте и Критик, 27 (1), 48-72.
- ^ а б Камерер, К. (2003). Поведенческая теория игр: эксперименты в стратегическом взаимодействии. Издательство Принстонского университета.
- ^ Райт, Джеймс Р. и Кевин Лейтон-Браун (2014). «Мета-модели уровня 0 для прогнозирования поведения человека в играх». Труды пятнадцатой конференции ACM по экономике и вычислениям.CS1 maint: несколько имен: список авторов (связь)
- ^ Фуденберг, Дрю; Лян, Энни (2019-12-01). «Прогнозирование и понимание начальной игры» (PDF). Американский экономический обзор. 109 (12): 4112–4141. Дои:10.1257 / aer.20180654. ISSN 0002-8282.
- ^ а б c d Гинтис, Х. (2009). Границы разума: теория игр и объединение наук о поведении. Издательство Принстонского университета.
- ^ а б Осборн, М. Дж., И Рубинштейн, А. (1994). Курс теории игр. Пресса MIT.
- ^ а б c d е ж грамм час Колман, А. М. (2003). Кооперация, психологическая теория игр и ограничения рациональности в социальном взаимодействии. Науки о поведении и мозге, 26 (02), 139-153.
- ^ а б c d е ж Gächter, Саймон. «Теория поведенческих игр» (PDF). ict.usc.edu. Получено 18 декабря 2018.
- ^ а б c Camerer, Колин (1997). «Прогресс в теории поведенческих игр». Журнал экономических перспектив. 11 (4): 167–188. Дои:10.1257 / jep.11.4.167. S2CID 16850487.
- ^ «(Поведенческая) теория игр». behaviorioraleconomics.com. Получено 18 декабря 2018.
- ^ а б c d е Коста-Гомес, М. А., и Вайцзекер, Г. (2008). Заявленные убеждения и игра в игры нормальной формы. Обзор экономических исследований, 75 (3), 729-762.
- ^ а б c d е ж грамм час я Пост, Т., Ван ден Ассем, М. Дж., Балтуссен, Г., и Талер, Р. Х. (2008). Сделка или нет? Принятие рискованных решений в крупномасштабном игровом шоу. Американский экономический обзор, 38-71.
- ^ Дуфвенберг, М., и Кирхштайгер, Г. (2004). Теория последовательной взаимности. Игры и экономическое поведение, 47 (2), 268-298.
- ^ а б c d Рабин, М. (1993). Включение справедливости в теорию игр и экономику. Американский экономический обзор, 1281–1302 гг. (Включает социальные мотивы в процесс принятия решений по теории игр)
- ^ а б c d Гнизи, У. (2005). Обман: роль последствий. Американский экономический обзор, 384-394.
- ^ а б c d Ван, Дж. Т. Ю., Специо, М., и Камерер, К. (2009). Ученик Пиноккио: использование отслеживания взгляда и расширения зрачков, чтобы понять правду и обман в игре отправитель-получатель. Американский экономический обзор, готовится к печати.
- ^ а б c d Борнштейн, Г., Янив, И. (1998). Индивидуальное и групповое поведение в игре ультиматумов: являются ли группы более «рациональными» игроками ?. Экспериментальная экономика, 1 (1), 101-108.
- ^ а б c Кочер М. Г. и Саттер М. (2005). Важность принятия решений: индивидуальное и групповое поведение в экспериментальных играх-соревнованиях по красоте *. Экономический журнал, 115 (500), 200-223.