Динамическое принятие решений - Dynamic decision-making

Динамическое принятие решений (DDM) взаимозависим принятие решений это происходит в среде, которая меняется с течением времени либо из-за предыдущих действий лица, принимающего решения, либо из-за событий, находящихся вне контроля лица, принимающего решения.^[1]^[2] В этом смысле динамические решения, в отличие от простых и обычных одноразовых решений, обычно более сложны, принимаются в реальном времени и включают наблюдение за тем, в какой степени люди могут использовать свой опыт для управления конкретным сложная система, в том числе виды опыта, которые со временем приводят к лучшим решениям.^[3]

Обзор

Исследование динамического принятия решений использует компьютерное моделирование которые являются лабораторными аналогами для реальных ситуаций. Эти компьютерные симуляции также называют «микромирами».^[4] и используются для изучения поведения людей в смоделированных условиях реального мира, где люди обычно пытаются управлять сложной системой, в которой на более поздние решения влияют более ранние решения.^[5] Следующее отличает исследования DDM от более классических форм исследования принятия решений в прошлом:

Использование серии решений для достижения цели в DDM в отличие от одного решения
В межзависимость решений от предыдущих решений в DDM в отличие от их независимости от предыдущих решений
Динамический характер изменяющейся среды в DDM в отличие от статической фиксированной среды, которая не меняется
Тот факт, что решения в задачах DDM принимаются в режиме реального времени, в отличие от ситуаций без цейтнота

Кроме того, использование микромиров в качестве инструмента для исследования DDM не только обеспечивает экспериментальный контроль для исследователей DDM, но также делает область DDM современной в отличие от классических исследований принятия решений, которые очень старые.

Примеры ситуаций принятия динамических решений включают управление изменением климата, производство и инвентаризацию заводов, управление воздушным движением, пожаротушение и вождение автомобиля, военное командование и контроль на поле боя. Исследования в области DDM были сосредоточены на изучении того, в какой степени лица, принимающие решения, используют свой опыт для управления конкретной системой; факторы, лежащие в основе приобретения и использования опыта при принятии решений; и тип опыта, который приводит к лучшим решениям в динамических задачах.

Характеристики динамической среды принятия решений

Основными характеристиками динамической среды принятия решений являются динамика, сложность, непрозрачность и динамическая сложность. Динамика окружающей среды относится к зависимости состояния системы от ее состояния в более раннее время. Динамика в системе может определяться положительный отзыв (самоусиливающиеся петли) или негативный отзыв (самокорректирующиеся петли), примерами которых могут быть начисление процентов на сберегательный банковский счет или утоление голода вследствие приема пищи соответственно.

Сложность в значительной степени относится к количеству взаимодействующих или взаимосвязанных элементов в системе, которые могут затруднить прогнозирование поведения системы. Но определение сложности все еще может иметь проблемы, поскольку компоненты системы могут различаться с точки зрения количества компонентов в системе, количества взаимосвязей между ними и характера этих взаимосвязей. Сложность также может быть функцией способности лица, принимающего решения.

Непрозрачность относится к физической невидимости некоторых аспектов динамической системы, и она также может зависеть от способности лица, принимающего решения, получить знания о компонентах системы.

Под динамической сложностью понимается способность лица, принимающего решения, управлять системой, используя обратную связь, которую лицо, принимающее решение, получает от системы. Диль и Стерман^[6] далее разбили динамическую сложность на три компонента. Непрозрачность, присутствующая в системе, может вызвать непредвиденные побочные эффекты. Между компонентами системы могут быть нелинейные отношения и задержки обратной связи между предпринятыми действиями и их результатами. Динамическая сложность системы может в конечном итоге затруднить принятие решений лицами, принимающими решения, для понимания системы и управления ею.

Микромиры в исследованиях DDM

Микромир - это сложное моделирование, используемое в контролируемых экспериментах, предназначенных для изучения динамического принятия решений. Исследования в области динамического принятия решений в основном проводятся в лабораториях и используют инструменты микромира компьютерного моделирования (например, игры принятия решений, DMGames). Микромиры также известны под другими названиями, в том числе синтетические рабочие среды, моделирование с высокой точностью, интерактивные учебные среды, виртуальные среды, и масштабные миры. Микромиры становятся лабораторными аналогами реальных ситуаций и помогают исследователям DDM изучать процесс принятия решений путем сжатия времени и пространства при сохранении экспериментального контроля.

DMGames сжимают наиболее важные элементы реальных проблем, которые они представляют, и являются важными инструментами для сбора данных о человеческих действиях. DMGames помогли исследовать множество факторов, таких как Познавательная способность, тип Обратная связь, время обратной связи, стратегии, используемые при принятии решений, и приобретение знаний при выполнении задач DDM. Однако, несмотря на то, что DMGames нацелены на представление основных элементов реальных систем, они во многих отношениях отличаются от реальных задач. Ставки могут быть выше в реальных задачах, и опыт лица, принимающего решения, часто приобретается в течение многих лет, а не минут, часов или дней, как в задачах DDM. Таким образом, DDM во многом отличается от натуралистическое принятие решений (NDM).

Было показано, что в задачах DDM люди работают ниже оптимального уровня производительности, если оптимальный может быть установлен или известен. Например, в игре-симуляторе тушения лесных пожаров участники часто позволяли сжечь свои штаб-квартиры.^[7] В аналогичных исследованиях DDM участники, действующие как врачи в отделении неотложной помощи, позволяли своим пациентам умереть, пока они ждали результатов теста, которые на самом деле не были диагностическими.^[8]^[9] Интересный вывод о решениях из опыта DDM заключается в том, что в основном обучение неявно, и, несмотря на улучшение результатов в результате повторных испытаний, люди не могут выразить словами стратегию, которой они следовали для этого.^[10]

Теории обучения в задачах динамического принятия решений

Учусь является неотъемлемой частью исследования DDM. Одним из основных направлений исследовательской деятельности в DDM было изучение с помощью инструментов моделирования микромиров, в какой степени люди могут научиться управлять конкретной моделируемой системой, а также изучение факторов, которые могут объяснить обучение в задачах DDM.

Теория обучения на основе стратегии

Одна из теорий обучения основана на использовании стратегий или правил действий, связанных с конкретной задачей. Эти правила определяют условия, при которых будет применяться определенное правило или стратегия. Эти правила имеют форму: если вы распознаете ситуацию S, а затем выполните действие / стратегию A. Например, Anzai^[11] реализовал набор правила производства или стратегии, которые выполняли задачу DDM по ведению корабля через определенный набор ворот. Стратегии анзай достаточно хорошо подражали выполнению задачи участниками-людьми. Точно так же Ловетт и Андерсон^[12] показали, как люди используют производственные правила или стратегии типа «если - то» в задаче «Строительные палки», которая является изоморфом задачи Лурчина о кувшине с водой.^[13]^[14] Задача построения палочек состоит в том, чтобы сконструировать палочек определенной желаемой длины из трех палочек, из которых можно строить (существует неограниченный запас палочек каждой длины). В основном есть две стратегии, которые можно использовать для решения этой проблемы. Стратегия недовыстрела состоит в том, чтобы брать клюшки меньшего размера и наращивать их до целевой. Стратегия перерегулирования состоит в том, чтобы взять палку длиннее, чем цель, и отрезать куски, равные по длине меньшей палке, пока они не достигнут заданной длины. Ловетт и Андерсон организовали это так, чтобы только одна стратегия работала для конкретной проблемы, и давали испытуемым задачи, в которых одна из двух стратегий работала над большинством проблем (и она уравновешивала испытуемых, что было более успешной стратегией).

Теория обучения коннекционизму

Некоторые другие исследователи предположили, что обучение в задачах DDM можно объяснить теорией коннекционизма или коннекционизм. Связи между юнитами, сила или вес которых зависят от предыдущего опыта. Таким образом, выход данного блока зависит от выхода предыдущего блока, взвешенного по силе соединения. Например, Гибсон и др.^[15] показал, что коннекционистская модель машинного обучения нейронной сети хорошо справляется с объяснением человеческого поведения в задаче фабрики по производству сахара Берри и Бродбента.^{[требуется разъяснение ]}.

Теория обучения на основе экземпляров

В Теория обучения на основе экземпляров (IBLT) - это теория того, как люди принимают решения в динамических задачах, разработанная Клеотильдой Гонсалес, Кристианом Лебьером и Хавьером Лерхом.^[3] Клеотильда Гонсалес и Варун Датт расширили теорию на две разные парадигмы динамических задач, называемые выборкой и повторным выбором.^[16] Гонсалес и Датт ^[16] показали, что в этих динамических задачах IBLT дает лучшее объяснение человеческого поведения и работает лучше, чем многие другие конкурирующие модели и подходы. Согласно IBLT, люди полагаются на свой накопленный опыт, чтобы принимать решения, извлекая прошлые решения аналогичных ситуаций, хранящиеся в памяти. Таким образом, точность решений может улучшаться только постепенно и за счет взаимодействия с аналогичными ситуациями.

IBLT предполагает, что в памяти хранятся конкретные экземпляры, опыт или образцы.^[17] Эти экземпляры имеют очень конкретную структуру, определяемую тремя отдельными частями, которые включают ситуацию, решение и полезность (или SDU):

Ситуация относится к сигналам окружающей среды
Решение относится к действиям лица, принимающего решение, применительно к конкретной ситуации.
Под полезностью понимается правильность конкретного решения в данной ситуации, либо ожидаемая полезность (до принятия решения), либо опытная полезность (после получения обратной связи о результате решения).

В дополнение к предопределенной структуре экземпляра IBLT полагается на глобальный процесс принятия решений высокого уровня, состоящий из пяти этапов: распознавание, суждение, выбор, исполнение и обратная связь.^[16] Когда люди сталкиваются с ситуацией в конкретной среде, люди, вероятно, извлекут из памяти похожие примеры, чтобы принять решение. В нетипичных ситуациях (тех, которые не похожи ни на что из того, что встречалось в прошлом), извлечение из памяти невозможно, и людям нужно будет использовать эвристику (которая не полагается на память), чтобы принять решение. В типичных ситуациях, когда inss можно получить, оценка полезности подобных экземпляров происходит до тех пор, пока не будет преодолен уровень необходимости.^[16]

Необходимость обычно определяется «уровнем стремления» лица, принимающего решения, как у Саймона и Марча. удовлетворительный стратегия. Но уровень необходимости также может определяться внешними факторами окружающей среды, такими как временные ограничения (как в области медицины, когда врачи в отделении неотложной помощи лечат пациентов в критической по времени ситуации). Как только этот уровень необходимости пересечен, принимается решение с участием экземпляра с наивысшей полезностью. Результат решения, когда он получен, затем используется для обновления полезности экземпляра, который был использован для принятия решения в первую очередь (от ожидаемого до опытного). Предполагается, что этот общий процесс принятия решений применим к любой динамической ситуации принятия решений, когда решения принимаются на основе опыта.

Вычислительное представление IBLT опирается на несколько механизмов обучения, предложенных общей теорией познания, ACT-R. В настоящее время в IBLT реализовано множество задач по принятию решений, которые точно воспроизводят и объясняют поведение человека.^[18]^[19]

Темы исследований в области динамического принятия решений

Обратная связь в задачах динамического принятия решений

Несмотря на то что Обратная связь Было обнаружено, что вмешательства повышают производительность при выполнении задач DDM, а обратная связь по результатам работает для простых задач, требующих более низких когнитивных способностей и повторяющихся на практике.^[20] Например, IBLT предполагает, что в ситуациях DDM обучение только на основе обратной связи по результатам является медленным и в целом неэффективным.^[21]

Влияние задержек обратной связи в задачах DDM

Наличие задержек обратной связи в задачах DDM и ее неправильное восприятие участниками способствует неоптимальной производительности задач DDM.^[22] Такие задержки в обратной связи затрудняют понимание людьми отношений, которые управляют системной динамикой задачи, из-за задержки между действиями лиц, принимающих решения, и результатом динамической системы.

Знакомый пример эффекта задержки обратной связи - это Игра по раздаче пива (или пивная игра). В игру встроена временная задержка между размещением заказа ролью и приемом заказанных ящиков пива. Если у роли заканчивается пиво (т. Е. Не может удовлетворить текущий спрос клиента на ящики с пивом), налагается штраф в размере 1 доллара за ящик. Это может привести к затовариванию пива, чтобы удовлетворить любые непредвиденные потребности в будущем. Результаты, вопреки экономической теории, предсказывающей долгосрочное стабильное равновесие, показывают, что люди слишком много заказывают. Это происходит потому, что временная задержка между размещением заказа и получением инвентаря заставляет людей думать, что запасы заканчиваются по мере поступления новых заказов, поэтому они реагируют и размещают более крупные заказы. Как только они накапливают запасы и осознают поступающие заказы, они резко сокращают будущие заказы, что приводит к тому, что пивоваренная промышленность испытывает колеблющиеся модели избыточного и недостаточного заказа, то есть дорогостоящие циклы подъема и спада.

Подобные примеры эффектов задержки обратной связи были зарегистрированы среди пожарных в противопожарной игре под названием NEWFIRE в прошлом, где из-за сложности задачи и задержки обратной связи между действиями пожарных и результатами участники часто позволяли сжечь свой штаб. .

Эффекты пропорционального мышления в задачах DDM

Растущее количество данных о DDM указывает на то, что взрослые люди сталкиваются с серьезной проблемой в понимании некоторых основных строительных блоков простых динамических систем, включая запасы, приток и отток. Многие взрослые продемонстрировали неспособность интерпретировать основной принцип динамики: запас (или накопление) повышается (или падает), когда приток превышает (или меньше) отток. Эта проблема, получившая название «сбой потока запасов» (сбой SF), оказалась устойчивой даже в простых задачах с хорошо мотивированными участниками, в знакомых контекстах и упрощенных информационных дисплеях. Вера в то, что акции ведут себя как потоки, является распространенной, но ошибочной эвристикой (называемой «эвристикой корреляции»), которую люди часто используют при оценке нелинейных систем.^[23] Использование эвристики корреляции или пропорциональное рассуждение широко распространен в различных областях и оказался серьезной проблемой как для школьников, так и для образованных взрослых (Cronin et al. 2009; Larrick & Soll, 2008; De Bock 2002; Greer, 1993; Van Dooren et al., 2005; Van Dooren et al., 2006; Verschaffel et al., 1994).

Индивидуальные различия в DDM

Индивидуальное выполнение задач DDM сопровождается огромной вариативностью, которая может быть результатом разного уровня навыков и когнитивных способностей людей, которые взаимодействуют с задачами DDM. Несмотря на то что индивидуальные различия существуют и часто отображаются в задачах DDM, велась дискуссия о том, возникают ли эти различия в результате различий в когнитивных способностях. В некоторых исследованиях не удалось найти доказательств связи между когнитивными способностями, измеренными с помощью тестов интеллекта, и выполнением задач DDM. Но более поздние исследования утверждают, что этот недостаток связан с отсутствием надежных показателей производительности задач DDM.^[24]^[25]

Другие исследования показали связь между нагрузкой и когнитивными способностями.^[26] Было обнаружено, что участники с низкими способностями обычно уступают участникам с высокими способностями. В сложных условиях рабочей нагрузки участники с низкой способностью не показывают улучшения результатов ни на тренировках, ни на тестовых испытаниях. Факты показывают, что участники с низким уровнем способностей используют больше эвристика особенно когда задача требует более быстрых испытаний или ограниченного времени, и это происходит как во время обучения, так и в условиях тестирования.^[27]

DDM в реальном мире

Что касается DDM, использующего лабораторные инструменты микромира для исследования процесса принятия решений, то в последнее время в исследованиях DDM делается упор на принятие решений в реальном мире. Это не обесценивает лабораторные исследования, но раскрывает широкую концепцию исследования, лежащего в основе DDM. В условиях DDM в реальном мире люди больше интересуются такими процессами, как постановка целей, планирование, процессы восприятия и внимания, процессы прогнозирования, понимания и многие другие, включая внимание к обратной связи. Изучение этих процессов приближает исследования DDM к осведомленность о ситуации и экспертиза.

Например, в исследовании DDM было показано, что автомобилисты, имеющие более 10 лет опыта или знаний (с точки зрения стажа вождения), быстрее реагируют на опасности, чем водители со стажем менее трех лет.^[28] Кроме того, благодаря своему большему опыту, такие автомобилисты, как правило, более эффективно и действенно ищут признаки опасности, чем их не столь опытные коллеги.^[29] Способ объяснения такого поведения основан на предпосылке, что осознание ситуации в задачах DDM делает определенное поведение автоматическим для людей с опытом. В этом отношении поиск сигналов в окружающей среде, которые могут привести к опасностям для опытных автомобилистов, может быть автоматическим процессом, в то время как неосведомленность начинающих автомобилистов может привести их к сознательным неавтоматическим усилиям по поиску таких сигналов, ведущих к становитесь более склонными к опасностям, совсем не замечая их. Такое поведение также было зарегистрировано у пилотов и командиров взводов.^[30] Соображения новичков и опытных командиров взводов в боевом симуляторе виртуальной реальности показали, что больший опыт связан с более высокими навыками восприятия, более высокими навыками понимания. Таким образом, опыт решения различных задач DDM делает лицо, принимающее решения, более осведомленным о ситуации с более высоким уровнем навыков восприятия и понимания.

Смотрите также

Связанные поля

внешняя ссылка

[1] Бремер, Б. (1992). Динамическое принятие решений: человеческий контроль над сложными системами. Acta Psychologica, 81(3), 211–241.

[2] Эдвардс, W. (1962). Теория динамических решений и вероятностная обработка информации. Человеческий фактор, 4, 59–73.

[Gonzalez,_C._2003-3] а ^б Гонсалес, К., Лерх, Дж. Ф., и Лебьер, К. (2003). Экземплярное обучение в динамическом принятии решений. Когнитивная наука, 27(4), 591–635.

[4] Теркл, С. (1984). Второе «я»: компьютеры и человеческий дух. Лондон: Гранада.

[5] Гонсалес, К., Ванюков, П., и Мартин, М. К. (2005). Использование микромиров для изучения динамического принятия решений. Компьютеры в человеческом поведении, 21(2), 273–286.

[6] Дил Э. и Стерман Дж. Д. (1995). Влияние сложности обратной связи на принятие динамических решений. Организационное поведение и процессы принятия решений, 62(2), 198–215.

[7] Бремер Б. и Аллард Р. (1991). Принятие динамических решений в реальном времени: влияние сложности задачи и задержки обратной связи. В J. Rasmussen, B. Brehmer & J. Leplat (Eds.), Распределенное принятие решений: когнитивные модели для совместной работы. Чичестер: Вайли.

[8] Гонсалес, К., и Врбин, К. (2007). Динамическое моделирование медицинского диагноза: обучение в среде принятия медицинских решений и обучения MEDIC. В А. Хольцингере (ред.), Юзабилити и HCI для медицины и здравоохранения: Третий симпозиум рабочей группы по взаимодействию человека с компьютером и инженерии юзабилити Австрийского компьютерного общества, USAB 2007 (Том 4799, стр. 289–302). Германия: Springer.

[9] Клейнмунц, Д., и Томас, Дж. (1987). Ценность действий и умозаключений в динамическом принятии решений. Организационное поведение и процессы принятия решений, 62, 63–69.

[10] Берри, Б.С., и Бродбент, Д.Э. (1984). О связи между выполнением задания и связанными вербализуемыми знаниями. Ежеквартальный журнал экспериментальной психологии, 36А, 209–231.

[11] Анзай, Ю. (1984). Когнитивный контроль систем, управляемых событиями в реальном времени. Когнитивная наука, 8, 221–254.

[12] Ловетт, М.С., и Андерсон, Дж. Р. (1996). История успеха и текущий контекст в решении проблем: совокупное влияние на выбор оператора. Когнитивная психология, 31, 168–217.

[13] Лурчинс, А.С. (1942). Механизация в решении проблем. Психологические монографии, 54(248).

[14] Лурчинс, А.С., и Лурчинс, Э.Х. (1959). Жесткость поведения: вариационный подход к эффектам Einstellung. Юджин, штат Орегон: Книги Орегонского университета.

[15] Гибсон, Ф. П., Фичман, М., и Плаут, Д. С. (1997). Обучение в динамических задачах решения: вычислительная модель и эмпирические данные. Организационное поведение и процессы принятия решений, 71(1), 1–35.

[Gonzalez,_C._&_Dutt,_V._2011-16] а ^б ^c ^d Гонсалес, К., и Датт, В. (2011). Обучение на основе экземпляров: интеграция выборки и повторных решений на основе опыта. Психологическое обозрение, 118(4), 523-551.

[17] Динес, З., и Фэхи, Р. (1995). Роль конкретных экземпляров в управлении динамической системой. Журнал экспериментальной психологии: обучение, память и познание, 21(4), 848–862.

[18] Гонсалес, К., и Лебьер, К. (2005). Когнитивные модели принятия решений на основе экземпляров. В D. Zizzo & A. Courakis (Eds.), Передача знаний при принятии экономических решений. Пэлгрейв Макмиллан.

[19] Мартин, М. К., Гонсалес, К., и Лебьер, К. (2004). Учимся принимать решения в динамичной среде: ACT-R играет в пивную игру. В M. C. Lovett, C. D. Schunn, C. Lebiere & P. Munro (Eds.), Материалы Шестой Международной конференции по когнитивному моделированию (Том 420, стр. 178–183). Питтсбург, Пенсильвания: Университет Карнеги-Меллона / Университет Питтсбурга: Издательство Lawrence Erlbaum Associates.

[20] Клугер, А. Н. и ДеНиси, А. (1996). Влияние вмешательств с обратной связью на производительность: исторический обзор, метаанализ и предварительная теория вмешательства с обратной связью. Психологический вестник, 119(2), 254–284.

[21] Гонсалес, К. (2005). Поддержка принятия решений для задач динамического принятия решений в реальном времени. Организационное поведение и процессы принятия решений, 96, 142–154.

[22] Стерман, Дж. Д. (1989). Неправильное восприятие обратной связи при динамическом принятии решений. Организационное поведение и процессы принятия решений, 43(3), 301–335.

[23] Кронин, М., и Гонсалес, К., и Стерман, Дж. Д. (2009). Почему образованные взрослые не понимают накопления? Вызов исследователям, педагогам и гражданам. Организационное поведение и процессы принятия решений, 108(1), 116–130.

[24] Ригас, Г., Карлинг, Э., и Бремер, Б. (2002). Надежность и обоснованность показателей эффективности в микромирах. Интеллект, 30(5), 463–480.

[25] Гонсалес, К., Томас, Р. П., и Ванюков, П. (2005). Взаимосвязь между когнитивными способностями и динамичным принятием решений. Интеллект, 33(2), 169–186.

[26] Гонсалес, К. (2005b). Взаимосвязь между рабочей нагрузкой и когнитивными способностями при динамическом принятии решений. Человеческий фактор, 47(1), 92–101.

[27] Гонсалес, К. (2004). Обучение принятию решений в динамической среде: влияние ограничений по времени и когнитивных способностей. Человеческий фактор, 46(3), 449–460.

[28] Маккенна, Ф. П., и Крик, Дж. (1991). Опыт и знания в восприятии опасности. В G.B. Грейсон и Дж. Ф. Лестер (ред.), Поведенческие исследования в области безопасности дорожного движения (стр. 39–45). Кроуторн, Великобритания: Транспортная и дорожная исследовательская лаборатория.

[29] Хорсвилл, М.С., Маккенна, Ф.П. (2004). Способность водителей воспринимать опасность: осведомленность о ситуации на дороге. В S. Banbury & S. Tremblay (Eds.), Когнитивный подход к осознанию ситуации: теория и применение (стр. 155–175). Олдершот, Англия: Ашгейт.

[30] Эндсли, М. Р. (2006). Опыт и осведомленность о ситуации. В К. А. Эриксоне, Н. Чарнессе, П. Дж. Фельтовиче и Р. Р. Хоффмане (ред.), Кембриджский справочник опыта и профессиональных качеств (стр. 633–651). Кембридж: Издательство Кембриджского университета.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]