Теория принятия решений по информационным пробелам - Info-gap decision theory
Эта статья поднимает множество проблем. Пожалуйста помоги Улучши это или обсудите эти вопросы на страница обсуждения. (Узнайте, как и когда удалить эти сообщения-шаблоны) (Узнайте, как и когда удалить этот шаблон сообщения)
|
Теория принятия решений по информационным пробелам не вероятностный теория принятия решений который стремится оптимизировать надежность к неудаче - или возможности получить непредвиденный доход - при серьезном неуверенность,[1][2] в частности применение Анализ чувствительности из радиус устойчивости тип[3] к возмущениям в значении данной оценки интересующего параметра. Он имеет некоторые связи с Модель максимина Вальда; одни авторы различают их, другие считают примерами того же принципа.
Он был разработан с 1980-х годов компанией Яков Бен-Хаим,[4] и нашел много Приложения и описывается как теория принятия решений в разделе "суровый неуверенность ". Было критиковали как неподходящие для этой цели, и альтернативы предложены, в том числе такие классические подходы, как надежная оптимизация.
Резюме
Инфо-разрыв - это теория принятия решений: она направлена на помощь в принятии решений в условиях неопределенности. Для этого используются 3 модели, каждая из которых основана на последней. Каждый начинается с модель для ситуации, когда некоторые параметр или параметры неизвестны. оценивать для параметра, который предполагается равным существенно неверно, и один анализирует, как чувствительный в результаты под моделью относятся к ошибке в этой оценке.
- Модель неопределенности
- Начиная с оценки, модель неопределенности измеряет, насколько далеки другие значения параметра от оценки: по мере увеличения неопределенности набор возможных значений увеличивается - если одно из них это не уверены в оценке, какие еще параметры возможны?
- Модель устойчивости / возможностей
- Тогда, учитывая модель неопределенности и минимальный уровень желаемого результата, для каждого решения, насколько вы можете быть уверены в достижении этого минимального уровня? (Это называется надежность И наоборот, учитывая желаемый неожиданный исход, насколько вы должны быть не уверены в том, чтобы этот желаемый результат был возможен? (Это называется своевременность решения.)
- Модель принятия решений
- Чтобы принять решение, нужно оптимизировать либо надежность, либо возможности на основе модели устойчивости или возможности. Учитывая желаемый минимальный результат, какое решение является наиболее надежным (выдерживает наибольшую неопределенность) и все же дает желаемый результат ( надежно-удовлетворительное действие)? В качестве альтернативы, учитывая желаемый неожиданный исход, какое решение требует наименее неопределенность в отношении достижимости результата ( удачное действие)?
Модели
Теория информационного разрыва моделирует неопределенность (в горизонт неопределенности) как вложенные подмножества вокруг точечная оценка параметра: при отсутствии неопределенности оценка верна, а по мере увеличения неопределенности подмножество растет, как правило, без ограничений. Подмножества количественно определяют неопределенность - горизонт неопределенности измеряет "расстояние "между оценкой и возможностью - обеспечение промежуточной меры между одной точкой ( точечная оценка ) и вселенную всех возможностей, и дает меру для анализа чувствительности: насколько неопределенной может быть оценка и решение (основанное на этой неверной оценке) по-прежнему дает приемлемый результат - каков результат погрешность ?
Инфо-пробел - это местный теория принятия решений, начиная с оценки и рассматривая отклонения от него; это контрастирует с Глобальный такие методы как минимакс, который рассматривает анализ наихудшего случая по всему пространству результатов, и вероятностный теория принятия решений, который учитывает все возможные исходы и присваивает им некоторую вероятность. В информационном промежутке совокупность рассматриваемых возможных результатов представляет собой объединение всех вложенных подмножеств:
Анализ информационных пробелов дает ответы на такие вопросы, как:
- при каком уровне неопределенности могут быть надежно обеспечены конкретные требования (устойчивость), и
- какой уровень неопределенности необходим для достижения определенных неожиданностей (возможности).
Его можно использовать для удовлетворительный, как альтернатива оптимизация в присутствии неуверенность или же ограниченная рациональность; видеть надежная оптимизация для альтернативного подхода.
Сравнение с классической теорией принятия решений
В отличие от вероятностного теория принятия решений, анализ информационных пробелов не использует распределения вероятностей: он измеряет отклонение ошибок (разницы между параметром и оценкой), но не вероятность результатов - в частности, оценку ни в каком смысле не является более или менее вероятным, чем другие точки, поскольку информационный пробел не использует вероятность. Инфо-разрыв, не использующий распределения вероятностей, является надежным в том смысле, что он нечувствителен к предположениям о вероятностях результатов. Однако модель неопределенности включает понятие «более близких» и «более отдаленных» результатов и, таким образом, включает некоторые допущения, и не так надежна, как простое рассмотрение всех возможных результатов, как в минимаксе. Кроме того, он рассматривает фиксированную вселенную поэтому он не устойчив к неожиданным (не смоделированным) событиям.
Связь с минимакс Анализ вызвал некоторые противоречия: (Ben-Haim 1999, стр. 271–2) утверждает, что анализ устойчивости информационного разрыва, хотя и схож в некоторых отношениях, не является минимаксным анализом наихудшего случая, поскольку он не оценивает решения по всем возможным исходам. , в то время как (Снидович, 2007) утверждает, что анализ устойчивости можно рассматривать как пример максимина (не минимакса), применяемого для максимизации горизонта неопределенности. Это обсуждается в критика, ниже и подробно изложенные в перспектива классической теории принятия решений.
Базовый пример: бюджет
В качестве простого примера рассмотрим работника с неопределенным доходом. Они рассчитывают зарабатывать 100 долларов в неделю, в то время как, если они зарабатывают менее 60 долларов, они не смогут позволить себе жилье и будут спать на улице, а если они заработают более 150 долларов, они смогут позволить себе ночные развлечения.
Использование информационного пробела модель абсолютной ошибки:
куда можно было бы сделать вывод, что функция устойчивости рабочего составляет 40 долларов, а функция их возможности составляет 50 долларов: если они уверены, что заработают 100 долларов, они не будут ни спать на улице, ни пировать, и то же самое, если они зарабатывают в пределах 40 из 100 долларов. Однако, если они ошиблись в своих оценках более чем на 40 долларов, они могут оказаться на улице, а если они ошиблись более чем на 50 долларов, они могут оказаться в роскоши.
Как уже говорилось, этот пример только описательный, и не позволяет принимать какие-либо решения - в приложениях рассматриваются альтернативные правила принятия решений и часто ситуации с более сложной неопределенностью.
Теперь представьте, что рабочий думает о переезде в другой город, где работа платит меньше, но жилье дешевле. Скажем, здесь они подсчитали, что будут зарабатывать 80 долларов в неделю, но проживание стоит всего 44 доллара, а развлечения по-прежнему стоят 150 долларов. В этом случае функция устойчивости будет 36 долларов, а функция возможности - 70 долларов. Если они совершают одни и те же ошибки в обоих случаях, второй случай (переход) будет менее надежным и менее удачным.
С другой стороны, если измерить неопределенность относительный ошибка, используя модель дробной ошибки:
в первом случае надежность составляет 40%, а возможность - 50%, в то время как во втором случае надежность составляет 45%, а возможность - 87,5%, поэтому перемещение более надежный и менее подходящий.
Этот пример демонстрирует чувствительность анализа к модели неопределенности.
Информационные модели
Инфо-пробел может применяться к пространствам функций; в этом случае неопределенный параметр является функцией с оценкой а вложенные подмножества - это наборы функций. Один из способов описать такой набор функций - потребовать значения ты быть близким к значениям для всех Икс, используя семейство моделей информационного разрыва на значения.
Например, указанная выше модель дробной ошибки для значений становится моделью дробной ошибки для функций путем добавления параметра Икс к определению:
В более общем смысле, если является семейством моделей ценностей информационного пробела, то таким же образом получают модель информационного пробела функций:
Мотивация
В условиях неопределенности принято принимать решения.[примечание 1] Что можно сделать для принятия правильных (или, по крайней мере, наилучших возможных) решений в условиях неопределенности? Инфо-пробел надежность анализ оценивает каждое возможное решение, задавая вопрос: какое отклонение от оценки значения параметра, функции или набора разрешено и все же «гарантирует» приемлемую производительность? В повседневных терминах «надежность» решения определяется величиной отклонения от оценки, которая все еще приводит к производительности в пределах требований при использовании этого решения. Иногда трудно судить, какая надежность необходима или достаточна. Однако, согласно теории информационного разрыва, ранжирование возможных решений с точки зрения степени их надежности не зависит от таких суждений.
Теория информационного разрыва также предлагает своевременность функция, которая оценивает потенциал непредвиденных результатов в результате благоприятной неопределенности.
Пример: распределение ресурсов
Вот наглядный пример, который познакомит с основными концепциями теории информационного разрыва. Далее следует более подробное описание и обсуждение.
Распределение ресурсов
Предположим, вы являетесь менеджером проекта и руководите двумя командами: красной и синей. Каждая из команд по итогам года получит доход. Этот доход зависит от инвестиций в команду - чем больше инвестиций, тем выше доход. У вас ограниченное количество ресурсов, и вы хотите решить, как распределить эти ресурсы между двумя группами, чтобы общие доходы проекта были как можно выше.
Если у вас есть оценка корреляции между инвестициями в команды и их доходами, как показано на рисунке 1, вы также можете оценить общий доход как функцию распределения. Это проиллюстрировано на рисунке 2 - левая часть графика соответствует распределению всех ресурсов красной команде, а правая часть графика соответствует распределению всех ресурсов синей команде. Простая оптимизация покажет оптимальное распределение - распределение, которое, по вашей оценке функций дохода, принесет наибольший доход.
Введение неопределенности
Однако этот анализ не принимает во внимание неопределенность. Поскольку функции доходов являются лишь приблизительной оценкой (возможно, приблизительной), фактические функции доходов могут сильно отличаться. Для любого уровня неопределенности (или горизонт неопределенности) мы можем определить диапазон, в котором, как мы предполагаем, находятся фактические функции дохода. Более высокая неопределенность соответствует более всеобъемлющему диапазону. Два из этих диапазонов неопределенности, окружающие функцию дохода красной команды, представлены на рисунке 3. Как показано на рисунке 4, фактическая функция доходов может быть любой функцией в пределах заданного диапазона неопределенности. Конечно, некоторые примеры функций выручки возможны только при высокой неопределенности, тогда как небольшие отклонения от оценки возможны даже при небольшой неопределенности.
Эти конверты называются информационные пробелы модели неопределенности, поскольку они описывают понимание неопределенности, связанной с функциями доходов.
Из моделей информационного разрыва (или огибающих неопределенности) функций доходов мы можем определить модель информационного разрыва для общей суммы доходов. На рисунке 5 показаны два диапазона неопределенности, определенные моделью информационного разрыва для общей суммы доходов.
Надежность
Высокие доходы обычно приносят руководителю проекта уважение высшего руководства, но если общие доходы ниже определенного порога, это будет стоить руководителю проекта работы. Определим такой порог как критический доход, поскольку общий доход ниже критического будет считаться неудачным.
Для любого данного распределения надежность распределения по отношению к критическому доходу - это максимальная неопределенность, которая по-прежнему будет гарантировать, что общий доход превысит критический доход. Это показано на Рисунке 6. Если неопределенность увеличится, диапазон неопределенности станет более всеобъемлющим, чтобы включить в него экземпляры функции общего дохода, которая для конкретного распределения дает доход меньше критического дохода.
Надежность измеряет устойчивость решения к неудаче. А надежный сатисфер Лицо, принимающее решения, предпочитает более надежный выбор.
Если для некоторого распределения , проиллюстрирована корреляция между критическим доходом и надежностью, результат представляет собой график, несколько похожий на график на рисунке 7. Этот график называется кривая устойчивости распределения , имеет две важные особенности, общие для (большинства) кривых устойчивости:
- Кривая не увеличивается. Это отражает идею о том, что при более высоких требованиях (более высокий критический доход) невыполнение цели более вероятно (более низкая надежность). Это компромисс между качеством и надежностью.
- При номинальном доходе, то есть когда критический доход равен доходу согласно номинальной модели (оценка функций дохода), надежность равна нулю. Это связано с тем, что небольшое отклонение от оценки может снизить общий доход.
Если кривые устойчивости двух распределений, и Если сравнивать, то тот факт, что две кривые будут пересекаться, заметен, как показано на рисунке 8. В этом случае ни одно из распределений не является строго более устойчивым, чем другое: для критических доходов, меньших, чем точка пересечения, распределение надежнее, чем распределение , в то время как обратное верно для критических доходов выше точки пересечения. То есть предпочтение между двумя распределениями зависит от критерия неудачи - критического дохода.
Своевременность
Допустим, помимо угрозы потерять работу, высшее руководство предлагает вам пряник: если выручка выше чем какой-то доход, вы получите немалый бонус. Хотя доходы ниже этого дохода не будут считаться неудачей (поскольку вы все равно можете сохранить свою работу), более высокий доход будет считаться неожиданным успехом. Поэтому мы будем обозначать этот порог через непредвиденный доход.
Для любого данного распределения своевременность распределения по отношению к критическому доходу - это минимальная неопределенность, при которой общий доход может превысить критический доход. Это показано на рисунке 9. Если неопределенность уменьшится, диапазон неопределенности станет менее всеобъемлющим, чтобы исключить все экземпляры функции общего дохода, которая для конкретного распределения дает доход выше, чем непредвиденный доход.
Возможность можно рассматривать как невосприимчивость к неожиданному успеху. Следовательно, более низкие возможности предпочтительнее более высоких возможностей.
Если для некоторого распределения , мы проиллюстрируем корреляцию между непредвиденным доходом и надежностью, у нас будет график, в чем-то похожий на рисунок 10. Этот график называется кривая возможностей распределения , имеет две важные особенности, которые являются общими для (большинства) кривых возможности:
- Кривая не убывает. Это отражает идею о том, что, когда у нас более высокие требования (более высокий непредвиденный доход), мы более невосприимчивы к неудачам (более высокая возможность, что менее желательно). То есть нам нужно более существенное отклонение от оценки для достижения нашей амбициозной цели. Это компромисс между качеством и возможностями.
- При номинальном доходе, то есть, когда критический доход равен доходу в рамках номинальной модели (наша оценка функций дохода), возможность равна нулю. Это связано с тем, что для получения непредвиденного дохода не требуется отклонений от оценки.
Лечение серьезной неопределенности
Логика, лежащая в основе приведенной выше иллюстрации, заключается в том, что (неизвестный) истинный доход находится где-то в непосредственной близости от (известной) оценки дохода. Ведь если это не так, какой смысл проводить анализ исключительно в этом районе?
Таким образом, чтобы напомнить себе, что очевидная цель информационного разрыва - поиск надежных решений проблем, которые суровый неопределенности, поучительно показать при отображении результатов также те, которые связаны с истинный значение выручки. Конечно, с учетом серьезности неопределенности мы не знаем истинной ценности.
Однако мы знаем, что, согласно нашим рабочим предположениям, имеющаяся у нас оценка бедные указание истинной стоимости выручки и, вероятно, будет существенно неверно. Таким образом, с методологической точки зрения, мы должны отображать истинное значение на расстоянии от его оценки. На самом деле, было бы еще интереснее отобразить ряд возможные истинные значения.
Короче говоря, методически говоря картина такая:
Обратите внимание, что в дополнение к результатам, полученным с помощью оценки, два «возможных» истинных значения выручки также отображаются на расстоянии от оценки.
Как показано на рисунке, поскольку модель устойчивости к информационным пробелам применяет свой анализ Максимина в непосредственной близости от оценки, нет никакой гарантии, что анализ действительно проводится вблизи истинного значения выручки. Фактически, в условиях серьезной неопределенности это - с методологической точки зрения - очень маловероятно.
Возникает вопрос: насколько достоверны / полезны / значимы результаты? Разве мы не прячем под ковер серьезность неопределенности?
Например, предположим, что данное распределение оказывается очень хрупким в непосредственной близости от оценки. Означает ли это, что это распределение неустойчиво и в других регионах неопределенности? И наоборот, какова гарантия того, что распределение, устойчивое в окрестности оценки, также устойчиво в другом месте в области неопределенности, действительно, в окрестности истинного значения дохода?
Более фундаментально, учитывая, что результаты, генерируемые информационным пробелом, основаны на местный Анализ доходов / распределения в непосредственной близости от оценки, которая, вероятно, будет существенно неверной, у нас нет другого выбора - с методологической точки зрения - кроме предположения, что результаты, полученные в результате этого анализа, с одинаковой вероятностью будут существенно ошибочными. Другими словами, в соответствии с универсальным Мусор на входе - мусор на выходе Аксиома, мы должны предположить, что качество результатов, полученных с помощью анализа информационного разрыва, настолько же хорошо, насколько хорошо качество оценки, на которой основаны результаты.
Картина говорит сама за себя.
Тогда возникает то, что теория информационного разрыва еще не объяснила, каким образом она на самом деле пытается справиться с серьезностью рассматриваемой неопределенности. Последующие разделы этой статьи будут посвящены этому строгость проблема и ее методологические и практические последствия.
Более подробный анализ иллюстративной численной инвестиционной задачи этого типа можно найти в Sniedovich (2007).
Модели неопределенности
Информационные пробелы количественно оцениваются информационные пробелы модели неопределенности. Модель информационного разрыва - это неограниченное семейство вложенных множеств. Например, часто встречающийся пример - это семейство вложенных эллипсоиды все имеют одинаковую форму. Структура наборов в модели информационного зазора определяется информацией о неопределенности. В общих чертах, структура модели неопределенности информационного разрыва выбирается для определения наименьшего или самого строгого семейства наборов, элементы которого согласуются с априорной информацией. Поскольку, как правило, наихудший случай неизвестен, семейство множеств может быть неограниченным.
Типичным примером модели информационного разрыва является модель с дробной ошибкой. Наилучшая оценка неопределенной функции является , но дробная ошибка этой оценки неизвестна. Следующее неограниченное семейство вложенных наборов функций представляет собой модель информационного пробела с дробной ошибкой:
В любом горизонт неопределенности , набор содержит все функции чье дробное отклонение от не больше, чем . Однако горизонт неопределенности неизвестен, поэтому модель информационного разрыва представляет собой неограниченное семейство множеств, и нет наихудшего случая или наибольшего отклонения.
Есть много других типов моделей неопределенности информационного разрыва. Все модели информационных пробелов подчиняются двум основным аксиомы:
- Вложенность. Модель информационного разрыва вложено, если означает, что:
- Сокращение. Модель информационного разрыва представляет собой одноэлементный набор, содержащий его центральную точку:
Аксиома вложенности накладывает свойство «кластеризации», которое характерно для неопределенности информационного разрыва. Кроме того, аксиома вложенности подразумевает, что неопределенность устанавливает стать более инклюзивным, поскольку растет, тем самым давая с его значением как горизонт неопределенности. Аксиома сжатия подразумевает, что на горизонте неопределенности нуль оценка верно.
Напомним, что неопределенный элемент может быть параметром, вектором, функцией или набором. Модель информационного разрыва представляет собой неограниченное семейство вложенных наборов параметров, векторов, функций или наборов.
Подуровневые наборы
Для оценки с фиксированной точкой модель информационного разрыва часто эквивалентна функции определяется как:
что означает "неопределенность точки ты минимальная неопределенность такая, что ты входит в набор с этой неопределенностью ". В этом случае семейство множеств можно восстановить как подуровневые наборы из :
значение: "вложенное подмножество с горизонтом неопределенности состоит из всех точек с погрешностью меньше или равной ".
И наоборот, учитывая функцию удовлетворяющий аксиоме (эквивалентно, если и только если ), он определяет модель информационного зазора через наборы подуровней.
Например, если область неопределенности метрическое пространство, то функцией неопределенности может быть просто расстояние, поэтому вложенные подмножества просто
Это всегда определяет модель информационного зазора, поскольку расстояния всегда неотрицательны (аксиома неотрицательности) и удовлетворяет (аксиома сужения информационного разрыва), поскольку расстояние между двумя точками равно нулю тогда и только тогда, когда они равны (тождество неразличимых); вложение следует путем построения множества подуровней.
Не все модели информационного разрыва возникают как наборы подуровней: например, если для всех но не для (имеет неопределенность «чуть больше» 1), то указанный выше минимум не определен; можно заменить его инфимум, но тогда полученные наборы подуровней не будут согласовываться с моделью информационной щели: но Однако влияние этого различия очень незначительно, так как оно изменяет наборы менее чем путем изменения горизонта неопределенности на любое положительное число. хоть и маленький.
Надежность и гибкость
Неопределенность может быть либо пагубный или же благоприятный. То есть неопределенные вариации могут быть как неблагоприятными, так и благоприятными. Несчастье влечет за собой возможность неудачи, а благосклонность - это возможность добиться огромного успеха. Теория принятия решений о пропуске информации основана на количественной оценке этих двух аспектов неопределенности и выборе действия, которое затрагивает один или другой или оба из них одновременно. Пагубные и благоприятные аспекты неопределенности количественно выражаются двумя «функциями иммунитета»: функция устойчивости выражает невосприимчивость к неудачам, а функция благоприятности выражает невосприимчивость к непредвиденной выгоде.
Функции устойчивости и гибкости
В функция устойчивости выражает самый высокий уровень неопределенности, при котором отказ не может произойти; в функция возможности наименьший уровень неопределенности, который влечет за собой возможность быстрого успеха. Функции устойчивости и благоприятности обращаются, соответственно, к пагубным и благоприятным аспектам неопределенности.
Позволять быть вектором решения таких параметров, как проектные переменные, время инициирования, параметры модели или рабочие параметры. Мы можем словесно выразить функции устойчивости и гибкости как максимум или минимум набора значений параметра неопределенности. модели информационного разрыва:
(надежность) (1а) (своевременность) (2а)
Формально,
(надежность) (1b) (своевременность) (2b)
Мы можем «читать» ур. (1) следующим образом. Надежность вектора решения это наибольшее значение горизонта неопределенности для которых указаны минимальные требования всегда довольный. выражает надежность - степень устойчивости к неопределенности и невосприимчивости к сбоям - поэтому большое значение желательно. Устойчивость определяется как худший случай сценарий вплоть до горизонта неопределенности: насколько большим может быть горизонт неопределенности и все же, даже в худшем случае, достичь критического уровня результата?
Уравнение (2) заявляет, что возможность наименьший уровень неопределенности что необходимо терпеть, чтобы позволить возможность огромного успеха в результате решений . невосприимчивость к непредвиденной награде, поэтому небольшое значение желательно. Небольшая стоимость отражает удачную ситуацию, когда великая награда возможна даже при небольшой окружающей неопределенности. Возможность определяется как лучший случай сценарий вплоть до горизонта неопределенности: насколько малым может быть горизонт неопределенности и все же, в лучшем случае, получить непредвиденную награду?
Функции иммунитета и являются дополнительными и определены в антисимметричном смысле. Таким образом, «больше - лучше» для в то время как "большой вред" для . Функции невосприимчивости - надежность и возможность - являются основными функциями принятия решений в теории принятия решений по информационным промежуткам.
Оптимизация
Функция устойчивости подразумевает максимизацию, но не производительности или результата решения: в целом результат может быть сколь угодно плохим. Скорее, он максимизирует уровень неопределенности, который потребуется для неудачного результата.
Наибольшая допустимая неопределенность обнаружена при выборе решения удовлетворяет производительность на критическом уровне выживания. Среди доступных действий можно указать свои предпочтения. в соответствии с их надежностью , при этом более высокая надежность дает более высокие предпочтения. Таким образом, функция устойчивости лежит в основе алгоритма удовлетворительного решения, который максимизирует устойчивость к пагубной неопределенности.
Функция возможности в ур. (2) предполагает минимизацию, однако не, как можно было бы ожидать, ущерба, который может возникнуть в результате неизвестных нежелательных явлений. Ищется наименьший горизонт неопределенности, при котором решение дает (но не обязательно гарантирует) большой непредвиденный выигрыш. В отличие от функции устойчивости, функция возможности не удовлетворяет, она «неожиданно». Неожиданные предпочтения - это те, которые предпочитают действия, для которых функция возможности имеет небольшое значение. Когда используется для выбора действия один является «неожиданным», оптимизируя возможности из благоприятной неопределенности в попытке достичь очень амбициозных целей или вознаграждений.
Учитывая скалярную функцию вознаграждения , в зависимости от вектора решения и функция неопределенности информационного пробела , минимальное требование в ур. (1) заключается в том, что награда быть не ниже критического значения . Точно так же огромный успех в уравнении. (2) достижение уровня награды "самой безумной мечты" что намного больше, чем . Обычно ни одно из этих пороговых значений, и , выбирается безвозвратно перед выполнением анализа решения. Скорее, эти параметры позволяют лицу, принимающему решение, изучить ряд вариантов. В любом случае неожиданная награда больше, обычно намного больше, чем критическая награда :
Функции устойчивости и гибкости уравнений. (1) и (2) теперь могут быть выражены более явно:
(3) (4)
- максимальный уровень неопределенности, соответствующий гарантированному вознаграждению, не меньшему, чем критическое вознаграждение , пока - это наименьший уровень неопределенности, который необходимо принять, чтобы облегчить (но не гарантировать) непредвиденную прибыль в размере . Дополнительная или антисимметричная структура функций иммунитета очевидна из ур. (3) и (4).
Эти определения могут быть изменены для обработки многокритериальных функций вознаграждения. Аналогичным образом, аналогичные определения применяются, когда это потеря, а не награда.
Правила принятия решений
На основе этих функций затем можно выбрать курс действий путем оптимизации с учетом неопределенности: выбрать решение, которое является наиболее надежным (может выдерживать наибольшую неопределенность; «удовлетворительное»), или выбрать решение, которое требует наименьшей неопределенности для достижения неожиданная удача.
Формально оптимизация устойчивости или оптимизация возможностей дает отношение предпочтений по набору решений, а правило принятия решения это «оптимизировать с учетом этого предпочтения».
Ниже пусть быть набором всех доступных или возможных векторов решений .
Надежный
Функция устойчивости генерирует надежно удовлетворяющие предпочтения по вариантам: решения ранжируются в порядке возрастания надежности для данного критического вознаграждения, т. е. значение, значение если
Надежное решение - это решение, которое максимизирует надежность и производительность на критическом уровне .
Обозначим максимальную надежность как (формально для максимальной устойчивости для данной критической награды), и соответствующее решение (или решения) (формально, критическое оптимизирующее действие для данного уровня критического вознаграждения):
Обычно, хотя и не всегда, надежно-удовлетворительное действие зависит от критической награды .
Удачно-неожиданно
И наоборот, можно оптимизировать возможности: функция возможности генерирует удачные предпочтения по вариантам: решения ранжируются в уменьшение порядок благоприятности для данного непредвиденного вознаграждения, т.е. значение, значение если
Удачное решение, , сводит к минимуму функция возможности на множестве доступных решений.
Обозначим минимальную возможность как (формально для минимальной возможности для данного непредвиденного вознаграждения), и соответствующее решение (или решения) (формально, действие по оптимизации непредвиденного дохода для данного уровня непредвиденного вознаграждения):
Два рейтинга предпочтений, а также соответствующие оптимальные решения и , могут быть разными и могут отличаться в зависимости от значений и
Приложения
Теория информационного разрыва породила много литературы. Теория информационного разрыва изучалась или применялась в различных приложениях, включая инженерное дело. [5] [6][7][8][9][10][11][12][13][14][15][16],[17][18]биологическая консервация[19][20] [21][22][23][24][25][26][27][28],[29][30] теоретическая биология,[31] внутренняя безопасность,[32] экономика [33],[34][35] управление проектом [36][37][38]и статистика.[39] Также были изучены фундаментальные вопросы, связанные с теорией информационного разрыва.[40][41][42][43][44].[45]
В оставшейся части этого раздела более подробно описывается вид неопределенностей, устраняемых теорией информационного разрыва. Хотя ниже упоминаются многие опубликованные работы, здесь не делается попыток представить идеи из этих статей. Акцент делается не на разъяснении концепций теории информационного разрыва, а на контексте, в котором она используется, и целях.
Инженерное дело
Типичным инженерным приложением является анализ вибрации балки с трещиной, когда местоположение, размер, форма и ориентация трещины неизвестны и сильно влияют на динамику вибрации.[9] Об этих пространственных и геометрических неопределенностях обычно известно очень мало. Анализ информационных промежутков позволяет моделировать эти неопределенности и определять степень устойчивости к этим неопределенностям таких свойств, как амплитуда колебаний, собственные частоты и собственные формы колебаний. Другой пример - конструкция здания, подверженного неопределенным нагрузкам, например, от ветра или землетрясений.[8][10] Реакция конструкции сильно зависит от пространственного и временного распределения нагрузок. Тем не менее, штормы и землетрясения являются весьма своеобразными событиями, и взаимодействие между событием и структурой связано с очень специфическими механическими свойствами, которые редко известны. Анализ информационных пробелов позволяет проектировать конструкцию, чтобы повысить ее устойчивость к неопределенным отклонениям от проектных или расчетных нагрузок наихудшего случая.[нужна цитата ] Другое инженерное приложение включает разработку нейронной сети для обнаружения неисправностей в механической системе на основе измерений в реальном времени. Основная трудность заключается в том, что сбои очень идиосинкразичны, поэтому данные обучения нейронной сети будут иметь тенденцию существенно отличаться от данных, полученных от сбоев в реальном времени после обучения сети. Стратегия устойчивости информационного разрыва позволяет спроектировать нейронную сеть, которая будет устойчивой к несоответствию между данными обучения и будущими реальными событиями.[11][13]
Биология
Биологические системы намного сложнее и тоньше, чем наши лучшие модели, поэтому биолог-эколог сталкивается со значительными пробелами в информации при использовании биологических моделей. Например, Леви и другие. [19] использовать надежно-удовлетворительную «методологию для определения альтернатив управления, устойчивых к экологической неопределенности, но тем не менее отвечающих определенным социально-экономическим и экологическим целям». Они используют кривые устойчивости информационных пробелов, чтобы выбрать один из вариантов управления популяциями ели-почково-черных червей в Восточной Канаде. Бургман[46] использует тот факт, что кривые устойчивости различных альтернатив могут пересекаться, чтобы проиллюстрировать изменение предпочтений между стратегиями сохранения оранжевобрюхого попугая.
Управление проектом
Управление проектами - еще одна область, в которой часто встречается неопределенность, связанная с информационными пробелами. Менеджер проекта часто имеет очень ограниченную информацию о продолжительности и стоимости некоторых задач в проекте, а надежность информационных пробелов может помочь в планировании и интеграции проекта.[37] Финансовая экономика - еще одна область, в которой будущее чревато неожиданностями, которые могут быть как пагубными, так и благоприятными. Анализ устойчивости и возможности информационных пробелов может помочь в разработке портфолио, кредитное нормирование и другие приложения.[33]
Ограничения
Применяя теорию информационного разрыва, нужно помнить об определенных ограничениях.
Во-первых, информационный пробел делает предположения, а именно о рассматриваемой вселенной и степени неопределенности - модель информационного пробела - это модель степеней неопределенности или сходства различных предположений в пределах данной вселенной. Инфо-пробел не делает вероятностных предположений в этой вселенной - он не вероятностный - но дает количественную оценку понятия «расстояние от оценки». Короче говоря, информационный пробел делает меньше предположений, чем вероятностный метод, но делает некоторые предположения.
Далее, непредвиденные события (не во Вселенной ) не включены: информационные адреса смоделированный неопределенность, а не неожиданная неопределенность, как в теория черного лебедя, особенно нелепое заблуждение. Это не проблема, когда возможные события по определению попадают в данную вселенную, но в реальных приложениях значимые события могут быть «вне модели». Например, простая модель ежедневной доходности фондового рынка, которая по определению попадает в диапазон - может включать экстремальные движения, такие как Черный понедельник (1987) но может не смоделировать распад рынка после 11 сентября нападения: он считает "известные неизвестные", а не "неизвестные неизвестные ". Это общая критика многих теория принятия решений, и ни в коем случае не относится к info-gap, но info-gap не застрахован от него.
Во-вторых, нет естественного масштаба: это неопределенность маленький или большой? Различные модели неопределенности дают разные шкалы и требуют суждения и понимания предметной области и модели неопределенности. Точно так же измерение различий между результатами требует суждения и понимания предметной области.
В-третьих, если рассматриваемая вселенная больше, чем значительный горизонт неопределенности, и результаты для этих удаленных точек значительно отличаются от точек, близких к оценке, то выводы анализа устойчивости или возможности, как правило, будут следующими: «нужно быть очень уверенным в своих силах. предположений, иначе можно ожидать, что результаты будут значительно отличаться от прогнозов »- предостерегающий вывод.
Заявление об ограничении ответственности и резюме
Функции устойчивости и возможности могут повлиять на принятие решения. Например, изменение в решении, повышающее надежность, может увеличивать или уменьшать возможности. С субъективной точки зрения, надежность и гибкость - это компромисс против стремления к результату: надежность и возможность ухудшаются по мере того, как усиливаются устремления лица, принимающего решения. Устойчивость равна нулю для наилучших ожидаемых результатов. Кривые устойчивости для альтернативных решений могут пересекаться в зависимости от стремления, подразумевая изменение предпочтений.
Различные теоремы определяют условия, при которых большая надежность информационного разрыва подразумевает большую вероятность успеха, независимо от основного распределения вероятностей. Однако эти условия являются техническими и не переводятся в какие-либо здравые, словесные рекомендации, ограничивающие такие применения теории информационного разрыва неспециалистами.
Критика
Общая критика не вероятностных правил принятия решений, подробно обсуждаемая на теория принятия решений: альтернативы теории вероятностей, это оптимальные решающие правила (формально допустимые правила принятия решений ) может всегда быть получен вероятностными методами с подходящим вспомогательная функция и предварительное распространение (это утверждение полных теорем класса), и, таким образом, что маловероятные методы, такие как info-gap, не нужны и не дают новых или лучших правил принятия решений.
Более общая критика принятия решений в условиях неопределенности - это влияние необычных, неожиданных событий, которые не отражаются в модели. Это особенно обсуждается в теория черного лебедя, и информационный пробел, используемый изолированно, уязвим для этого, как и все теории принятия решений, которые используют фиксированный универсум возможностей, особенно вероятностных.
В критике, относящейся к информационному пробелу, Сниедович[47] выдвигает два возражения против теории принятия решений о пропуске информации, одно существенное, другое - научное:
- 1. модель неопределенности информационного разрыва ошибочна и перепродана
- Информационный пробел моделирует неопределенность с помощью вложенного семейства подмножеств вокруг точечная оценка, и рекламируется как применимый в ситуациях "суровый неопределенность ». Сниедович утверждает, что в условиях серьезной неопределенности не следует начинать с точечной оценки, которая может иметь серьезные недостатки. Вместо этого следует рассматривать совокупность возможностей, а не ее подмножества. Иначе говоря, в условиях серьезной неопределенности следует использовать Глобальный теория принятия решений (рассмотреть всю область неопределенности), а не местный теория принятия решений (начиная с точечной оценки и с учетом отклонений от нее). Сниедович утверждает, что теория принятия решений по информационному разрыву является «теорией принятия решений вуду».
- 2. информационный пробел максимален
- Бен-Хаим (2006, p.xii) утверждает, что информационный пробел «радикально отличается от всех текущих теорий принятия решений в условиях неопределенности», в то время как Сниедович утверждает, что анализ надежности информационного пробела - это как раз максимальный анализ горизонта неопределенности. Напротив, Бен-Хаим заявляет (Ben-Haim 1999, стр. 271–2), что «высокая надежность категорически не является анализом [min-max] наихудшего случая». Обратите внимание, что Бен-Хаим сравнивает информационный пробел с минимакс, а Сниедович считает это случаем максимин.
Сниедович поставил под сомнение обоснованность теории информационного разрыва для принятия решений в условиях серьезной неопределенности. Он ставит под сомнение эффективность теории информационного разрыва в ситуациях, когда наилучшая оценка это плохой показатель истинной ценности . Сниедович отмечает, что функция устойчивости информационного разрыва является «локальной» для региона вокруг , куда вероятно, будет существенно ошибкой. Он приходит к выводу, что, следовательно, функция устойчивости к информационным пробелам является ненадежной оценкой устойчивости к ошибкам.
Максимин
Сниедович утверждает, что модель устойчивости информационного разрыва Максимин анализ не результата, а горизонта неопределенности: он выбирает такую оценку, чтобы максимизировать горизонт неопределенности таким образом, что достигается минимальный (критический) результат, предполагающий наихудший исход для определенного горизонта. Условно max предполагая минимальный (наихудший) результат или максимин.
Другими словами, хотя это и не максимальный анализ результатов во вселенной неопределенности, это максимальный анализ в правильно построенном пространстве решений.
Бен-Хаим утверждает, что модель устойчивости информационного разрыва не является анализом минимум-максимум / максимум, потому что это не анализ наихудшего случая результаты; это удовлетворительный модель, а не модель оптимизации - (простой) анализ максимина будет рассматривать наихудшие результаты по всему пространству, что, поскольку неопределенность часто потенциально неограниченна, приведет к неограниченному плохому наихудшему случаю.
Радиус устойчивости
Сниедович[3] показал, что модель устойчивости информационного разрыва является простой радиус устойчивости модель, а именно модель локальной устойчивости общего вида
куда обозначает мяч радиуса сосредоточен на и обозначает набор значений которые удовлетворяют заранее заданным условиям устойчивости.
Другими словами, модель устойчивости информационного зазора - это модель радиуса устойчивости, характеризующаяся требованием устойчивости вида . Поскольку модели радиуса устойчивости предназначены для анализа малых возмущений заданного номинального значения параметра, Сниедович[3] утверждает, что модель устойчивости информационного разрыва не подходит для обработки серьезной неопределенности, характеризующейся плохой оценкой и обширным пространством неопределенности.
Обсуждение
Удовлетворяющая и ограниченная рациональность
Верно, что функция устойчивости информационного разрыва является локальной и в некоторых случаях имеет ограниченное количественное значение. Однако главная цель анализа решений - сфокусировать субъективные суждения. То есть, независимо от формального анализа, предоставляется структура для обсуждения. Не вдаваясь в какую-либо конкретную структуру или характеристики структур в целом, следует обсуждение предложений по таким структурам.
Саймон [48] представил идею ограниченная рациональность. Ограничения знаний, понимания и вычислительных возможностей ограничивают способность лиц, принимающих решения, определять оптимальный выбор. Саймон выступал удовлетворительный вместо оптимизации: поиск адекватных (а не оптимальных) результатов при имеющихся ресурсах. Шварц,[49]Конлиск[50]и другие обсуждают обширные свидетельства феномена ограниченной рациональности среди людей, принимающих решения, а также преимущества удовлетворения, когда знания и понимание недостаточны. Функция устойчивости информационного разрыва обеспечивает средство реализации удовлетворительной стратегии при ограниченной рациональности. Например, обсуждая ограниченную рациональность и удовлетворительность в сохранении и управлении окружающей средой, Бургман отмечает, что «теория информационного пробела ... может работать разумно, когда есть« серьезные »пробелы в знаниях». Функции устойчивости и гибкости информационного разрыва обеспечивают «формальную основу для изучения видов предположений, которые возникают интуитивно при изучении вариантов решения».[51] Затем Бургман приступает к разработке надежно-удовлетворительной стратегии информационного разрыва для защиты находящегося под угрозой исчезновения оранжевобрюхого попугая. Точно так же Винот, Коган и Чиполла [52] обсудить инженерное проектирование и отметить, что «обратная сторона анализа на основе моделей заключается в знании того, что поведение модели является лишь приближением к реальному поведению системы. Отсюда вопрос честного дизайнера: насколько чувствительна моя мера успеха дизайна к неопределенности в моем представлении о системе? ... Очевидно, что если анализ на основе моделей должен использоваться с любым уровнем уверенности, то ... [необходимо] попытаться удовлетворить приемлемый субоптимальный уровень производительности, оставаясь при этом максимально надежным к системным неопределенностям ".[52] Они приступают к разработке надежно-удовлетворительной процедуры проектирования информационного зазора для аэрокосмического применения.
Альтернативы
Конечно, в решении перед лицом неопределенности нет ничего нового, и попытки справиться с ним имеют давнюю историю. Ряд авторов отметили и обсудили сходства и различия между надежностью информационных пробелов и минимакс или методы наихудшего случая[7][16][35][37] [53] .[54] Сниедович [47] формально продемонстрировал, что функция устойчивости информационного разрыва может быть представлена как максиминная оптимизация и, таким образом, связана с минимаксной теорией Вальда. Сниедович [47] утверждал, что анализ устойчивости информационного разрыва проводится в окрестности оценки, которая, вероятно, будет существенно неверной, и пришел к заключению, что результирующая функция устойчивости с одинаковой вероятностью будет существенно неверной.
С другой стороны, оценка является наилучшей из имеющихся, поэтому полезно знать, может ли она сильно ошибаться и по-прежнему давать приемлемый результат. Этот критический вопрос ясно поднимает вопрос о том, подходит ли надежность (как определено теорией информационного разрыва), чтобы судить о том, оправдано ли доверие,[5][55] [56] и как он сравнивается с методами, используемыми для обоснования решений в условиях неопределенности с использованием соображений нет ограничивается соседством с неправильным первоначальным предположением. Ответы на эти вопросы зависят от конкретной проблемы. Далее следуют некоторые общие комментарии.
Анализ чувствительности
Анализ чувствительности - насколько чувствительны выводы к исходным предположениям - могут быть выполнены независимо от модели неопределенности: проще всего, можно взять два разных предполагаемых значения в качестве входных данных и сравнить выводы. С этой точки зрения информационный пробел можно рассматривать как метод анализа чувствительности, но ни в коем случае не единственный.
Надежная оптимизация
Литература по надежной оптимизации [57][58][59][60][61][62] предоставляет методы и техники, которые Глобальный подход к анализу устойчивости. Эти методы напрямую относятся к решению в соответствии с суровый неопределенности и используются для этой цели уже более тридцати лет. Вальд с Максимин Модель является основным инструментом, используемым этими методами.
Принципиальное отличие Максимин модель, используемая info-gap и различными Максимин Модели, используемые с помощью методов робастной оптимизации, представляют собой способ, которым полная область неопределенности включается в модель устойчивости. Info-gap использует локальный подход, который концентрируется на непосредственной близости к оценке. В отличие от этого, надежные методы оптимизации предназначены для включения в анализ всей области неопределенности или, по крайней мере, ее адекватного представления. Фактически, некоторые из этих методов даже не используют оценку.
Сравнительный анализ
Классическая теория принятия решений,[63][64] предлагает два подхода к принятию решений в условиях сильной неопределенности, а именно Максимин и Лапласа принцип недостаточной причины (предполагаем, что все исходы одинаково вероятны); их можно рассматривать как альтернативные решения проблем, связанных с устранением пробелов в информации.
Далее, как обсуждалось на теория принятия решений: альтернативы теории вероятностей, вероятностники, особенно сторонники теории вероятностей байесовского типа, утверждают, что оптимальные правила принятия решений (формально допустимые правила принятия решений ) может всегда можно получить вероятностными методами (это утверждение теоремы о полном классе ), и, таким образом, маловероятные методы, такие как информационный разрыв, не нужны и не дают новых или лучших правил принятия решений.
Максимин
Как свидетельствует богатая литература по надежная оптимизация, maximin предоставляет широкий спектр методов для принятия решений в условиях серьезной неопределенности.
Действительно, как обсуждалось в критика теории принятия решений о пропуске информации, модель устойчивости информационного разрыва может быть интерпретирована как пример общей модели максимина.
Байесовский анализ
Что касается Лапласа принцип недостаточной причины, в этом контексте удобно рассматривать его как экземпляр Байесовский анализ.
Суть Байесовский анализ применяет вероятности для различных возможных реализаций неопределенных параметров. В случае Найтовская (не вероятностная) неопределенность эти вероятности представляют «степень веры» лица, принимающего решение, в конкретную реализацию.
В нашем примере предположим, что существует только пять возможных реализаций неопределенной функции распределения дохода. Лицо, принимающее решение, считает, что оценочная функция является наиболее вероятной и что вероятность уменьшается по мере увеличения отклонения от оценки. Рисунок 11 иллюстрирует такое распределение вероятностей.
Теперь для любого распределения можно построить вероятностное распределение дохода на основе своих предыдущих убеждений. Затем лицо, принимающее решение, может выбрать распределение с наибольшим ожидаемым доходом, с наименьшей вероятностью неприемлемого дохода и т. Д.
Самый проблемный этап этого анализа - выбор вероятностей реализаций. При наличии обширного и актуального прошлого опыта эксперт может использовать этот опыт для построения распределения вероятностей. Но даже имея большой прошлый опыт, при изменении некоторых параметров эксперт может только оценить, что более вероятно, чем , но не сможет надежно количественно оценить эту разницу. Кроме того, когда условия резко меняются или когда нет никакого прошлого опыта, может оказаться трудным даже оценить, насколько более вероятно, чем .
Тем не менее, с методологической точки зрения, эта трудность не так проблематична, как анализ проблемы, подверженной серьезной неопределенности, основанной на одноточечной оценке и ее ближайшем окружении, как это делается с помощью info-gap. Более того, в отличие от info-gap, это не локальный, а глобальный подход.
Тем не менее, необходимо подчеркнуть, что байесовский анализ прямо не касается вопроса устойчивости.
Байесовский анализ поднимает проблему учиться на опыте и соответствующим образом корректируя вероятности. Другими словами, решение - это не комплексный процесс, а результат последовательности решений и наблюдений.
Перспектива классической теории принятия решений
Сниедович[47] выдвигает два возражения против теории принятия решений с информационным разрывом, с точки зрения классической теории принятия решений, одно существенное, другое научное:
- модель неопределенности информационного разрыва ошибочна и перепродана
- Информационный пробел моделирует неопределенность с помощью вложенного семейства подмножеств вокруг точечная оценка, и рекламируется как применимый в ситуациях "суровый неопределенность ». Сниедович утверждает, что в условиях серьезной неопределенности не следует начинать с точечной оценки, которая, как предполагается, имеет серьезные недостатки: вместо этого следует учитывать совокупность возможностей, а не их подмножества. Иначе говоря, в условиях серьезной неопределенности нужно использовать Глобальный теория принятия решений (рассмотреть всю вселенную), а не местный теория принятия решений (начиная с оценки и учитывая отклонения от нее).
- информационный пробел максимин
- Бен-Хаим (2006, p.xii) утверждает, что информационный пробел «радикально отличается от всех текущих теорий принятия решений в условиях неопределенности», в то время как Сниедович утверждает, что анализ надежности информационного пробела - это как раз максимальный анализ горизонта неопределенности. Напротив, Бен-Хаим заявляет (Ben-Haim 1999, стр. 271–2), что «высокая надежность категорически не является анализом [min-max] наихудшего случая».
Снидович поставил под сомнение обоснованность теории информационного разрыва для принятия решений в условиях серьезной неопределенности. Он ставит под сомнение эффективность теории информационного разрыва в ситуациях, когда наилучшая оценка это плохой показатель истинной ценности . Сниедович отмечает, что функция устойчивости информационного разрыва является «локальной» для региона вокруг , куда вероятно, будет существенно ошибкой. Он приходит к выводу, что, следовательно, функция устойчивости к информационным пробелам является ненадежной оценкой устойчивости к ошибкам.
В рамках классической теория принятия решений, модель устойчивости информационного разрыва может быть истолкована как пример Вальд с Максимин Модель и ее модель возможностей является примером классической модели Минимина. Оба работают в окрестности оценки интересующего параметра, истинное значение которого зависит от суровый неопределенность и, следовательно, вероятно, будет существенно неверно. Более того, соображения, связанные с самим процессом принятия решения, также возникают в месте получения этой ненадежной оценки и, таким образом, могут или не могут отражать весь диапазон решений и неопределенностей.
Предпосылки, рабочие предположения и взгляд в будущее
Принятие решений в условиях серьезной неопределенности - сложная задача, а разработка методологий, способных решить эту задачу, - еще более трудное дело. Действительно, за последние шестьдесят лет на разработку таких методологий были вложены огромные усилия. Тем не менее, несмотря на все знания и опыт, накопленные в этой области теории принятия решений, на сегодняшний день нет полностью удовлетворительной общей методологии.
Теперь, как показано в литературе по информационным пробелам, Info-Gap был разработан специально как методология для решения проблем принятия решений, которые подвержены серьезной неопределенности. Более того, его цель - найти решения, которые крепкий.
Таким образом, чтобы иметь четкое представление о способах работы информационного разрыва и его роли и месте в теории принятия решений и надежной оптимизации, необходимо изучить его в этом контексте. Другими словами, необходимо установить связь информационного разрыва с классической теорией принятия решений и робастной оптимизацией. Для этого необходимо ответить на следующие вопросы:
- Каковы характеристики проблем принятия решений, которые подвержены серьезной неопределенности?
- Какие трудности возникают при моделировании и решении подобных задач?
- Какой тип надежности требуется?
- Как теория информационного разрыва решает эти проблемы?
- Чем теория принятия решений по информационному разрыву похожа и / или отличается от других теорий принятия решений в условиях неопределенности?
В этом отношении с самого начала необходимо прояснить два важных момента:
- Принимая во внимание строгость Что касается неопределенности, для устранения которой был разработан информационный пробел, важно прояснить трудности, связанные с серьезной неопределенностью.
- Поскольку информационный пробел - это не вероятностный метод, который стремится максимизировать надежность Что касается неопределенности, необходимо сравнить ее с единственной наиболее важной «ненадежной» моделью в классической теории принятия решений, а именно с моделью Вальда. Максимин парадигма (Wald 1945, 1950). В конце концов, эта парадигма доминирует в классической теории принятия решений уже более шестидесяти лет.
Итак, сначала давайте проясним предположения, которые подразумевает суровый неопределенность.
Рабочие предположения
Теория принятия решений по информационному промежутку использует три простых конструкции для определения неопределенности, связанной с проблемами принятия решений:
- Параметр чье истинное значение подвержено серьезной неопределенности.
- Область неопределенности где истинная ценность ложь.
- Оценка истинной ценности .
Однако следует отметить, что как таковые эти конструкции являются общими, что означает, что они могут использоваться для моделирования ситуаций, в которых неопределенность не является серьезной, а умеренной, действительно очень мягкой. Поэтому очень важно четко понимать, что для того, чтобы дать подходящее выражение строгость Что касается неопределенности, в структуре Info-Gap этим трем конструкциям придается конкретное значение.
Рабочие предположения
- Область неопределенности является относительно большой.
Фактически, Бен-Хаим (2006, с. 210) указывает, что в контексте теории информационного разрыва большинство часто встречающихся областей неопределенности являются безграничный.- Оценка это бедные приближение к истинному значению .
То есть оценка является бедные указание истинной стоимости (Бен-Хаим, 2006, с. 280) и, вероятно, будет существенно неправильно (Бен-Хаим, 2006, с. 281).На картинке представляет собой истинное (неизвестное) значение .
Здесь следует отметить, что в условиях сильной неопределенности оценка может, условно говоря, быть очень далеким от истинного значения . Это особенно актуально для методологий, таких как информационный пробел, которые ищут надежность к неуверенности. В самом деле, предположение иначе - с методологической точки зрения - было бы равносильно принятию желаемого за действительное.
Короче говоря, ситуации, для решения которых предназначен информационный пробел, крайне требовательны. Следовательно, проблема, с которой сталкиваются концептуально, методологически и технически, значительна. Теоретики могут проверить, преуспевает ли анализ устойчивости информационного разрыва в решении этой задачи, и отличаются ли инструменты, которые он использует для этого, от тех, которые были доступны в парадигме Максимина Вальда (1945), особенно для надежной оптимизации.
Парадигма Максимина Вальда
Основная идея этой знаменитой парадигмы может быть выражена простым языком следующим образом:
Правило Максимина Правило максимина говорит нам ранжировать альтернативы по их наихудшим возможным результатам: мы должны принять альтернативу, худший результат которой превосходит наихудший исход из других.
Таким образом, согласно этой парадигме, в рамках принятия решений в условиях серьезной неопределенности надежность альтернативы является мерой того, насколько хорошо эта альтернатива может справиться с ситуацией. худший неопределенный исход что он может генерировать. Излишне говорить, что такое отношение к серьезной неопределенности часто приводит к выбору очень консервативный альтернативы. Именно по этой причине эта парадигма не всегда является удовлетворительной методологией принятия решений в условиях серьезной неопределенности (Tintner 1952).
Как указано в обзоре, модель устойчивости info-gap - это замаскированная модель Максимина. В частности, это простой пример модели Максимина Вальда, где:
- Область неопределенности, связанная с альтернативным решением, является непосредственной окрестностью оценки. .
- Неопределенные результаты альтернативы определяются характеристической функцией рассматриваемого требования к характеристикам.
Таким образом, помимо консерватизм проблема, необходимо решить гораздо более серьезную проблему. Это срок действия проблема, возникающая из местный характер анализа устойчивости информационного разрыва.
Локальная и глобальная надежность
Достоверность результатов, полученных с помощью анализа устойчивости информационного разрыва, зависит от качества оценки. . Согласно собственным рабочим предположениям info-gap, эта оценка плохая и, вероятно, будет существенно неверной (Ben-Haim, 2006, p. 280-281).
Проблема, связанная с этой особенностью модели устойчивости информационного разрыва, более убедительно показана на рисунке. Белый кружок представляет собой непосредственную окрестность оценки на котором проводится анализ Максимина. Поскольку область неопределенности велика и качество оценки низкое, весьма вероятно, что истинное значение находится далеко от точки, в которой проводится анализ Максимина.
Итак, учитывая серьезность рассматриваемой неопределенности, насколько действительным / полезным может быть этот тип анализа Максимина?
В какой степени местный Анализ устойчивости а-ля Максимин в непосредственной близости от плохой оценки может точно представить большую область неопределенности.
Надежные методы оптимизации неизменно принимают гораздо более глобальный взгляд на надежность. Настолько, что планирование сценария и генерация сценария являются центральными проблемами в этой области. Это отражает твердую приверженность адекватному представлению всей области неопределенности в определении устойчивости и в самом анализе устойчивости.
Это связано с изображением вклада информационного пробела в состояние дел в теории принятия решений, а также его роли и места по сравнению с другими методологиями.
Роль и место в теории принятия решений
Info-gap подчеркивает прогресс в области теории принятия решений (здесь выделен цвет):
Теория принятия решения о пропуске информации радикально отличается от всех современных теорий решения в условиях неопределенности. Разница заключается в моделирование неопределенности как информационный пробел а не как вероятность.
Бен-Хаим (2006, стр. Xii)В этой книге мы сосредоточимся на довольно Новая концепция неопределенности информационного разрыва, чья различия из более классических подходов к неопределенности настоящий и глубокий. Несмотря на мощь классических теорий принятия решений, во многих областях, таких как инженерия, экономика, менеджмент, медицина и государственная политика, возникла потребность в другой формат для решений, основанных на крайне неуверенный свидетельство.
Бен-Хаим (2006, с. 11)
Эти убедительные утверждения должны быть подтверждены. В частности, должен быть дан четкий, однозначный ответ на следующий вопрос: чем действительно отличается общая модель надежности info-gap? радикально разные, из анализ наихудшего случая а-ля Максимин?
В последующих разделах этой статьи описываются различные аспекты теории принятия решений по информационным пробелам и ее приложений, как она предлагает справиться с рабочими предположениями, изложенными выше, локальный характер анализа устойчивости информационного пробела и его тесная связь с классической парадигмой Максимина Уолда и худшими. -кейс-анализ.
Свойство инвариантности
Главное, что следует иметь в виду, заключается в том, что смысл существования информационного пробела заключается в предоставлении методологии для принятия решения по суровый неопределенность. Это означает, что его основной проверкой будет эффективность обращения с суровый неопределенность. С этой целью сначала необходимо установить, как модели устойчивости / возможностей Info-Gap ведут себя / стоимость проезда, поскольку строгость неопределенности увеличивается / уменьшается.
Во-вторых, необходимо установить, дают ли модели надежности / возможности информационного разрыва адекватное выражение потенциальной изменчивости функции производительности во всей области неопределенности. Это особенно важно, потому что Info-Gap обычно касается относительно больших, действительно неограниченных областей неопределенности.
Так что давайте Обозначьте общую область неопределенности и рассмотрите следующие ключевые вопросы:
- Как анализ устойчивости / возможности реагирует на увеличение / уменьшение размера ?
- Как происходит увеличение / уменьшение размера повлиять на надежность или возможность принятия решения?
- Насколько репрезентативны результаты, полученные с помощью анализа устойчивости / возможности info-gap в отношении того, что происходит в относительно большой общей области неопределенности ?
Предположим тогда, что устойчивость был рассчитан для решения и замечено, что куда для некоторых .
Тогда возникает вопрос: насколько надежным будет , а именно , будут затронуты, если область неопределенности будет, скажем, вдвое больше, чем , а может быть, даже в 10 раз больше, чем ?
Рассмотрим следующий результат, который является прямым следствием локального характера анализа устойчивости / возможности информационных пробелов и свойства вложенности областей неопределенности информационных пробелов (Сниедович 2007):
Теорема инвариантности
Надежность решения инвариантно с размером общей области неопределенности для всех такой, что
(7) для некоторых
Другими словами, для любого данного решения анализ информационного разрыва дает одинаковые результаты для всех полных областей неопределенности, содержащих . Это относится как к моделям устойчивости, так и к моделям возможностей.
Это проиллюстрировано на рисунке: устойчивость данного решения не меняется, несмотря на увеличение области неопределенности от к .
Короче говоря, сосредоточив внимание исключительно на непосредственной окрестности оценки Модели устойчивости / возможности info-gap по своей сути местный. По этой причине они - в принципе - неспособен включить в анализ и регионы неопределенности, лежащие за пределами окрестностей и сметы , соответственно.
Для иллюстрации рассмотрим простой числовой пример, где общая область неопределенности оценка и для какого-то решения мы получаем . Картина такая:
где термин "Ничейная земля" относится к той части общей области неопределенности, которая находится за пределами области .
Обратите внимание, что в этом случае надежность решения основан на его (наихудшем случае) характеристиках не более чем на крошечной части общей области неопределенности, которая является непосредственной окрестностью оценки . Поскольку обычно общая область неопределенности информационного разрыва неограничена, эта иллюстрация представляет собой обычный случай, а не исключение.
Надежность / возможности Info-gap по определению локальные свойства. Как таковые они не могут оценивать эффективность решений во всей области неопределенности. По этой причине неясно, как модели устойчивости / возможностей Info-Gap могут предоставить значимую / надежную / полезную основу для принятия решений в условиях серьезной неопределенности, когда оценка плохая и, вероятно, будет существенно неверной.
Этот важный вопрос рассматривается в следующих разделах этой статьи.
Максимин / Минимин: игра в игры на прочность / гибкость с природой
Уже более шестидесяти лет Вальд с Максимин модель вошла в классическую теория принятия решений и связанные области - такие как надежная оптимизация - как наиболее вероятностная парадигма моделирования и обработки серьезной неопределенности.
Инфо-пробел предлагается (например, Ben-Haim 2001, 2006) как новая не вероятностная теория, которая радикально отличается от всех текущих теорий принятия решений в условиях неопределенности. Таким образом, крайне важно изучить в этом обсуждении, чем, если таковые имеются, модель устойчивости информационного разрыва радикально отличается от Максимин. Во-первых, существует хорошо известная оценка полезности Максимин. Например, Бергер (Глава 5)[66] предполагает, что даже в ситуациях, когда нет предварительной информации (лучший случай для Максимин ), Максимин может привести к неправильным правилам принятия решений и их трудно реализовать. Он рекомендует Байесовская методология. И как указано выше,
Следует также отметить, что принцип минимакса, даже если он применим, ведет к крайне консервативной политике.
Тинтнер (1952, стр.25)[67]
Однако, помимо разветвлений, которые установление этой точки может иметь для полезности модели надежности информационных пробелов, причина, по которой нам надлежит прояснить взаимосвязь между информационными пробелами и Максимин последнее в теории принятия решений занимает центральное место. В конце концов, это основная классическая методология принятия решений. Таким образом, можно ожидать, что любую теорию, претендующую на предоставление новой не вероятностной методологии принятия решений в условиях серьезной неопределенности, будут сравнивать с этой стойкой теорией принятия решений. И все же, это не только сравнение модели устойчивости info-gap с Максимин отсутствует в трех книгах, разъясняющих информационный пробел (Ben-Haim 1996, 2001, 2006), Максимин в них даже не упоминается как основная методология теории принятия решений в случае серьезной неопределенности.
В другом месте в литературе по информационным пробелам можно найти дискуссии о сходствах и различиях между этими двумя парадигмами, а также дискуссии о связи между информационным пробелом и анализом наихудшего случая.[7][16][35][37][53][68]Однако общее впечатление таково, что тесная связь между этими двумя парадигмами не выявлена. Действительно, утверждается обратное. Например, Бен-Хаим (2005 г.[35]) утверждает, что модель устойчивости информационного разрыва похожа на Максимин но это не Максимин модель.
Следующая цитата красноречиво выражает оценку Бен-Хаимом отношения информационного пробела к Максимину и дает достаточную мотивацию для последующего анализа.
Отметим, что высокая надежность решительно важна. нет анализ наихудшего случая. В классическом анализе минимума и максимума наихудшего случая проектировщик сводит к минимуму влияние максимально опасного случая. Но модель неопределенности информационного разрыва - это неограниченное семейство вложенных множеств: , для всех . Следовательно, худшего случая нет: любое неблагоприятное событие менее разрушительно, чем какое-либо другое более экстремальное событие, происходящее при большем значении . Какая формула (1) выражает наибольший уровень неопределенности, совместимый с безотказностью. Когда дизайнер выбирает q, чтобы максимизировать он максимизирует свою невосприимчивость к неограниченной окружающей неопределенности. Самое близкое к "минимальному увеличению" это то, что дизайн выбран так, что "плохие" события (вызывающие вознаграждение меньше, чем ) расположены как можно более "далеко" (сверх максимального значения ).
Бен-Хаим, 1999, стр. 271–2.[69]
Здесь следует отметить, что это утверждение упускает из виду тот факт, что горизонт неопределенности ограничено сверху (неявно) требованием к производительности
и этот информационный пробел проводит анализ наихудшего случая - один анализ за раз для заданного - в каждой из областей неопределенности .
Короче говоря, учитывая дискуссии по этому вопросу в литературе по информационным пробелам, очевидно, что родство между моделью устойчивости информационного пробела и Вальда Максимин модель, а также родство информационного разрыва с другими моделями классической теории принятия решений. Итак, цель этого раздела - поместить модели устойчивости и возможности информационного разрыва в их надлежащий контекст, а именно в более широкие рамки классической теория принятия решений и надежная оптимизация.
Обсуждение основано на классической теории принятия решений, изложенной Сниедовичем (2007).[70]) и стандартных текстов в этой области (например, Resnik 1987,[63] Французский 1988[64]).
Это неизбежно, потому что модели информационного разрыва являются математическими.
Общие модели
Базовая концептуальная основа, которую классическая теория принятия решений обеспечивает для работы с неопределенностью, - это игра двух игроков. Два игрока принимают решения (DM) и Природа, где Природа представляет собой неопределенность. Более конкретно, Природа представляет отношение DM к неопределенности и риску.
Обратите внимание, что в этом отношении проводится четкое различие между пессимистичный лицо, принимающее решения, и оптимистичный лицо, принимающее решения, а именно между худший случай отношение и лучший случай отношение. Пессимистично принимающий решения полагает, что Природа играет против его, тогда как оптимистичный человек, принимающий решения, предполагает, что Природа играет с ему.
Чтобы выразить эти интуитивные представления математически, классические теория принятия решений использует простую модель, состоящую из следующих трех конструкций:
- Множество представляющий пространство решений доступны для DM.
- Набор наборов представляющий государственные пространства связанных с решениями в .
- Функция предусматривающий результаты генерируется парами решение-состояние .
Функция называется целевая функция, функция выигрыша, функция возврата, функция стоимости и Т. Д.
Процесс принятия решений (игра), определяемый этими объектами, состоит из трех этапов:
- Шаг 1: DM выбирает решение .
- Шаг 2: В ответ, учитывая , Природа выбирает состояние .
- Шаг 3: Исход выделяется DM.
Отметим, что в отличие от игр, рассматриваемых в классических теория игры, здесь первый игрок (DM) ходит первым, так что второй игрок (Природа) знает, какое решение было выбрано первым игроком до того, как он выберет свое решение. Таким образом, концептуальные и технические сложности относительно существования Точка равновесия по Нэшу здесь неуместны. Природа не является независимым игроком, это концептуальный аппарат, описывающий отношение DM к неопределенности и риску.
На первый взгляд простота этой схемы может показаться наивной. Тем не менее, как подтверждается множеством конкретных примеров, которые он охватывает, он богат возможностями, гибок и универсален. Для целей этого обсуждения достаточно рассмотреть следующую классическую общую схему:
куда и представляют собой критерии оптимальности DM и Nature соответственно, то есть каждый равен либо или же .
Если тогда игра кооператив и если тогда игра отказ от сотрудничества. Таким образом, этот формат представляет четыре случая: две некооперативные игры (Maximin и Minimax) и две кооперативные игры (Minimin и Maximax). Соответствующие составы следующие:
Каждый случай определяется парой критериев оптимальности, используемых DM и Nature. Например, Максимин изображает ситуацию, когда DM стремится максимизировать результат, а Природа стремится минимизировать его. Точно так же парадигма Minimin представляет ситуации, в которых и DM, и Природа стремятся минимизировать результат.
Особый интерес для этого обсуждения представляют парадигмы Максимина и Миниина, поскольку они включают в себя модели надежности и возможности информационного разрыва соответственно. Итак, вот они:
Максимин Игра:
- Шаг 1: DM выбирает решение с целью максимизировать исход .
- Шаг 2: В ответ, учитывая , Природа выбирает состояние в что сводит к минимуму над .
- Шаг 3: Исход выделяется DM.
Игра Minimin:
- Шаг 1: DM выбирает решение с целью сводит к минимуму исход .
- Шаг 2: В ответ, учитывая , Природа выбирает состояние в что сводит к минимуму над .
- Шаг 3: Исход выделяется DM.
Имея это в виду, рассмотрим теперь модели надежности и возможности info-gap.
Модель устойчивости Info-gap
С классической теоретической точки зрения принятия решений модель устойчивости информационного разрыва - это игра между Мастером и Природой, где Мастер выбирает значение (стремясь к максимально возможному), тогда как Природа выбирает худшее значение в . В этом контексте худшее значение относящийся к данному пара это что нарушает требования к производительности . Это достигается за счет минимизации над .
Есть различные способы объединить цель DM и антагонистический ответ Природы в один результат. Например, для этой цели можно использовать следующую характеристическую функцию:
Отметим, что при желании для любого триплета представляющих интерес у нас есть
следовательно, с точки зрения DM, выполнение ограничения производительности эквивалентно максимизации .
Короче,
Игра Maximin Robustness от Info-gap для принятия решений :
- Шаг 1: Мастер выбирает горизонт неопределенности с целью максимизировать исход .
- Шаг 2: В ответ, учитывая , Природа выбирает что сводит к минимуму над .
- Шаг 3: Исход выделяется DM.
Очевидно, что оптимальная альтернатива DM - выбрать наибольшее значение такое, что худшее удовлетворяет требованиям к производительности.
Теорема Максимина
Как показано у Сниедовича (2007),[47] Модель устойчивости Info-gap - простой пример Модель максимина Вальда. Конкретно,
Модель возможностей Info-gap
Точно так же модель возможностей info-gap - простой пример общей модели Minimin. То есть,
куда
наблюдая, что, по желанию, для любого триплета представляющих интерес у нас есть
следовательно, для данной пары , DM мог бы удовлетворить требования к производительности за счет минимизации результата над . Поведение природы является отражением ее симпатической позиции здесь.
Замечание: Такое отношение к риску и неопределенности, предполагающее, что Природа будет играть с нами, довольно наивно. Как отмечает Ресник (1987, с. 32).[63]) "... Но этому правилу наверняка мало кто будет следовать ...". Тем не менее, его часто используют в сочетании с Максимин правило в формулировании Hurwicz с оптимизм-пессимизм правило (Resnik 1987,[63] Французский 1988[64]) с целью смягчить крайний консерватизм Максимин.
Формулировки математического программирования
Чтобы более убедительно выявить этот информационный пробел, модель устойчивости является примером общего Максимин модели, а модель возможностей информационного разрыва является экземпляром общей модели Minimin, поучительно изучить эквивалент так называемого Математическое программирование (MP) форматы этих общих моделей (Ecker и Kupferschmid,[71] 1988, с. 24–25; Thie 1988[72] стр. 314–317; Кувелис и Ю,[59] 1997, стр. 27):
Таким образом, в случае информационного пробела мы имеем
Чтобы проверить эквивалентность форматов информационного разрыва и соответствующих форматов теории принятия решений, напомним, что по построению для любого триплета представляющих интерес у нас есть
Это означает, что в случае робастности /Максимин, антагонистическая Природа (эффективно) минимизирует минимизируя тогда как в случае возможности / Minimin симпатичная Природа (эффективно) максимизирует минимизируя .
Резюме
Анализ устойчивости Info-gap предполагает, что данная пара , то наихудший элемент реализовано. Это конечно типичный Максимин анализ. Говоря классическим языком теория принятия решений:
В Надежность решения это самый большой горизонт неопределенности, , так что наихудший значение в удовлетворяет требованиям к производительности .
Аналогичным образом, анализ возможностей информационного разрыва предполагает, что при наличии пары , то Лучший элемент реализовано. Это, конечно, типичный анализ Минимина. Говоря классическим языком теория принятия решений:
В Своевременность решения это самый маленький горизонт неопределенности, , так что Лучший значение в удовлетворяет требованиям к производительности .
Математическая транслитерация этих концепций проста, что приводит к типичным моделям Максимина / Миниина соответственно.
Скудная структура типовых моделей Maximin / Minimin не только не ограничивает, но и является скрытым благом. Главное здесь в том, что абстрактный характер трех базовых конструкций родовых моделей
- Решение
- Состояние
- Исход
по сути, обеспечивает большую гибкость в моделировании.
Поэтому требуется более подробный анализ, чтобы выявить всю силу взаимосвязи между информационным разрывом и типичными классическими теоретическими моделями принятия решений. Видеть # Заметки об искусстве математического моделирования.
Охота за сокровищами
Ниже приводится краткое изложение дискуссии Сниедовича (2007) о локальной и глобальной устойчивости. Для наглядности здесь он представлен как Охота за сокровищами. Он показывает, как элементы модели устойчивости информационного разрыва соотносятся друг с другом и как серьезная неопределенность учитывается в модели.
(1) Вы отвечаете за поиск сокровищ на маленьком континенте где-то в Азиатско-Тихоокеанском регионе. Вы обращаетесь к портфолио поисковых стратегий. Вам нужно решить, какая стратегия лучше всего подойдет для данной экспедиции. | (2) Сложность в том, что точное местоположение клада на континенте неизвестно. Существует серьезный разрыв между тем, что вам нужно знать - истинным местонахождением сокровища - и тем, что вы действительно знаете - плохой оценкой истинного местоположения. | (3) Каким-то образом вы вычисляете истинное местонахождение клада. Поскольку здесь мы имеем дело с серьезной неопределенностью, мы предполагаем - с методологической точки зрения - что эта оценка является плохим показателем истинного местоположения и, вероятно, будет существенно неверной. | |||
(4) Чтобы определить надежность данной стратегии, вы проводите локальный анализ наихудшего случая в непосредственной близости от плохой оценки. В частности, вы вычисляете наибольшее безопасное отклонение от плохой оценки, которое не нарушает требования к производительности. | (5) Вы вычисляете надежность каждой стратегии поиска в своем портфолио и выбираете ту, надежность которой является наибольшей. | (6) Чтобы напомнить себе и спонсорам экспедиции, что этот анализ подвержен серьезной неопределенности в отношении истинного местонахождения клада, важно - с методологической точки зрения - показать истинное местоположение на карте. Конечно, вы не знаете истинного местоположения. Но, учитывая серьезность неопределенности, вы помещаете ее на некотором расстоянии от плохой оценки. Чем серьезнее неопределенность, тем больше должно быть расстояние (разрыв) между истинным местоположением и оценкой. | |||
Эпилог: Согласно Сниедовичу (2007), это важное напоминание о центральной проблеме принятия решений в условиях серьезной неопределенности. Полученная у нас оценка является плохим индикатором истинного значения интересующего параметра и, вероятно, в значительной степени неверна. Следовательно, в случае информационного пробела важно показать пробел на карте, отображая истинное значение где-то в области неопределенности. Маленький красный представляет истинное (неизвестное) местонахождение клада. |
В итоге:
Модель устойчивости Info-gap - это математическое представление локального анализа наихудшего случая в окрестности данной оценки истинного значения интересующего параметра. В условиях серьезной неопределенности предполагается, что оценка является плохим показателем истинного значения параметра и, вероятно, будет существенно неверной.
Таким образом, главный вопрос: учитывая
- Строгость неопределенности
- Местный характер анализа
- Бедные качество сметы
Насколько значимы и полезны результаты, полученные в результате анализа, и насколько надежна методология в целом?
Подробнее об этой критике можно найти на Сайт Сниедовича.
Заметки по искусству математического моделирования
Удовлетворение ограничений vs оптимизация выплат
Любую удовлетворительную задачу можно сформулировать как задачу оптимизации. Чтобы убедиться в этом, пусть целевая функция задачи оптимизации будет индикаторная функция ограничений, относящихся к удовлетворительной задаче. Таким образом, если наша задача состоит в том, чтобы идентифицировать наихудший сценарий, относящийся к ограничению, это можно сделать с помощью подходящего максиминного / минимаксного анализа наихудшего случая индикаторной функции ограничения.
Это означает, что общие теоретические модели принятия решений могут обрабатывать результаты, вызванные удовлетворение ограничений требования, а не сказать максимизация выигрыша.
В частности, отметим эквивалентность
куда