Байесовская оценка - Bayes estimator

В теория оценки и теория принятия решений, а Байесовская оценка или Байесовское действие является оценщик или же правило принятия решения что сводит к минимуму задний ожидаемое значение из функция потерь (т.е. апостериорная ожидаемая потеря). Точно так же он максимизирует апостериорное ожидание полезность функция. Альтернативный способ сформулировать оценку в Байесовская статистика является максимальная апостериорная оценка.

Определение

Предположим, неизвестный параметр известно, что предварительное распространение . Позволять быть оценщиком (на основе некоторых измерений Икс), и разреши быть функция потерь, например, квадрат ошибки. В Байесовский риск из определяется как , где ожидание берется по распределению вероятностей : определяет функцию риска как функцию . Оценщик считается Байесовская оценка если это минимизирует байесовский риск среди всех оценщиков. Эквивалентно, оценка, которая минимизирует апостериорные ожидаемые потери для каждого также минимизирует байесовский риск и, следовательно, является байесовским оценщиком.[1]

Если приор неподходящий затем оценка, которая минимизирует апостериорные ожидаемые потери для каждого называется обобщенная байесовская оценка.[2]

Примеры

Оценка минимальной среднеквадратичной ошибки

Наиболее распространенной функцией риска, используемой для байесовской оценки, является среднеквадратичная ошибка (MSE), также называемый риск ошибки в квадрате. MSE определяется

где математическое ожидание берется за совместное распределение и .

Заднее среднее

Используя MSE в качестве риска, байесовская оценка неизвестного параметра представляет собой просто среднее значение апостериорное распределение,[3]

Это известно как минимальная среднеквадратичная ошибка (MMSE) оценщик.

Байесовские оценки для сопряженных априорных вероятностей

Если нет причин предпочитать одно априорное распределение вероятностей другому, сопряженный предшествующий иногда выбирается для простоты. Сопряженное априорное распределение определяется как априорное распределение, принадлежащее некоторому параметрическая семья, для которого полученное апостериорное распределение также принадлежит к тому же семейству. Это важное свойство, поскольку байесовская оценка, а также ее статистические свойства (дисперсия, доверительный интервал и т. Д.) Могут быть получены из апостериорного распределения.

Сопряженные априорные значения особенно полезны для последовательной оценки, когда апостериорная величина текущего измерения используется в качестве апостериорной в следующем измерении. При последовательной оценке, если не используется сопряженное априорное распределение, апостериорное распределение обычно становится более сложным с каждым добавленным измерением, и байесовский оценщик обычно не может быть рассчитан без использования численных методов.

Ниже приведены некоторые примеры сопряженных априорных чисел.

  • Если является Нормальный, , а приора нормально, , то апостериорная оценка также является нормальной, а байесовская оценка при MSE определяется выражением
  • Если находятся iid Пуассон случайные переменные , а если априор Гамма распределенная , то апостериорная также имеет гамма-распределение, а байесовская оценка при MSE дается выражением
  • Если iid равномерно распределены , а если априор Распределенный по Парето , то апостериорная также распределена по Парето, а байесовская оценка при MSE дается выражением

Альтернативные функции риска

Функции риска выбираются в зависимости от того, как измеряется расстояние между оценкой и неизвестным параметром. MSE - наиболее часто используемая функция риска, в первую очередь из-за ее простоты. Однако иногда используются альтернативные функции риска. Ниже приводится несколько примеров таких альтернатив. Обозначим апостериорную обобщенную функцию распределения через .

Задняя медиана и другие квантили

  • «Линейная» функция потерь с , что дает апостериорную медиану как оценку Байеса:
  • Еще одна «линейная» функция потерь, которая присваивает разные «веса» к завышенной или заниженной оценке. Это дает квантиль из апостериорного распределения и является обобщением предыдущей функции потерь:

Задний режим

  • Следующая функция потерь более сложна: она дает либо задний режим, или близкая к нему точка в зависимости от кривизны и свойств апостериорного распределения. Малые значения параметра рекомендуются, чтобы использовать режим как приближение ():

Можно представить себе и другие функции потерь, хотя среднеквадратичная ошибка является наиболее широко используемым и проверенным. Другие функции потерь используются в статистике, особенно в надежная статистика.

Обобщенные байесовские оценки

Предыдущее распространение до сих пор считалось истинным распределением вероятностей в том смысле, что

Однако иногда это может быть ограничительным требованием. Например, нет раздачи (покрывающей множество, риз всех действительных чисел), для которых все действительные числа равновероятны. Тем не менее, в некотором смысле такое «распределение» кажется естественным выбором для неинформативный приор, т.е. априорное распределение, которое не подразумевает предпочтения какого-либо конкретного значения неизвестного параметра. Еще можно определить функцию , но это не было бы правильным распределением вероятностей, поскольку оно имеет бесконечную массу,

Такой меры , которые не являются распределениями вероятностей, называются неподходящие приоры.

Использование неправильного априорного значения означает, что байесовский риск не определен (поскольку априорный результат не является вероятностным распределением, и мы не можем принять за него математическое ожидание). Как следствие, бессмысленно говорить о байесовской оценке, которая минимизирует байесовский риск. Тем не менее во многих случаях можно определить апостериорное распределение

Это определение, а не применение Теорема Байеса, поскольку теорема Байеса применима только тогда, когда все распределения правильные. Однако нередко полученное «апостериорное» распределение является допустимым распределением вероятностей. В этом случае апостериорный ожидаемый убыток

обычно четко определен и конечен. Напомним, что для надлежащего априорного значения байесовская оценка минимизирует апостериорные ожидаемые потери. Когда априорное значение является неправильным, оценщик, который минимизирует апостериорные ожидаемые потери, называется оценкой обобщенная байесовская оценка.[2]

Пример

Типичный пример - оценка параметр местоположения с функцией потерь типа . Здесь - параметр местоположения, т.е. .

Обычно используется неправильный предварительный в этом случае, особенно когда нет другой более субъективной информации. Это дает

так что апостериорная ожидаемая потеря

Обобщенная байесовская оценка - это значение который минимизирует это выражение для данного . Это эквивалентно минимизации

для данного         (1)

В этом случае можно показать, что обобщенная байесовская оценка имеет вид , для некоторой постоянной . Чтобы увидеть это, позвольте - значение, минимизирующее (1), когда . Тогда, учитывая другое значение , мы должны минимизировать

        (2)

Это идентично (1), за исключением того, что был заменен на . Таким образом, минимизирующее выражение дается выражением , так что оптимальная оценка имеет вид

Эмпирические байесовские оценки

Оценка Байеса, полученная через эмпирический метод Байеса называется эмпирическая байесовская оценка. Эмпирические байесовские методы позволяют использовать вспомогательные эмпирические данные из наблюдений за соответствующими параметрами при разработке байесовской оценки. Это делается в предположении, что предполагаемые параметры получены из общей априорной точки. Например, если выполняются независимые наблюдения различных параметров, то эффективность оценки конкретного параметра иногда может быть улучшена за счет использования данных из других наблюдений.

Есть параметрический и непараметрический подходы к эмпирическому байесовскому оцениванию. Параметрический эмпирический байесовский метод обычно предпочтительнее, поскольку он более применим и более точен для небольших объемов данных.[4]

Пример

Ниже приводится простой пример параметрического эмпирического байесовского оценивания. Учитывая прошлые наблюдения имеющий условное распределение , интересно оценить на основе . Предположим, что есть общий приор которое зависит от неизвестных параметров. Например, предположим, что нормально с неизвестным средним и дисперсия Затем мы можем использовать прошлые наблюдения, чтобы определить среднее значение и дисперсию следующим образом.

Сначала оценим среднее и дисперсия предельного распределения с использованием максимальная вероятность подход:

Далее воспользуемся соотношением

куда и моменты условного распределения , которые считаются известными. В частности, предположим, что и это ; тогда у нас есть

Наконец, мы получаем оценочные моменты априорной,

Например, если , и если мы предполагаем нормальную априорность (которая в данном случае является сопряженной априорной), мы заключаем, что , из которого байесовская оценка на основе можно рассчитать.

Характеристики

Допустимость

Правила Байеса, имеющие конечный риск Байеса, обычно допустимый. Ниже приведены некоторые конкретные примеры теорем о допустимости.

  • Если правило Байеса уникально, оно допустимо.[5] Например, как указано выше, при среднеквадратической ошибке (MSE) правило Байеса является уникальным и, следовательно, допустимым.
  • Если θ принадлежит дискретный набор, то допустимы все правила Байеса.
  • Если θ принадлежит непрерывному (недискретному) множеству и если функция риска R (θ, δ) непрерывна по θ для любого δ, то все правила Байеса допустимы.

Напротив, обобщенные правила Байеса часто имеют неопределенный риск Байеса в случае неправильных априорных значений. Эти правила часто недопустимы, и проверка их приемлемости может быть затруднена. Например, обобщенная байесовская оценка параметра местоположения θ на основе гауссовых выборок (описанная выше в разделе «Обобщенная байесовская оценка») недопустима для ; это известно как Феномен Штейна.

Асимптотическая эффективность

Пусть θ - неизвестная случайная величина, и предположим, что находятся iid образцы с плотностью . Позволять быть последовательностью байесовских оценок θ, основанной на увеличивающемся количестве измерений. Нас интересует анализ асимптотической производительности этой последовательности оценок, т. Е. Производительности для больших п.

С этой целью принято рассматривать θ как детерминированный параметр, истинное значение которого . При определенных условиях[6] для больших выборок (большие значения п) апостериорная плотность θ приблизительно нормальна. Другими словами, для больших п, влияние априорной вероятности на апостериорную вероятность незначительно. Более того, если δ - оценка Байеса при риске MSE, то она асимптотически несмещенный и это сходится в распределении к нормальное распределение:

куда я0) это информация рыболова из θ0Отсюда следует, что байесовская оценка δп под MSE асимптотически эффективный.

Другой асимптотически нормальной и эффективной оценкой является оценка оценщик максимального правдоподобия (MLE). Связь между оценками максимального правдоподобия и байесовскими оценками можно показать на следующем простом примере.

Пример: оценка п в биномиальном распределении

Рассмотрим оценку θ на основе биномиальной выборки Икс~ b (θ,п), где θ обозначает вероятность успеха. Предполагая, что θ распределяется согласно сопряженной априорной величине, которая в данном случае является Бета-распределение B (а,б) апостериорное распределение известно как B (a + x, b + n-x). Таким образом, байесовская оценка при MSE равна

MLE в этом случае - x / n, поэтому мы получаем

Из последнего уравнения следует, что при п → ∞ байесовская оценка (в описываемой задаче) близка к MLE.

С другой стороны, когда п мала, априорная информация по-прежнему актуальна для решения проблемы и влияет на оценку. Чтобы увидеть относительный вес априорной информации, предположим, что а=б; в этом случае каждое измерение приносит 1 новый бит информации; формула выше показывает, что априорная информация имеет тот же вес, что и а + б биты новой информации. В приложениях часто очень мало известно о мелких деталях предшествующего распределения; в частности, нет оснований предполагать, что он совпадает с B (а,б) точно. В таком случае одна из возможных интерпретаций этого расчета: «имеется априорное непатологическое распределение со средним значением 0,5 и стандартным отклонением. d что дает вес априорной информации, равный 1 / (4d2) -1 бит новой информации ".

Другой пример того же явления - случай, когда априорная оценка и измерение имеют нормальное распределение. Если приор сосредоточен на B с отклонением Σ, а центр измерения б с отклонением σ, тогда задний центр сосредоточен в , где веса в этом средневзвешенном значении равны α = σ², β = Σ². Кроме того, квадрат апостериорного отклонения равен Σ² + σ². Другими словами, априор совмещается с измерением в точно так же, как если бы это было дополнительное измерение, которое необходимо принять во внимание.

Например, если Σ = σ / 2, то отклонение четырех измерений, объединенных вместе, соответствует отклонению предыдущего (при условии, что ошибки измерений независимы). И веса α, β в формуле для апостериорной оценки соответствуют этому: вес априорной оценки в 4 раза больше веса измерения. Комбинируя это предшествующее с п измерения со средним v приводит к заднему центру ; в частности, предварительная проверка играет ту же роль, что и 4 заранее выполненных измерения. Как правило, приор имеет вес (σ / Σ) ² измерений.

Сравните с примером биномиального распределения: там априор имеет вес (σ / Σ) ² − 1 измерений. Видно, что точный вес действительно зависит от деталей распределения, но когда σ≫Σ, разница становится небольшой.

Практический пример байесовских оценок

В База данных фильмов в Интернете использует формулу для расчета и сравнения рейтингов фильмов своих пользователей, в том числе их 250 лучших названий который, как утверждается, дает «истинную байесовскую оценку».[7] Следующая байесовская формула изначально использовалась для расчета средневзвешенного балла для 250 лучших, хотя с тех пор формула изменилась:

куда:

= взвешенный рейтинг
= средний рейтинг фильма в виде числа от 1 до 10 (средний) = (Рейтинг)
= количество голосов / оценок за фильм = (голосов)
= вес, присвоенный предыдущей оценке (в данном случае количество голосов, которое IMDB считает необходимым для приближения средней оценки к статистической достоверности)
= средний голос по всему пулу (в настоящее время 7.0)

Обратите внимание, что W это просто средневзвешенное арифметическое из р и C с вектором веса (v, м). По количеству оценок превосходит м, достоверность среднего рейтинга превосходит достоверность априорных знаний, а взвешенный байесовский рейтинг (W) приближается к прямому среднему (R). Чем ближе v (количество оценок к фильму) равно нулю, тем ближе W добирается до C, где W - взвешенный рейтинг, а C - средний рейтинг всех фильмов. Таким образом, проще говоря, чем меньше оценок / голосов отдано фильму, тем больше взвешенный рейтинг этого фильма будет отклоняться от среднего по всем фильмам, в то время как фильмы с большим количеством оценок / голосов будут иметь рейтинг, приближающийся к его чистому среднему арифметическому рейтингу.

Подход IMDb гарантирует, что фильм с несколькими рейтингами, все из которых составляет 10, не будет иметь рейтинга выше «Крестного отца», например, со средним значением 9,2 из более чем 500 000 оценок.

Смотрите также

Примечания

  1. ^ Леманн и Казелла, теорема 4.1.1.
  2. ^ а б Леманн и Казелла, определение 4.2.9.
  3. ^ Джейнс, Э. (2007). Теория вероятностей: логика науки (5. печат. Ред.). Кембридж [u.a.]: Cambridge Univ. Нажмите. п. 172. ISBN  978-0-521-59271-0.
  4. ^ Бергер (1980), раздел 4.5.
  5. ^ Леманн и Казелла (1998), теорема 5.2.4.
  6. ^ Леманн и Казелла (1998), раздел 6.8
  7. ^ IMDb Top 250

Рекомендации

внешняя ссылка