Смещение оценщика - Bias of an estimator

В статистика, то предвзятость (или же функция смещения) из оценщик разница между этим оценщиком ожидаемое значение и истинное значение оцениваемого параметра. Оценка или правило принятия решения с нулевым смещением называется беспристрастный. В статистике «предвзятость» - это цель собственность оценщика. Смещение также может быть измерено относительно медиана, а не среднее (ожидаемое значение), и в этом случае различают медиана- непредвзято от обычного иметь в виду-свойство непредвзятости. Смещение - это концепция, отличная от последовательность. Последовательные оценки сходятся по вероятности к истинному значению параметра, но могут быть смещенными или несмещенными; видеть предвзятость против последовательности для большего.

При прочих равных, несмещенная оценка предпочтительнее, чем смещенная оценка, хотя на практике часто используются смещенные оценки (обычно с небольшим смещением). Когда используется смещенная оценка, вычисляются границы смещения. Смещенная оценка может использоваться по разным причинам: поскольку несмещенная оценка не существует без дополнительных предположений о совокупности; потому что оценку сложно вычислить (как в объективная оценка стандартного отклонения ); потому что оценка является несмещенной по среднему, но не по среднему (или наоборот); потому что смещенная оценка дает более низкое значение некоторых функция потерь (особенно среднеквадратичная ошибка ) по сравнению с несмещенными оценками (особенно в оценщики усадки ); или потому, что в некоторых случаях объективность является слишком сильным условием, и единственные объективные оценки бесполезны.

Кроме того, несмещенность по среднему не сохраняется при нелинейных преобразованиях, хотя средняя несмещенность сохраняется (см. § Эффект преобразований ); например, выборочная дисперсия является смещенной оценкой дисперсии совокупности. Все это проиллюстрировано ниже.

Определение

Предположим, у нас есть статистическая модель, параметризованный действительным числом θ, приводя к распределению вероятностей для наблюдаемых данных, , и статистика который служит оценщик из θ на основе любых наблюдаемых данных . То есть мы предполагаем, что наши данные следуют некоторому неизвестному распределению (куда θ фиксированная неизвестная константа, которая является частью этого распределения), а затем мы строим некоторую оценку который сопоставляет наблюдаемые данные со значениями, которые, как мы надеемся, близки к θ. В предвзятость из относительно определяется как[1][2]

куда обозначает ожидаемое значение по распределению (т.е. усреднение по всем возможным наблюдениям ). Второе уравнение следует из того, что θ измерима относительно условного распределения .

Оценщик называется беспристрастный если его смещение равно нулю для всех значений параметра θили, что эквивалентно, если ожидаемое значение оценщика совпадает с ожидаемым значением параметра.[3]

В имитационном эксперименте, касающемся свойств оценщика, смещение оценщика можно оценить с помощью средняя знаковая разница.

Примеры

Выборочная дисперсия

В выборочная дисперсия случайной величины демонстрирует два аспекта смещения оценки: во-первых, наивная оценка смещена, что может быть скорректировано с помощью масштабного коэффициента; во-вторых, несмещенная оценка не оптимальна с точки зрения среднеквадратичная ошибка (MSE), который можно минимизировать, используя другой масштабный коэффициент, что приводит к смещенной оценке с более низкой MSE, чем несмещенная оценка. Конкретно, наивная оценка суммирует квадраты отклонений и делит на п, что предвзято. Вместо этого деление на п - 1 дает объективную оценку. И наоборот, MSE можно минимизировать путем деления на другое число (в зависимости от распределения), но это приводит к смещенной оценке. Это число всегда больше, чем п - 1, поэтому он известен как оценщик усадки, поскольку он «сжимает» несмещенную оценку до нуля; для нормального распределения оптимальное значение п + 1.

Предполагать Икс1, ..., Иксп находятся независимые и одинаково распределенные (i.i.d.) случайные величины с ожидание μ и отклонение σ2. Если выборочное среднее и нескорректированный выборочная дисперсия определены как

тогда S2 предвзятая оценка σ2, потому что

В продолжение заметим, что вычитая с обеих сторон , мы получили

Значение (путем перекрестного умножения) . Тогда предыдущее становится:

Другими словами, ожидаемое значение нескорректированной дисперсии выборки не равно дисперсии генеральной совокупности. σ2, если не умножить на коэффициент нормализации. С другой стороны, выборочное среднее является беспристрастным[4] оценка среднего населенияμ.[3]

Обратите внимание, что обычное определение дисперсии выборки: , и это несмещенная оценка дисперсии совокупности.

В этом можно убедиться, отметив следующую формулу, которая следует из Формула Биенайме, для члена в неравенстве для математического ожидания нескорректированной выборочной дисперсии выше:

Алгебраически говоря, беспристрастен, потому что:

где переход ко второй строке использует результат, полученный выше для смещенной оценки. Таким образом , и поэтому - объективная оценка дисперсии совокупности, σ2. Отношение между смещенной (нескорректированной) и несмещенной оценками дисперсии известно как Поправка Бесселя.

Причина, по которой нескорректированная дисперсия выборки, S2, смещен из-за того, что выборочное среднее обыкновенный метод наименьших квадратов (OLS) оценка для μ: это число, составляющее сумму как можно меньше. То есть, когда в эту сумму подставляется любое другое число, сумма может только увеличиваться. В частности, выбор дает,

а потом

Приведенное выше обсуждение можно понять в геометрических терминах: вектор можно разложить на «среднюю часть» и «часть дисперсии» путем проецирования в направлении и к гиперплоскости ортогонального дополнения этого направления. Один получает для части вместе и для дополнительной части. Поскольку это ортогональное разложение, теорема Пифагора гласит , и исходя из ожиданий получаем , как указано выше (но раз Если распределение осесимметрична, как и в случае, когда выбираются из гауссиана, затем в среднем размер по способствует в равной степени как направления, перпендикулярные , так что и . Как объяснялось выше, в целом это действительно так.

Оценка вероятности Пуассона

Гораздо более крайний случай, когда смещенная оценка лучше любой несмещенной оценки, возникает из распределение Пуассона.[5][6] Предположим, что Икс имеет распределение Пуассона с математическим ожиданиемλ. Предположим, требуется оценить

с выборкой размером 1. (Например, когда входящие вызовы на телефонном коммутаторе моделируются как процесс Пуассона, и λ это среднее количество звонков в минуту, тогда е−2λ это вероятность того, что в следующие две минуты не поступит ни один звонок.)

Поскольку ожидание объективной оценки δ(Икс) равна оценке, т.е.

единственная функция данных, составляющих несмещенную оценку, - это

Чтобы убедиться в этом, заметим, что при разложении eλ из приведенного выше выражения для ожидания сумма, которая осталась, равна Серия Тейлор расширение еλ также, давая eλеλ = e−2λ (видеть Характеристики экспоненциальной функции ).

Если наблюдаемое значение Икс равно 100, то оценка равна 1, хотя истинное значение оцениваемой величины, скорее всего, будет около 0, что является противоположным крайним значением. И если Икс наблюдается равное 101, тогда оценка еще более абсурдна: это -1, хотя оцениваемая величина должна быть положительной.

(Предвзято) оценщик максимального правдоподобия

намного лучше, чем эта беспристрастная оценка. Мало того, что его значение всегда положительно, оно также более точное в том смысле, что его значение среднеквадратичная ошибка

меньше; сравните MSE объективной оценки

MSE - это функции истинной ценностиλ. Смещение оценки максимального правдоподобия:

Максимум дискретного равномерного распределения

Систематическая ошибка оценок максимального правдоподобия может быть значительной. Рассмотрим случай, когда п билеты пронумерованы от 1 до п помещаются в коробку, и один случайным образом выбирается, давая значение Икс. Если п неизвестно, то оценка максимального правдоподобия п является Икс, хотя ожидание Икс данный п только (п + 1) / 2; мы можем быть уверены только в том, что п по крайней мере Икс и, наверное, больше. В этом случае естественная несмещенная оценка равна 2Икс − 1.

Средне-несмещенные оценки

Теория средне-несмещенных оценок была возрождена Джорджем Брауном в 1947 году:[7]

Оценка одномерного параметра θ будет называться несмещенной по медиане, если для фиксированного θ медиана распределения оценки находится на значении θ; т.е. оценка занижается так же часто, как и завышается. Для большинства целей это требование выполняет столько же, сколько и требование несмещенного среднего, и обладает дополнительным свойством, состоящим в том, что оно инвариантно относительно однозначного преобразования.

Другие свойства несмещенных по медиане оценок были отмечены Леманом, Бирнбаумом, ван дер Ваарт и Пфанзаглом.[нужна цитата ] В частности, оценки с несмещенным средним значением существуют в случаях, когда несмещенные по среднему и максимальная вероятность оценщиков не существует. Они инвариантны относительно однозначные преобразования.

Существуют методы построения несмещенных по медиане оценок для вероятностных распределений, которые имеют монотонные функции правдоподобия, такие как однопараметрические экспоненциальные семейства, чтобы гарантировать их оптимальность (в некотором смысле аналогично свойству минимальной дисперсии, рассматриваемому для оценок без смещения в среднем).[8][9] Одна из таких процедур является аналогом процедуры Рао – Блэквелла для несмещенных по среднему оценок оценок: процедура выполняется для меньшего класса вероятностных распределений, чем процедура Рао – Блэквелла для несмещенных в среднем оценок, но для более широкого класса функций потерь.[9]

Смещение относительно других функций потерь

Любая минимальная дисперсия иметь в видунесмещенная оценка минимизирует рисковать (ожидаемый убыток ) относительно квадрата ошибки функция потерь (среди оценок со средним несмещенным значением), как отмечает Гаусс.[10] Минимум-среднее абсолютное отклонение медиана объективная оценка сводит к минимуму риск по отношению к абсолютный функция потерь (среди несмещенных по медиане оценок), Лаплас.[10][11] Другие функции потерь используются в статистике, особенно в надежная статистика.[10][12]

Эффект преобразований

Как указано выше, для одномерных параметров оценки без смещения к медиане остаются несмещенными по медиане при преобразованиях, сохраняющих порядок (или обратный порядок).

Обратите внимание, что когда преобразование применяется к несмещенному среднему оценщику, результат не обязательно должен быть несмещенным к среднему оценщиком соответствующей статистики совокупности. К Неравенство Дженсена, а выпуклая функция поскольку преобразование приведет к положительному смещению, а вогнутая функция приведет к отрицательному смещению, а функция смешанной выпуклости может внести смещение в любом направлении, в зависимости от конкретной функции и распределения. То есть для нелинейной функции ж и оценка со средним несмещением U параметра п, составная оценка ж(U) не обязательно должна быть несмещенной по среднему оценкой ж(п). Например, квадратный корень объективной оценки населения отклонение является нет средне-несмещенная оценка населения стандартное отклонение: квадратный корень из несмещенного выборочная дисперсия исправленный стандартное отклонение выборки, предвзято. Смещение зависит как от распределения выборки оценщика, так и от преобразования и может быть весьма сложно вычислить - см. объективная оценка стандартного отклонения для обсуждения в этом случае.

Смещение, дисперсия и среднеквадратичная ошибка

Выборочные распределения двух альтернативных оценок для параметра β0. Хотя β1^ несмещен, он явно уступает смещенному β2^.

Регрессия хребта является одним из примеров метода, при котором допущение небольшого смещения может привести к значительному уменьшению дисперсии и получению более надежных оценок в целом.

В то время как смещение количественно оценивает средний Различия между оценочным устройством и базовым параметром следует ожидать; кроме того, можно ожидать, что оценка, основанная на конечной выборке, будет отличаться от параметра из-за случайности в выборке.

Одним из показателей, который используется для отражения обоих типов различий, является среднеквадратичная ошибка,[2]

Можно показать, что это равно квадрату смещения плюс дисперсия:[2]

Когда параметр является вектором, применяется аналогичное разложение:[13]

куда

- след ковариационной матрицы оценки.

Оценщик, который минимизирует смещение, не обязательно минимизирует среднеквадратичную ошибку.

Пример: оценка дисперсии совокупности

Например,[14] предположим оценщик вида

ищется для дисперсии совокупности, как указано выше, но на этот раз для минимизации MSE:

Если переменные Икс1 ... Иксп следовать нормальному распределению, затем нс2/ σ2 имеет распределение хи-квадрат с п - 1 степень свободы, дающая:

и так

С помощью небольшой алгебры можно подтвердить, что это c = 1/(п + 1), который минимизирует эту комбинированную функцию потерь, а не c = 1/(п - 1), что сводит к минимуму только член смещения.

В более общем смысле, только в ограниченных классах задач будет средство оценки, которое минимизирует MSE независимо от значений параметров.

Однако очень часто это может восприниматься как компромисс между смещением и дисперсией, так что небольшое увеличение смещения может быть обменено на большее уменьшение дисперсии, что приводит к более желательной оценке в целом.

Байесовский взгляд

Большинство байесовцев довольно безразлично к беспристрастности (по крайней мере, в формальном смысле теории выборки выше) своих оценок. Например, Гельман и соавторы (1995) пишут: «С байесовской точки зрения принцип беспристрастности разумен в пределах больших выборок, но в остальном он потенциально вводит в заблуждение».[15]

По сути, разница между Байесовский подход и подход теории выборки, описанный выше, заключается в том, что в подходе теории выборки параметр принимается как фиксированный, а затем рассматриваются вероятностные распределения статистики, основанные на предсказанном распределении выборки данных. Однако для байесовцев это данные которые известны и фиксированы, и это неизвестный параметр, для которого делается попытка построить распределение вероятностей, используя Теорема Байеса:

Здесь второй член, вероятность данных при неизвестном значении параметра θ, зависит только от полученных данных и моделирования процесса генерации данных. Однако байесовский расчет также включает в себя первый член, априорная вероятность для θ, который учитывает все, что аналитик может знать или подозревать о θ перед данные поступают. Эта информация не играет никакой роли в подходе теории выборки; действительно, любая попытка включить это будет считаться «отклонением» от того, на что указывают чисто данные. Поскольку байесовские расчеты включают априорную информацию, по сути неизбежно, что их результаты не будут «беспристрастными» с точки зрения теории выборки.

Но результаты байесовского подхода могут отличаться от подхода теории выборки, даже если байесовский пытается принять «неинформативный» априор.

Например, снова рассмотрим оценку неизвестной дисперсии совокупности σ2 нормального распределения с неизвестным средним, где желательно оптимизировать c в функции ожидаемых потерь

Стандартный выбор неинформативного априора для этой проблемы - Джеффрис приор, , что эквивалентно принятию инвариантного к масштабированию плоского до ln (σ2).

Одним из следствий принятия этого априора является то, что S2/ σ2 остается основное количество, т.е. распределение вероятностей S2/ σ2 зависит только от S2/ σ2, независимо от значения S2 или σ2:

Однако пока

в отличие

- когда математическое ожидание принимается по распределению вероятностей σ2 данный S2, как в байесовском случае, а не S2 учитывая σ2, больше нельзя брать σ4 как константа и вычтите ее. Следствием этого является то, что по сравнению с расчетом по теории выборки байесовский расчет придает большее значение большим значениям σ.2, должным образом принимая во внимание (в отличие от расчетов по теории выборки), что при использовании этой функции квадратов потерь следствие недооценки больших значений σ2 является более затратным с точки зрения квадрата потерь, чем переоценка малых значений σ2.

Разработанный байесовский расчет дает масштабированное обратное распределение хи-квадрат с п - 1 степень свободы для апостериорного распределения вероятностей σ2. Ожидаемый убыток сводится к минимуму, когда CNS2 = <σ2>; это происходит, когда c = 1/(п − 3).

Следовательно, даже при неинформативном априорном вычислении байесовское вычисление может не дать такого же результата минимизации ожидаемых потерь, как соответствующее вычисление теории выборки.

Смотрите также

Примечания

  1. ^ «Список вероятностных и статистических символов». Математическое хранилище. 2020-04-26. Получено 2020-09-12.
  2. ^ а б c Коздрон, Михаил (март 2016). «Оценка качества оценщика: систематическая ошибка, среднеквадратическая ошибка, относительная эффективность (глава 3)» (PDF). stat.math.uregina.ca. Получено 2020-09-11.
  3. ^ а б Тейлор, Кортни (13 января 2019 г.). «Беспристрастные и предвзятые оценщики». ThoughtCo. Получено 2020-09-12.
  4. ^ Ричард Арнольд Джонсон; Дин В. Уичерн (2007). Прикладной многомерный статистический анализ. Пирсон Прентис Холл. ISBN  978-0-13-187715-3. Получено 10 августа 2012.
  5. ^ Дж. П. Романо и А. Ф. Сигель (1986) Контрпримеры в вероятности и статистике, Wadsworth & Brooks / Cole, Монтерей, Калифорния, США, стр. 168
  6. ^ Харди, М. (1 марта 2003 г.). «Яркий контрпример». Американский математический ежемесячный журнал. 110 (3): 234–238. arXiv:математика / 0206006. Дои:10.2307/3647938. ISSN  0002-9890. JSTOR  3647938.
  7. ^ Браун (1947), стр. 583
  8. ^ Пфанцагль, Иоганн (1979). «Об оптимальных медианных несмещенных оценках при наличии мешающих параметров». Анналы статистики. 7 (1): 187–193. Дои:10.1214 / aos / 1176344563.
  9. ^ а б Brown, L.D .; Коэн, Артур; Strawderman, W. E. (1976). «Теорема о полном классе для строгого монотонного отношения правдоподобия с приложениями». Анна. Статист. 4 (4): 712–722. Дои:10.1214 / aos / 1176343543.
  10. ^ а б c Додж, Ядола, изд. (1987). Статистический анализ данных на основе L1-Нормальные и связанные методы. Материалы Первой Международной конференции, состоявшейся в Невшателе 31 августа - 4 сентября 1987 г. Амстердам: Северная Голландия. ISBN  0-444-70273-3.
  11. ^ Джейнс, Э. Т. (2007). Теория вероятностей: логика науки. Кембридж: Cambridge Univ. Нажмите. п. 172. ISBN  978-0-521-59271-0.
  12. ^ Клебанов, Лев Б .; Рачев, Светлозар Т .; Фабоцци, Фрэнк Дж. (2009). «Функции потерь и теория объективного оценивания». Робастные и ненадежные модели в статистике. Нью-Йорк: Nova Scientific. ISBN  978-1-60741-768-2.
  13. ^ Табога, Марко (2010). «Лекции по теории вероятностей и математической статистике».
  14. ^ ДеГрут, Моррис Х. (1986). вероятность и статистика (2-е изд.). Эддисон-Уэсли. стр.414 –5. ISBN  0-201-11366-X. Но сравните это, например, с обсуждением в Казелла; Бергер (2001). Статистические выводы (2-е изд.). Даксбери. п. 332. ISBN  0-534-24312-6.
  15. ^ Гельман, А .; и другие. (1995). Байесовский анализ данных. Чепмен и Холл. п. 108. ISBN  0-412-03991-5.

Рекомендации

  • Браун, Джордж У. «Об оценке по малой выборке». Анналы математической статистики, т. 18, нет. 4 (декабрь 1947 г.), стр. 582–585. JSTOR  2236236.
  • Леманн, Э. «Общее понятие беспристрастности» Анналы математической статистики, т. 22, нет. 4 (декабрь 1951 г.), стр. 587–592. JSTOR  2236928.
  • Аллан Бирнбаум, 1961. "Единая теория оценивания, I", Анналы математической статистики, т. 32, нет. 1 (март 1961 г.), стр. 112–135.
  • Ван дер Ваарт, Х. Р., 1961 ".Некоторые расширения идеи предвзятости " Анналы математической статистики, т. 32, нет. 2 (июнь 1961 г.), стр. 436–447.
  • Пфанцагль, Иоганн. 1994 г. Параметрическая статистическая теория. Вальтер де Грюйтер.
  • Стюарт, Алан; Орд, Кейт; Арнольд, Стивен [Ф.] (2010). Классический вывод и линейная модель. Продвинутая теория статистики Кендалла. . Вайли. ISBN  0-4706-8924-2..
  • Воинов, Василий [Г.]; Никулин, Михаил [С.] (1993). Беспристрастные оценщики и их приложения. 1: Одномерный случай. Дордрект: Kluwer Academic Publishers. ISBN  0-7923-2382-3.
  • Воинов, Василий [Г.]; Никулин, Михаил [С.] (1996). Беспристрастные оценщики и их приложения. 2: многомерный случай. Дордрект: Kluwer Academic Publishers. ISBN  0-7923-3939-8.
  • Клебанов, Лев [Б.]; Рачев, Светлозар [Т.]; Фабоцци, Франк [Дж.] (2009). Робастные и ненадежные модели в статистике. Нью-Йорк: Nova Scientific Publishers. ISBN  978-1-60741-768-2.

внешняя ссылка