Оценка Хорвица – Томпсона - Википедия - Horvitz–Thompson estimator

В статистика, то Оценка Хорвица – Томпсона, названный в честь Дэниела Г. Хорвица и Донована Дж. Томпсона,[1] это метод оценки общей[2] и среднее значение псевдопопуляция в стратифицированная выборка. Взвешивание обратной вероятности применяется для учета различных пропорций наблюдений внутри слоев целевой популяции. Оценка Хорвица – Томпсона часто применяется в обзорный анализ и может использоваться для учета отсутствующие данные.

Метод

Формально пусть быть независимый образец из п из N ≥ n отдельные слои с общим средним значениемμ. Предположим далее, что это вероятность включения что случайно выбранная особь в суперпопуляции принадлежит к яй слой. Оценка Хорвица – Томпсона общей суммы определяется следующим образом:

а оценка среднего значения определяется как:

В Байесовский вероятностная структура считается доля лиц в целевой популяции, принадлежащих к яй слой. Следовательно, можно рассматривать как оценку полной выборки лиц в яй слой. Оценка Хорвица – Томпсона также может быть выражена как предел взвешенного бутстрап повторная выборка оценка среднего. Его также можно рассматривать как частный случай нескольких вменение подходы.[3]

За пост-стратифицированный дизайн исследования, оценка и выполняются отдельными шагами. В таких случаях вычисление дисперсии не однозначно. Для получения согласованных оценок дисперсии оценки Хорвица – Томпсона можно применять методы повторной выборки, такие как бутстрап или складной нож.[4] Пакет "Обзор" для р проводит анализ постстратифицированных данных с использованием оценки Хорвица – Томпсона.[5]

Доказательство объективной оценки Хорвица-Томпсона среднего

Можно показать, что оценка Хорвица – Томпсона несмещена при оценке математического ожидания оценки Хорвица – Томпсона, , следующее:

Рекомендации

  1. ^ Horvitz, D.G .; Томпсон, Д. Дж. (1952) "Обобщение выборки без замены из конечной вселенной", Журнал Американской статистической ассоциации, 47, 663–685, . JSTOR  2280784
  2. ^ Уильям Дж. Кокран (1977), Методы отбора проб, 3-е издание, Wiley. ISBN  0-471-16240-X
  3. ^ Родерик Дж. А. Литтл, Дональд Б. Рубин (2002) Статистический анализ с отсутствующими данными, 2-е изд., Wiley. ISBN  0-471-18386-5
  4. ^ Кватембер, А. (2014). «Конечная популяция начальной загрузки - от максимального правдоподобия к подходу Хорвица-Томпсона». Австрийский статистический журнал. 43: 93–102.
  5. ^ https://cran.r-project.org/web/packages/survey/

внешняя ссылка