Взвешивание обратной вероятности - Википедия - Inverse probability weighting
Взвешивание обратной вероятности статистический метод расчета статистики, стандартизированный псевдопопуляция отличается от того, в котором были собраны данные. Часто применяются планы исследований с разрозненной выборкой и популяцией целевой группы (целевая группа).[1] Могут существовать запретительные факторы, не позволяющие исследователям напрямую брать образцы из целевой группы, такие как стоимость, время или этические соображения.[2] Решением этой проблемы является использование альтернативной стратегии проектирования, например стратифицированная выборка. Взвешивание при правильном применении потенциально может повысить эффективность и уменьшить смещение невзвешенных оценок.
Одна очень ранняя взвешенная оценка - это Оценка Хорвица – Томпсона среднего.[3] Когда вероятность выборки известно, из которого выборочная совокупность берется из целевой совокупности, то величина, обратная этой вероятности, используется для взвешивания наблюдений. Этот подход был обобщен для многих аспектов статистики в различных рамках. В частности, есть взвешенная вероятность, взвешенные оценочные уравнения, и взвешенные плотности вероятности на основании которых получено большинство статистических данных. Эти приложения систематизировали теорию другой статистики и оценок, таких как маргинальные структурные модели, то стандартизованный коэффициент смертности, а EM алгоритм для грубых или агрегированных данных.
Взвешивание обратной вероятности также используется для учета отсутствующих данных, когда субъекты с отсутствующими данными не могут быть включены в первичный анализ.[4]С оценкой вероятности выборки или вероятности того, что фактор будет измерен в другом измерении, обратное взвешивание вероятности может быть использовано для завышения веса для субъектов, которые недостаточно представлены из-за большой степени отсутствующие данные.
Средневзвешенная оценка обратной вероятности (IPWE)
Оценщик с обратной вероятностью взвешивания может использоваться для демонстрации причинно-следственной связи, когда исследователь не может провести контролируемый эксперимент, но имеет наблюдаемые данные для моделирования. Поскольку предполагается, что лечение не назначается случайным образом, цель состоит в том, чтобы оценить контрфактический или потенциальный результат, если бы всем субъектам в популяции было назначено любое лечение.
Предположим, что наблюдаемые данные нарисованный i.i.d[требуется разъяснение ] (независимые и одинаково распределенные) из неизвестного распределения P, где
- ковариаты
- это два возможных лечения.
- отклик
- Мы не предполагаем, что лечение назначается случайным образом.
Цель - оценить потенциальный результат, , это наблюдалось бы, если бы субъекту назначили лечение a. Затем сравните средний результат, если бы всем пациентам в популяции было назначено любое лечение: . Мы хотим оценить с использованием данных наблюдений .
Формула оценщика
Создание IPWE
- куда
- строить или же с использованием любой модели склонности (часто модели логистической регрессии)
После вычисления среднего значения каждой группы лечения можно использовать статистический t-критерий или тест ANOVA для оценки разницы между средними значениями группы и определения статистической значимости эффекта лечения.
Предположения
- Последовательность:
- Никаких неизмеренных искажающих факторов:
- Назначение лечения основано исключительно на данных ковариации и не зависит от потенциальных результатов.
- Позитивность: для всех и
Ограничения
Средневзвешенная оценка обратной вероятности (IPWE) может быть нестабильной, если предполагаемые склонности малы. Если вероятность назначения какого-либо лечения мала, тогда модель логистической регрессии может стать нестабильной вокруг хвостов, в результате чего IPWE также станет менее стабильным.
Расширенная обратная взвешенная оценка вероятности (AIPWE)
Альтернативная оценка - это расширенная оценка с обратной взвешенной вероятностью (AIPWE), сочетающая в себе свойства оценки на основе регрессии и оценки с обратной взвешенной вероятностью. Следовательно, это «вдвойне надежный» метод, поскольку он требует только правильного определения модели склонности или результата, но не того и другого вместе. Этот метод дополняет IPWE, чтобы уменьшить изменчивость и повысить эффективность оценки. Эта модель придерживается тех же предположений, что и взвешенная оценка обратной вероятности (IPWE).[5]
Формула оценщика
Создание AIPWE
- Построить оценку регрессии предсказывать исход на основе ковариат и лечение
- Построить оценку склонности
- Объедините в AIPWE, чтобы получить
Смотрите также
Рекомендации
- ^ Робинс, JM; Ротницкий, А; Чжао, LP (1994). «Оценка коэффициентов регрессии при не всегда соблюдении некоторых регрессоров». Журнал Американской статистической ассоциации. 89 (427): 846–866. Дои:10.1080/01621459.1994.10476818.
- ^ Бреслоу, NE; Ламли, Т; и другие. (2009). «Использование всей когорты в анализе данных по когортным случаям». Am J Epidemiol. 169 (11): 1398–1405. Дои:10.1093 / aje / kwp055. ЧВК 2768499. PMID 19357328.
- ^ Horvitz, D.G .; Томпсон, Д. Дж. (1952). «Обобщение выборки без замены из конечной вселенной». Журнал Американской статистической ассоциации. 47: 663–685. Дои:10.1080/01621459.1952.10483446.
- ^ Эрнан, Массачусетс; Робинс, JM (2006). «Оценка причинных эффектов по эпидемиологическим данным». J Epi Comm. 60: 578–596. CiteSeerX 10.1.1.157.9366. Дои:10.1136 / jech.2004.029496. ЧВК 2652882. PMID 16790829.
- ^ Цао, Вэйхуа; Циатис, Анастасиос А .; Давидян, Мари (2009). «Повышение эффективности и надежности дважды надежной оценки для среднего значения генеральной совокупности с неполными данными». Биометрика. 96 (3): 723–734. Дои:10.1093 / biomet / asp033. ISSN 0006-3444. ЧВК 2798744. PMID 20161511.