Выборочное распределение - Sampling distribution
В статистика, а выборочное распределение или же распределение конечной выборки это распределение вероятностей данного случайный пример -основан статистика. Если произвольно большое количество выборок, каждая из которых включает несколько наблюдений (точек данных), использовалось отдельно для вычисления одного значения статистики (такой как, например, выборочное среднее или образец отклонение ) для каждой выборки, то распределение выборки - это распределение вероятностей значений, которые принимает статистика. Во многих контекстах наблюдается только одна выборка, но распределение выборки можно найти теоретически.
Распределения выборки важны в статистике, потому что они значительно упрощают путь к статистические выводы. Более конкретно, они позволяют основывать аналитические соображения на распределении вероятностей статистики, а не на совместное распределение вероятностей всех индивидуальных значений выборки.
Вступление
В выборочное распределение статистики - это распределение этой статистики, рассматриваемой как случайная переменная, когда получено из случайный пример размера . Его можно рассматривать как распределение статистики для все возможные образцы из одной и той же популяции заданного размера выборки. Распределение выборки зависит от основного распределение совокупности, рассматриваемой статистики, используемой процедуры выборки и размера выборки. Часто возникает значительный интерес к тому, можно ли аппроксимировать выборочное распределение асимптотическое распределение, который соответствует предельному случаю, либо когда число случайных выборок конечного размера, взятых из бесконечной совокупности и используемых для получения распределения, стремится к бесконечности, либо когда из этой выборки берется только одна «выборка» равного бесконечного размера. такое же население.
Например, рассмотрим нормальный население со средним и дисперсия . Предположим, мы неоднократно отбираем образцы заданного размера из этой совокупности и вычисляем среднее арифметическое для каждой выборки - эта статистика называется выборочное среднее. Распределение этих средних или средних значений называется «выборочным распределением выборочного среднего». Это распределение нормально (n - размер выборки), поскольку основная совокупность является нормальной, хотя распределения выборки также часто могут быть близки к нормальным, даже если распределение совокупности не является нормальным (см. Центральная предельная теорема ). Альтернативой выборочному среднему является выборка медиана. При вычислении для одной и той же совокупности он имеет распределение выборки, отличное от среднего и обычно не является нормальным (но может быть близким для больших размеров выборки).
Среднее значение выборки из генеральной совокупности, имеющей нормальное распределение, является примером простой статистики, взятой из одного из самых простых статистические группы. Для других статистических данных и других популяций формулы более сложные, и часто их нет в закрытая форма. В таких случаях выборочные распределения могут быть аппроксимированы через Моделирование Монте-Карло[1][п. 2], бутстрап методы, или асимптотическое распределение теория.
Стандартная ошибка
В стандартное отклонение выборочного распределения статистика называетсястандартная ошибка этого количества. Для случая, когда статистикой является среднее значение выборки, а выборки не коррелированы, стандартная ошибка составляет:
куда является стандартным отклонением распределения населения этого количества и - размер выборки (количество элементов в выборке).
Важным следствием этой формулы является то, что размер выборки должен быть увеличен в четыре раза (умножен на 4), чтобы получить половину (1/2) ошибки измерения. При разработке статистических исследований, где стоимость является фактором, это может иметь значение для понимания компромисса между затратами и выгодами.
Для случая, когда статистика представляет собой общий объем выборки, а выборки не коррелированы, стандартная ошибка составляет:
где опять же является стандартным отклонением распределения населения этого количества и - размер выборки (количество элементов в выборке).
Примеры
численность населения | Статистика | Выборочное распределение |
---|---|---|
Нормальный: | Выборочное среднее из образцов размера п | . Если стандартное отклонение не известно, можно считать , который следует за Распределение Стьюдента с степени свободы. Здесь - выборочная дисперсия, а это основное количество, распределение которого не зависит от . |
Бернулли: | Примерная доля «успешных испытаний» | |
Две независимые нормальные популяции: и | Разница между выборочными средними, | |
Любое абсолютно непрерывное распределение F с плотностью ƒ | Медиана из выборки размера п = 2k - 1, где заказан образец к | |
Любое распределение с функцией распределения F | Максимум из случайной выборки размера п |
Рекомендации
- ^ Муни, Кристофер З. (1999). Моделирование Монте-Карло. Таузенд-Оукс, Калифорния: Sage. ISBN 9780803959439.
- Мерберг, А. и С.Дж. Миллер (2008). «Выборочное распределение медианы». Заметки по математике 162: Математическая статистика, в Интернете по адресу http://web.williams.edu/Mat Mathematics/sjmiller/public_html/BrownClasses/162/Handouts/MedianThm04.pdf, стр. 1–9.