Ошибка выборки - Википедия - Sampling error

В статистика, ошибки выборки возникают, когда статистические характеристики совокупности оцениваются по подмножеству, или образец, этого населения. Поскольку выборка не включает всех членов генеральной совокупности, статистические данные по выборке, такие как средние и квартили, обычно отличаются от характеристик всей генеральной совокупности, которые известны как параметры. Например, если измерить рост тысячи человек из страны с населением в один миллион человек, средний рост тысячи людей обычно не совпадает со средним ростом всего миллиона человек в стране. Поскольку выборка обычно проводится для определения характеристик всей совокупности, разница между значениями выборки и совокупности считается несущественной. ошибка.[1] Точное измерение ошибки выборки, как правило, невозможно, поскольку истинные значения совокупности неизвестны.

Описание

Случайная выборка

В статистика, ошибка выборки ошибка вызвано наблюдением за выборкой, а не за всей совокупностью.[1] Ошибка выборки - это разница между статистикой выборки, используемой для оценки параметра совокупности, и фактическим, но неизвестным значением параметра.[2]An оценка количества представляющие интерес, такие как среднее или процентное значение, как правило, будут варьироваться от образца к образцу.[1] Эти вариации возможных значений выборки статистика теоретически может быть выражена как ошибки выборки, хотя на практике точная ошибка выборки обычно неизвестна. Ошибка выборки также в более широком смысле относится к этому явлению случайной вариации выборки.

Случайная выборка и производные от нее термины, такие как ошибка выборки, просто специальные процедуры для сбора и анализа данных, которые строго применяются в качестве метода получения результатов, которые считаются репрезентативными для данной совокупности в целом. Несмотря на распространенное заблуждение, «случайность» не означает то же самое, что «случайность», поскольку эта идея часто используется при описании ситуаций неопределенности, и это не то же самое, что прогнозы, основанные на оцененной вероятности или частоте. Выборка всегда относится к процедуре сбора данных от небольшой группы людей, которая якобы является репрезентативной для более крупной группы, которую в принципе можно измерить как совокупность. Случайная выборка используется именно для того, чтобы гарантировать действительно репрезентативную выборку, из которой можно делать выводы, в которых были бы получены те же результаты, если бы вместо этого была включена вся генеральная совокупность. Случайная выборка (и ошибка выборки) может использоваться только для сбора информации об одном определенном моменте времени. Если будут собраны дополнительные данные (остальное остается неизменным), тогда возможно сравнение по периодам времени. Однако это сравнение отличается от любой выборки. Как метод сбора данных в области статистики, случайная выборка явно отличается от причинного процесса, который пытаются измерить. Само проведение исследования может привести к определенным результатам, влияющим на исследуемую группу, но этот эффект не является тем, что называется ошибкой выборки. Ошибка выборки всегда относится к признанным ограничениям любой предположительно репрезентативной выборочной совокупности в отражении большей совокупности, а ошибка относится только к несоответствию, которое может возникнуть в результате оценки целого на основе гораздо меньшего числа. Это всего лишь «ошибка» в том смысле, что она была бы автоматически исправлена, если бы оценивалась сама совокупность. Термин не имеет реального значения вне статистики.

Согласно другой точке зрения, потенциальным примером ошибки выборки в эволюции является генетический дрейф; случайное изменение частот аллелей в популяции. Например, эффект узкого места; когда стихийные бедствия резко сокращают численность населения, что приводит к небольшому количеству населения, которое может или не может точно представлять первоначальное население. Что может сделать эффект узкого места ошибкой выборки, так это то, что определенные аллели из-за стихийного бедствия более распространены, в то время как другие могут полностью исчезнуть, что делает это потенциальной ошибкой выборки. Другой пример генетического дрейфа, который является потенциальной ошибкой выборки, - эффект основателя. Эффект основателя возникает, когда несколько особей из большей популяции заселяют новую изолированную территорию. В этом случае есть только несколько особей с небольшим разнообразием генов, что делает возможной ошибку выборки.[3]

Вероятный размер ошибки выборки, как правило, можно контролировать, взяв достаточно большой случайный пример от населения,[4] хотя стоимость этого может быть непомерно высокой; видеть определение размера выборки и статистическая мощность для более подробной информации. Если наблюдения собираются из случайной выборки, статистическая теория обеспечивает вероятностный оценки вероятного размера ошибки выборки для конкретного статистика или же оценщик. Они часто выражаются в терминах стандартная ошибка.

Проблемы смещения

Смещение выборки является возможным источником ошибок выборки, когда выборка выбирается таким образом, что вероятность включения некоторых лиц в выборку ниже, чем у других. Это приводит к ошибкам выборки, которые могут быть либо положительными, либо отрицательными. Такие ошибки можно рассматривать как систематические ошибки.

Ошибка, не связанная с выборкой

Ошибку выборки можно противопоставить ошибка, не связанная с выборкой. Ошибка, не связанная с выборкой, - это общий термин для отклонений от истинного значения, которые не являются функцией выбранной выборки, включая различные систематические ошибки и любые случайные ошибки, не связанные с выборкой. Ошибки, не связанные с выборкой, гораздо труднее определить количественно, чем ошибку выборки.[4]

Смотрите также

Рекомендации

  1. ^ а б c Сарндал, Свенсон и Ретман (1992), Model Assisted Survey Sampling, Springer-Verlag, ISBN  0-387-40620-4
  2. ^ Burns, N .; Гроув, С. К. (2009). Практика медсестринских исследований: оценка, синтез и получение доказательств (6-е изд.). Сент-Луис, Миссури: Сондерс Эльзевьер. ISBN  978-1-4557-0736-2.
  3. ^ Кэмпбелл, Нил А .; Рис, Джейн Б. (2002). Биология. Бенджамин Каммингс. С. 450–451. ISBN  0-536-68045-0.
  4. ^ а б Шейрен, Фриц (2005). «Что такое допустимая погрешность?». Что такое опрос? (PDF). Вашингтон, округ Колумбия: Американская статистическая ассоциация.. Получено 2008-01-08.