Стандартная ошибка - Standard error
В стандартная ошибка (SE)[1][2] из статистика (обычно оценка параметр ) это стандартное отклонение своего выборочное распределение[3] или оценка этого стандартного отклонения. Если статистика является выборочным средним, она называется стандартная ошибка среднего (SEM).[2]
В выборочное распределение среднего значения совокупности генерируется путем повторного отбора проб и регистрации полученных средних значений. Это формирует распределение различных средств, и это распределение имеет свои собственные иметь в виду и отклонение. Математически дисперсия полученного распределения выборки равна дисперсии генеральной совокупности, деленной на размер выборки. Это связано с тем, что по мере увеличения размера выборки средние значения выборки сгруппируются ближе к среднему значению генеральной совокупности.
Следовательно, соотношение между стандартной ошибкой среднего и стандартным отклонением таково, что для данного размера выборки стандартная ошибка среднего равна стандартному отклонению, деленному на квадратный корень размера выборки.[2] Другими словами, стандартная ошибка среднего - это мера разброса выборочных средних вокруг среднего по генеральной совокупности.
В регрессивный анализ, термин "стандартная ошибка" относится либо к квадратному корню из приведенная статистика хи-квадрат, или стандартная ошибка для определенного коэффициента регрессии (как, например, доверительные интервалы ).
Стандартная ошибка среднего
численность населения
Стандартная ошибка среднего (SEM) может быть выражена как:[2]
куда
- σ это стандартное отклонение населения.
- п - размер (количество наблюдений) выборки.
Оценивать
Поскольку стандартное отклонение населения редко известно, стандартная ошибка среднего обычно оценивается как стандартное отклонение выборки деленное на квадратный корень из размера выборки (при условии статистической независимости значений в выборке).
куда
- s это стандартное отклонение выборки (т. е. основанная на выборке оценка стандартного отклонения генеральной совокупности), и
- п - размер (количество наблюдений) выборки.
Образец
В тех контекстах, где стандартная ошибка среднего значения определяется не как стандартное отклонение выборки, а как его оценка, это оценка, обычно указываемая как ее значение. Таким образом, стандартное отклонение среднего значения часто определяется как:
Примечание: стандартная ошибка и стандартное отклонение малых выборок, как правило, систематически занижают стандартную ошибку генеральной совокупности и стандартное отклонение. В частности, стандартная ошибка среднего составляет предвзятый оценщик стандартной ошибки генеральной совокупности. При n = 2 занижение составляет около 25%, но для n = 6 занижение составляет всего 5%. Гурланд и Трипати (1971) предлагают поправку и уравнение для этого эффекта.[4] Сокал и Рольф (1981) приводят уравнение поправочного коэффициента для небольших выборокп < 20.[5] Видеть объективная оценка стандартного отклонения для дальнейшего обсуждения.
Практический результат: Для уменьшения неопределенности в оценке среднего значения в два раза требуется получить в четыре раза больше наблюдений в выборке; уменьшение стандартной ошибки в десять раз требует в сто раз больше наблюдений.
Производные
Формула может быть получена из отклонение суммы независимых случайных величин.[6]
- Если находятся независимые наблюдения от популяции со средним и стандартное отклонение , то отклонение от общего является
- Дисперсия (значение ) должно быть В качестве альтернативы,
- Следовательно, стандартное отклонение должно быть .
Независимые и одинаково распределенные случайные величины со случайным размером выборки
Бывают случаи, когда образец берут, не зная заранее, сколько наблюдений будет приемлемым по тому или иному критерию. В таких случаях размер выборки случайная величина, вариация которой добавляет к вариации так что,
Если имеет распределение Пуассона, тогда с оценщиком . Следовательно, оценка становится , приводя к следующей формуле для стандартной ошибки:
(поскольку стандартное отклонение - это квадратный корень из дисперсии)
Приближение Стьюдента при σ значение неизвестно
Во многих практических приложениях истинная ценность σ неизвестно. В результате нам нужно использовать распределение, которое учитывает этот разброс возможных σ 's. Если известно, что истинное базовое распределение является гауссовым, хотя и с неизвестным σ, то полученное оцененное распределение следует t-распределению Стьюдента. Стандартная ошибка - это стандартное отклонение t-распределения Стьюдента. Т-распределения немного отличаются от гауссовых и меняются в зависимости от размера выборки. Небольшие выборки с большей вероятностью недооценивают стандартное отклонение совокупности и имеют среднее значение, которое отличается от истинного среднего значения совокупности, а t-распределение Стьюдента учитывает вероятность этих событий с несколько более тяжелыми хвостами по сравнению с гауссовым. Для оценки стандартной ошибки t-распределения Стьюдента достаточно использовать стандартное отклонение выборки "s" вместо σ, и мы могли бы использовать это значение для вычисления доверительных интервалов.
Примечание: В Распределение вероятностей студента хорошо аппроксимируется распределением Гаусса, когда размер выборки превышает 100. Для таких выборок можно использовать последнее распределение, которое намного проще.
Предположения и использование
Пример того, как используется, чтобы сделать доверительные интервалы неизвестного среднего значения в генеральной совокупности. Если выборочное распределение нормально распределенный, выборочное среднее, стандартная ошибка и квантили нормального распределения можно использовать для расчета доверительных интервалов для истинного среднего значения по совокупности. Следующие выражения можно использовать для расчета верхнего и нижнего 95% доверительных интервалов, где равно выборочному среднему, равна стандартной ошибке для выборочного среднего, и 1.96 это приблизительное значение 97,5 процентиль точка нормальное распределение:
- Верхний предел 95% и
- Нижний предел 95%
В частности, стандартная ошибка статистика выборки (Такие как выборочное среднее ) - фактическое или расчетное стандартное отклонение выборочного среднего в процессе, в котором оно было получено. Другими словами, это фактическое или расчетное стандартное отклонение выборочное распределение статистики выборки. Обозначение стандартной ошибки может быть любым из SE, SEM (для стандартной ошибки измерение или же иметь в виду) или SE.
Стандартные ошибки обеспечивают простые меры неопределенности значения и часто используются, потому что:
- во многих случаях, если известна стандартная ошибка нескольких отдельных величин, то стандартная ошибка некоторых функция количества можно легко рассчитать;
- когда распределение вероятностей значения известно, его можно использовать для расчета точного доверительный интервал;
- когда распределение вероятностей неизвестно, Чебышев или Неравенства Высочанского – Петунина. может использоваться для расчета консервативного доверительного интервала; и
- как размер образца стремится к бесконечности Центральная предельная теорема гарантирует, что выборочное распределение среднего асимптотически нормальный.
Стандартная ошибка среднего значения по сравнению со стандартным отклонением
В научно-технической литературе экспериментальные данные часто суммируются либо с использованием среднего значения и стандартного отклонения выборочных данных, либо среднего значения со стандартной ошибкой. Это часто приводит к путанице в отношении их взаимозаменяемости. Однако среднее значение и стандартное отклонение равны описательная статистика, тогда как стандартная ошибка среднего описывает процесс случайной выборки. Стандартное отклонение данных выборки - это описание вариации в измерениях, тогда как стандартная ошибка среднего - это вероятностное утверждение о том, как размер выборки обеспечит лучшую границу оценок среднего генеральной совокупности в свете центрального предела. теорема.[8]
Проще говоря, стандартная ошибка выборочного среднего - это оценка того, насколько далеко среднее значение выборки может отличаться от среднего по генеральной совокупности, тогда как стандартное отклонение выборки - это степень, в которой отдельные лица в выборке отличаются от среднего по выборке.[9] Если стандартное отклонение генеральной совокупности конечно, стандартная ошибка среднего значения выборки будет стремиться к нулю с увеличением размера выборки, потому что оценка генерального среднего будет улучшаться, в то время как стандартное отклонение выборки будет приближаться к стандарту генеральной совокупности. отклонение по мере увеличения размера выборки.
Расширения
Поправка на конечную совокупность
Приведенная выше формула для стандартной ошибки предполагает, что размер выборки намного меньше размера генеральной совокупности, так что совокупность может считаться фактически бесконечной по размеру. Обычно это имеет место даже в случае конечных популяций, потому что большую часть времени люди в первую очередь заинтересованы в управлении процессами, которые создали существующую конечную популяцию; это называется аналитическое исследование, следующий У. Эдвардс Деминг. Если люди заинтересованы в управлении существующей конечной совокупностью, которая не будет меняться со временем, то необходимо внести поправку в размер популяции; это называется перечислительное исследование.
Когда фракция отбора проб большой (примерно 5% и более) в перечислительное исследование, оценка стандартной ошибки должна быть скорректирована путем умножения на «поправку на конечную совокупность»:[10][11]
что для больших N:
чтобы учесть дополнительную точность, полученную за счет выборки, близкой к большему проценту населения. Эффект FPC заключается в том, что ошибка становится нулевой, когда размер выборки п равна численности населения N.
Поправка на корреляцию в выборке
Если значения измеряемой величины А не являются статистически независимыми, но были получены из известных мест в пространстве параметровИкс, несмещенная оценка истинной стандартной ошибки среднего (фактически поправка на часть стандартного отклонения) может быть получена путем умножения вычисленной стандартной ошибки выборки на коэффициентж:
где коэффициент смещения выборки ρ - широко используемый Оценка Прейса – Винстена из автокорреляция -коэффициент (величина от -1 до +1) для всех пар точек выборки. Эта приблизительная формула предназначена для выборки среднего и большого размера; Справочник дает точные формулы для любого размера выборки и может применяться к сильно автокоррелированным временным рядам, таким как котировки акций Уолл-стрит. Более того, эта формула работает как для положительных, так и для отрицательных значений ρ.[12] Смотрите также объективная оценка стандартного отклонения для дальнейшего обсуждения.
Смотрите также
- Иллюстрация центральной предельной теоремы
- Допустимая погрешность
- Вероятная ошибка
- Стандартная ошибка средневзвешенного значения
- Среднее значение выборки и ковариация выборки
- Стандартная ошибка медианы
- Дисперсия
Рекомендации
- ^ «Список вероятностных и статистических символов». Математическое хранилище. 2020-04-26. Получено 2020-09-12.
- ^ а б c d Альтман, Дуглас Дж. Блэнд, Дж. Мартин (2005-10-15). «Стандартные отклонения и стандартные ошибки». BMJ: Британский медицинский журнал. 331 (7521): 903. ISSN 0959-8138. ЧВК 1255808. PMID 16223828.
- ^ Эверит, Б. С. (2003). Кембриджский статистический словарь. ЧАШКА. ISBN 978-0-521-81099-9.
- ^ Гурланд, Дж; Трипати RC (1971). «Простое приближение для объективной оценки стандартного отклонения». Американский статистик. 25 (4): 30–32. Дои:10.2307/2682923. JSTOR 2682923.
- ^ Сокаль; Рольф (1981). Биометрия: принципы и практика статистики в биологических исследованиях (2-е изд.). п.53. ISBN 978-0-7167-1254-1.
- ^ Хатчинсон, Т. Основы статистических методов, на 41 странице. Аделаида: Рамсби. ISBN 978-0-646-12621-0.
- ^ Корнелл, Дж. Р., и Бенджамин, К. А., Вероятность, статистика и решения для инженеров-строителей, Макгроу-Хилл, Нью-Йорк, 1970 г., ISBN 0486796094С. 178–9.
- ^ Барде, М. (2012). «Что использовать для выражения изменчивости данных: стандартное отклонение или стандартная ошибка среднего?». Перспектива. Clin. Res. 3 (3): 113–116. Дои:10.4103/2229-3485.100662. ЧВК 3487226. PMID 23125963.
- ^ Вассертхайль-Смоллер, Сильвия (1995). Биостатистика и эпидемиология: учебник для медицинских работников (Второе изд.). Нью-Йорк: Спрингер. С. 40–43. ISBN 0-387-94388-9.
- ^ Иссерлис, Л. (1918). «О значении среднего, рассчитанном по выборке». Журнал Королевского статистического общества. 81 (1): 75–81. Дои:10.2307/2340569. JSTOR 2340569. (Уравнение 1)
- ^ Бонди, Уоррен; Злот, Уильям (1976). «Стандартная ошибка среднего и разница между средними для конечных совокупностей». Американский статистик. 30 (2): 96–97. Дои:10.1080/00031305.1976.10479149. JSTOR 2683803. (Уравнение 2)
- ^ Бенс, Джеймс Р. (1995). «Анализ коротких временных рядов: поправка на автокорреляцию». Экология. 76 (2): 628–639. Дои:10.2307/1941218. JSTOR 1941218.