Обрезанный оценщик - Trimmed estimator
В статистика, а усеченная оценка является оценщик полученный из другой оценки путем исключения некоторых из крайние значения, процесс, называемый усечение. Обычно это делается для того, чтобы надежная статистика, а крайние значения считаются выбросы. Обрезанные оценщики также часто имеют более высокие эффективность за распределение смеси и распределения с тяжелыми хвостами чем соответствующая необрезанная оценка, за счет более низкой эффективности для других распределений, таких как нормальное распределение.
Учитывая оценку, п% обрезанная версия получается путем отбрасывания п% самых низких и высоких наблюдений: это статистика по середина данных. Например, 5% усеченное среднее получается путем взятия среднего значения в диапазоне от 5% до 95%. В некоторых случаях усеченный оценщик отбрасывает фиксированное количество точек (например, максимальное и минимальное) вместо процента.
Примеры
В медиана является наиболее усеченной статистикой (номинально 50%), поскольку она отбрасывает все данные, кроме самых центральных, и равна полностью усеченному среднему значению - или действительно полностью усеченному среднему диапазону, или (для наборов данных нечетного размера) полностью усеченному максимуму или минимум. Точно так же никакая степень усечения не влияет на медианное значение - усеченная медиана - это медиана, потому что усечение всегда исключает равное количество наименьших и наибольших значений.
Квантили можно рассматривать как усеченные максимумы или минимумы: например, 5-й процентиль это минимум 5% обрезки.
Обрезанные оценки, используемые для оценки параметр местоположения включают:
- Усеченное среднее
- Модифицированное среднее, отбрасывая минимальное и максимальное значения
- Межквартильное среднее, 25% усеченное среднее
- Midhinge, 25% обрезано средний диапазон
Обрезанные оценки, используемые для оценки параметр масштаба включают:
- Межквартильный размах, 25% обрезано классифицировать
- Interdecile диапазон, 10% обрезанный диапазон
Обрезанные оценки, включающие только линейные комбинации точек, являются примерами L-оценки.
Приложения
Оценка
Чаще всего усеченные оценки используются для оценка параметров того же параметра, что и необрезанный оценщик. В некоторых случаях оценщик можно использовать напрямую, а в других случаях его необходимо скорректировать, чтобы получить беспристрастный согласованная оценка.
Например, при оценке параметр местоположения для симметричного распределения усеченная оценка будет несмещенной (при условии, что исходная оценка была несмещенной), так как она удаляет одинаковую сумму сверху и снизу. Однако если в дистрибутиве перекос, усеченные оценки, как правило, будут смещены и требуют корректировки. Например, в искаженном распределении непараметрический перекос (и Коэффициенты асимметрии Пирсона ) измеряют смещение медианы как оценку среднего.
При оценке параметр масштаба, используя усеченную оценку как надежные меры масштаба, например, чтобы оценить дисперсия населения или население стандартное отклонение, обычно нужно умножать на масштаб сделать его объективной последовательной оценкой; видеть масштабный параметр: оценка.
Например, разделив IQR на (с использованием функция ошибки ) делает его беспристрастной и последовательной оценкой стандартного отклонения генеральной совокупности, если данные соответствуют нормальное распределение.
Другое использование
Обрезанные оценки также могут использоваться в качестве статистических данных сами по себе - например, медиана - это мера местоположения, а IQR - мера дисперсии. В этих случаях статистика выборки может выступать в роли собственных оценок. ожидаемое значение. Например, СУМАСШЕДШИЙ образца из эталона Распределение Коши является оценкой MAD совокупности, которая в данном случае равна 1, тогда как дисперсия совокупности не существует.
Смотрите также
- Winsorising, родственная техника
- Базовая инфляция, экономическая статистика без учета летучих компонентов
Рекомендации
Эта статья не цитировать любой источники.апрель 2013) (Узнайте, как и когда удалить этот шаблон сообщения) ( |