Среднее абсолютное отклонение - Median absolute deviation

В статистика, то среднее абсолютное отклонение (СУМАСШЕДШИЙ) это крепкий мера изменчивость из одномерный образец количественные данные. Это также может относиться к численность населения параметр то есть по оценкам по MAD, рассчитанному по образцу.

Для одномерного набора данных Икс1Икс2, ..., Иксп, MAD определяется как медиана из абсолютные отклонения от медианы данных :

то есть, начиная с остатки (отклонения) от медианы данных, MAD - это медиана от их абсолютные значения.

Пример

Рассмотрим данные (1, 1, 2, 2, 4, 6, 9). Оно имеет медианное значение 2. Абсолютные отклонения около 2 равны (1, 1, 0, 0, 2, 4, 7), которые, в свою очередь, имеют медианное значение 1 (поскольку отсортированные абсолютные отклонения равны (0, 0, 1, 1, 2, 4, 7)). Таким образом, среднее абсолютное отклонение для этих данных равно 1.

Использует

Среднее абсолютное отклонение является мерой статистическая дисперсия. Более того, MAD - это надежная статистика, будучи более устойчивым к выбросам в наборе данных, чем стандартное отклонение. В стандартном отклонении расстояния от иметь в виду возведены в квадрат, поэтому большие отклонения имеют больший вес, и поэтому выбросы могут сильно на него повлиять. В MAD отклонения небольшого количества выбросов не имеют значения.

Поскольку MAD является более надежной оценкой масштаба, чем выборка отклонение или же стандартное отклонение, он лучше работает с распределениями без среднего или дисперсии, такими как Распределение Коши.

Отношение к стандартному отклонению

MAD можно использовать аналогично тому, как можно использовать отклонение для среднего. согласованная оценка для оценка из стандартное отклонение , один берет

куда это постоянная масштаб, который зависит от распределения.[1]

За нормально распределенный данные считается

т.е. взаимный из квантильная функция (также известный как инверсия кумулятивная функция распределения ) для стандартное нормальное распределение .[2][3]Аргумент 3/4 таков, что покрывает 50% (от 1/4 до 3/4) стандартной нормы кумулятивная функция распределения, т.е.

Следовательно, мы должны иметь это

Заметив, что

у нас есть это , откуда получаем масштабный коэффициент .

Еще один способ установить отношения - отметить, что MAD равно полунормальное распределение медиана:

Эта форма используется, например, в вероятная ошибка.

Абсолютное отклонение геометрической медианы

Подобно тому, как медиана обобщает геометрическая медиана в многомерных данных может быть построено геометрическое MAD, которое обобщает MAD. Учитывая двумерный парный набор данных (ИКС1,Y1), (ИКС2,Y2),..., (ИКСп,Yп) и рассчитанная соответствующим образом геометрическая медиана , геометрическое медианное абсолютное отклонение определяется как:

Это дает тот же результат, что и одномерное MAD в одном измерении, и легко распространяется на более высокие измерения. В случае сложный значения (Икс+ яY) отношение MAD к стандартному отклонению не меняется для нормально распределенных данных.

Население MAD

MAD совокупности определяется аналогично выборке MAD, но основывается на полном распределение а не по образцу. Для симметричного распределения с нулевым средним численность MAD является 75-й. процентиль распределения.

в отличие от отклонение, которое может быть бесконечным или неопределенным, популяция MAD всегда является конечным числом. Например, стандартный Распределение Коши имеет неопределенную дисперсию, но его MAD равен 1.

Самое раннее известное упоминание концепции MAD произошло в 1816 году в статье Карл Фридрих Гаусс по определению точности численных наблюдений.[4][5]

Смотрите также

Примечания

  1. ^ Руссеу, П. Дж.; Croux, C. (1993). «Альтернативы среднему абсолютному отклонению». Журнал Американской статистической ассоциации. 88 (424): 1273–1283. Дои:10.1080/01621459.1993.10476408. HDL:2027.42/142454.
  2. ^ Рупперт, Д. (2010). Статистика и анализ данных для финансового инжиниринга. Springer. п. 118. ISBN  9781441977878. Получено 2015-08-27.
  3. ^ Leys, C .; и другие. (2013). «Обнаружение выбросов: не используйте стандартное отклонение вокруг среднего, используйте абсолютное отклонение вокруг медианы» (PDF). Журнал экспериментальной социальной психологии. 49 (4): 764–766. Дои:10.1016 / j.jesp.2013.03.013.
  4. ^ Гаусс, Карл Фридрих (1816 г.). "Bestimmung der Genauigkeit der Beobachtungen". Zeitschrift für Astronomie und Verwandte Wissenschaften. 1: 187–197.
  5. ^ Уокер, Хелен (1931). Исследования по истории статистического метода. Балтимор, Мэриленд: Williams & Wilkins Co., стр. 24–25.

Рекомендации

  • Хоглин, Дэвид С .; Фредерик Мостеллер; Джон В. Тьюки (1983). Понимание надежного и исследовательского анализа данных. Джон Вили и сыновья. С. 404–414. ISBN  978-0-471-09777-8.
  • Russell, Roberta S .; Бернард В. Тейлор III (2006). Управление операциями. Джон Вили и сыновья. стр.497–498. ISBN  978-0-471-69209-6.
  • Venables, W. N .; Б. Д. Рипли (1999). Современная прикладная статистика с S-PLUS. Springer. п. 128. ISBN  978-0-387-98825-2.