ANOVA по рангам - ANOVA on ranks

В статистика, одна цель для дисперсионный анализ (ANOVA) заключается в анализе различий в средства между группами. Статистика теста, F, предполагает независимость наблюдений, однородных дисперсий и совокупности нормальность. ANOVA по рангам - статистика, разработанная для ситуаций, когда было нарушено предположение о нормальности.

Логика F испытание на средства

В F статистика - это отношение числителя к знаменателю. Рассмотрим случайно выбранных субъектов, которые впоследствии случайным образом распределяются по группам A, B и C. нулевая гипотеза, вариативность (или сумма квадратов) оценок по какой-либо зависимой переменной будет одинаковой в каждой группе. При делении на степени свободы (т. Е. На основе количества субъектов в группе) знаменатель F соотношение получается.

Рассчитайте среднее значение для каждой группы как балл и вычислите вариабельность (опять же, сумму квадратов) этих трех оценок. При делении на его степени свободы (т. Е. На основе количества групп) получается числитель отношения F.

При истинности нулевой гипотезы выборочное распределение отношения F зависит от степеней свободы числителя и знаменателя.

Смоделируйте лечение, применяемое к группе A, увеличивая каждый балл на X. (Эта модель поддерживает базовое предположение об однородных дисперсиях. На практике редко - если не невозможно - увеличение X в среднем по группе происходит за счет увеличения оценка каждого члена на X.) Это сдвинет распределение X единиц в положительном направлении, но не окажет никакого влияния на изменчивость внутри группы. Однако теперь разница между средними оценками трех групп увеличится. Если результирующее соотношение F увеличивает значение до такой степени, что оно превышает порог того, что составляет редкое событие (так называемый альфа-уровень), считается, что тест Anova F отклоняет нулевую гипотезу о равных средних между тремя группами в в пользу альтернативной гипотезы о том, что по крайней мере одна из групп имеет большее среднее (которым в этом примере является группа A).

Устранение нарушения нормальности населения

Ранжирование - это одна из многих процедур, используемых для преобразования данных, которые не соответствуют предположениям нормальность. Коновер и Иман представили обзор четырех основных типов преобразований рангов (RT).[1] Один метод заменяет каждое исходное значение данных на его ранг (от 1 для наименьшего до N для самых крупных). Эта процедура на основе ранга была рекомендована как устойчивая к аномальным ошибкам, устойчивая к выбросам и очень эффективная для многих распределений. Это может привести к известной статистике (например, результаты ранжирования макета двух независимых выборок в Сумма рангов Вилкоксона / Манн – Уитни Ю test) и обеспечивает желаемую надежность и повышенную статистическая мощность что ищется. Например, Монте-Карло исследования показали, что преобразование рангов в двух независимых выборках t-тест макет может быть успешно расширен до односторонних независимых выборок ANOVA, а также двух независимых выборок многомерных Хотеллинга Т2 макеты[2] Коммерческий статистическое программное обеспечение пакетов (например, SAS), за которыми следовали рекомендации для аналитиков данных по прохождению их наборов данных через процедуру ранжирования (например, PROC RANK) до проведения стандартного анализа с использованием параметрических процедур.[3][4][5]

Отказ ранжирования в факторном ANOVA и других сложных схемах

ANOVA по рангам означает, что стандарт дисперсионный анализ рассчитывается на основе данных с преобразованием ранга. Было также предложено провести факторный дисперсионный анализ по рангам исходных оценок.[6][7][8] Однако Монте-Карло изучает,[9][10][11][12] и последующие асимптотические исследования[13][14] обнаружили, что преобразование рангов не подходит для тестирования эффектов взаимодействия в факторном плане 4x3 и 2x2x2. По мере того, как количество эффектов (т. Е. Основные, взаимодействие) становится ненулевым, и по мере увеличения величины ненулевых эффектов увеличивается Ошибка типа I, что приводит к полному отказу от статистики со 100% вероятностью принятия ложноположительного решения. Точно так же было обнаружено, что преобразование рангов все чаще терпит неудачу в макете двух зависимых выборок по мере увеличения корреляции между оценками до и после тестирования.[15] Было также обнаружено, что проблема частоты ошибок типа I обострилась в контексте анализа ковариации, особенно по мере увеличения корреляции между ковариантой и зависимой переменной.[16]

Преобразование рангов

Вариантом преобразования рангов является «квантильная нормализация», при которой к рангам применяется дополнительное преобразование, так что результирующие значения имеют определенное распределение (часто нормальное распределение с указанными средним значением и дисперсией). Дальнейший анализ квантильно-нормированных данных может затем предположить, что это распределение вычисляет значения значимости. Тем не менее, два конкретных типа вторичных преобразований, случайные нормальные оценки и преобразование ожидаемых нормальных оценок, как было показано, сильно увеличивают ошибки типа I и серьезно снижают статистическую мощность.[17]

Нарушение гомоскедастичности

ANOVA по рангам никогда не рекомендовался, если исходное предположение об однородных дисперсиях было нарушено либо само по себе, либо в сочетании с нарушением предположения о нормальности популяции.[нужна цитата ] В общем, ранговая статистика становится ненадежной в отношении ошибок типа I для отклонений от гомоскедастичности даже быстрее, чем параметрические аналоги, которые разделяют то же предположение.[нужна цитата ]

Дальнейшая информация

Кепнер и Вакерли резюмировали литературу, отметив, что «к концу 1980-х объем литературы по методам лучевой терапии быстро увеличивался по мере того, как появлялись новые идеи, как положительные, так и отрицательные, относительно полезности метода. Обеспокоенные тем, что методы лучевой терапии будут использоваться неправильно, Савиловский и другие. (1989, стр. 255) предостерегал практиков избегать использования этих тестов «за исключением тех особых ситуаций, когда характеристики тестов хорошо известны».[18] По словам Хеттманспергера и Маккина,[19] "Савиловский (1990)[20] предоставляет отличный обзор непараметрических подходов к тестированию на взаимодействие "в ANOVA.

Примечания

  1. ^ Conover, W. J .; Иман, Р. Л. (1981). «Ранговые преобразования как мост между параметрической и непараметрической статистикой». Американский статистик. 35 (3): 124–129. Дои:10.2307/2683975. JSTOR  2683975. Архивировано из оригинал на 02.03.2011.
  2. ^ Нанна, М. Дж. (2002). "Hoteling's T"2 по сравнению с преобразованием рангов с реальными данными Лайкерта ". Журнал современных прикладных статистических методов. 1: 83–99.
  3. ^ Институт САС. (1985). Руководство по SAS / stat для персональных компьютеров (5-е изд.). Кэри, Северная Каролина: Автор.
  4. ^ Институт САС. (1987). Руководство по SAS / stat для персональных компьютеров (6-е изд.). Кэри, Северная Каролина: Автор.
  5. ^ * Институт САС. (2008). SAS / STAT 9.2 Руководство пользователя: Введение в непараметрический анализ. Кэри, Северная Каролина. Автор.
  6. ^ Conover, W. J .; Иман, Р. Л. (1976). «О некоторых альтернативных процедурах с использованием рангов для анализа экспериментальных планов». Коммуникации в статистике. A5: 1349–1368.
  7. ^ Иман, Р. Л. (1974). «Исследование мощности рангового преобразования для двухсторонней модели классификации, когда могут присутствовать взаимодействия». Канадский статистический журнал. 2 (2): 227–239. Дои:10.2307/3314695. JSTOR  3314695.
  8. ^ Иман, Р. Л., и Коновер, В. Дж. (1976). Сравнение нескольких ранговых тестов для двухсторонней компоновки (SAND76-0631). Альбукерке, Нью-Мексико: Sandia Laboratories.
  9. ^ Савиловский, С. (1985). Надежный и мощный анализ 2x2x2 ANOVA, преобразования рангов, случайных нормальных оценок и тестов преобразования ожидаемых нормальных оценок. Неопубликованная докторская диссертация, Университет Южной Флориды.
  10. ^ Савиловский, С .; Блэр, Р. К. и Хиггинс, Дж. Дж. (1989). "Исследование ошибки типа I и степенных свойств процедуры преобразования ранга в факторном дисперсионном анализе". Журнал образовательной статистики. 14 (3): 255–267. Дои:10.2307/1165018. JSTOR  1165018.
  11. ^ Blair, R.C .; Савиловский, С. С. и Хиггинс, Дж. Дж. (1987). «Ограничения рангового преобразования в факторном дисперсионном анализе». Коммуникации в статистике: расчеты и моделирование. B16: 1133–1145.
  12. ^ Савиловский, С. (1990). «Непараметрические тесты взаимодействия в экспериментальном дизайне». Обзор образовательных исследований. 60 (1): 91–126. Дои:10.3102/00346543060001091.
  13. ^ Томпсон, Г. Л. (1991). «Замечание о преобразовании рангов для взаимодействий». Биометрика. 78 (3): 697–701. Дои:10.1093 / biomet / 78.3.697.
  14. ^ Томпсон, Г. Л .; Амманн, Л. П. (1989). «Эффективность преобразования рангов в двухсторонних моделях без взаимодействия». Журнал Американской статистической ассоциации. 84 (405): 325–330. Дои:10.1080/01621459.1989.10478773.
  15. ^ Blair, R.C .; Хиггинс, Дж. Дж. (1985). «Сравнение мощности статистики преобразования рангов парных выборок со статистикой рангов Уилкоксона со знаком». Журнал образовательной и поведенческой статистики. 10 (4): 368–383. Дои:10.3102/10769986010004368.
  16. ^ Хедрик, Т. К. (1997). Ошибка типа I и мощность ковариационного анализа с преобразованием рангов (ANCOVA) в факторном макете 3 x 4. Неопубликованная докторская диссертация, Университет Южной Флориды.
  17. ^ Савиловский, С. (1985). «Сравнение теста случайных нормальных оценок при распределении F и хи-квадрат с тестом 2x2x2 ANOVA». Флоридский журнал исследований в области образования. 27: 83–97.
  18. ^ Кепнер, Дж. Л., Вакерли, Д. Д. (1996). О методах преобразования рангов для сбалансированных неполных планов с повторными мерами. Журнал Американской статистической ассоциации, 91(436), 1619–1625
  19. ^ Hettmansperger, T. P .; Маккин, Дж. У. (1998). Надежные непараметрические статистические методы. Библиотека статистики Кендалла. 5 (Первое изд.). Лондон: Эдвард Арнольд. с. xiv + 467 с. ISBN  0-340-54937-8. МИСТЕР  1604954.
  20. ^ Савиловский, С. (1990). «Непараметрические тесты взаимодействия в экспериментальном дизайне». Обзор образовательных исследований. 60: 91–126. Дои:10.3102/00346543060001091.