Тест Ван дер Вардена - Van der Waerden test
Назван в честь голландского математика. Бартель Леендерт ван дер Варден, то Тест Ван дер Вардена это статистический тест который k Функции распределения населения равны. Тест Ван дер Вардена переводит ранги из стандартного Односторонний дисперсионный анализ Краскала-Уоллиса к квантили стандартного нормального распределения (подробности приведены ниже). Они называются нормальными оценками, и тест рассчитывается на основе этих нормальных оценок.
В k Популяционная версия теста является расширением теста для двух популяций, опубликованного Ван дер Варденом (1952,1953).
Фон
Анализ отклонений (ANOVA) - это анализ данных методика исследования значимости факторов (независимые переменные ) в многофакторной модели. Однофакторную модель можно рассматривать как обобщение двухвыборочный t-тест. То есть t-критерий для двух выборок - это проверка гипотезы о равенстве двух средних значений совокупности. Однофакторный дисперсионный анализ ANOVA проверяет гипотезу о том, что k средства населения равны. Стандартный ANOVA предполагает, что ошибки (т. Е. Остатки) равны нормально распределенный. Если это предположение о нормальности неверно, альтернативой является использование непараметрический тест.
Определение теста
Позволять пj (j = 1, 2, ..., k) представляют размеры выборки для каждого из k группы (т.е. образцы) в данных. Позволять N обозначают размер выборки для всех групп. Позволять Иксij представляют яth ценность в jth группа. Нормальные баллы рассчитываются как
куда р(Иксij) обозначает ранг наблюдения Иксij и где Φ−1 обозначает нормальный квантильная функция. Среднее значение нормальных оценок для каждой выборки можно затем вычислить как
Дисперсия нормальных оценок может быть вычислена как
Тогда критерий Ван дер Вардена можно определить следующим образом:
- ЧАС0: Все k функции распределения населения идентичны
- ЧАСа: По крайней мере, одна из популяций имеет тенденцию давать более крупные наблюдения, чем по крайней мере одна из других популяций.
Статистика теста
За уровень значимости α критическая область
где Χа, к - 12 является α-квантиль из распределение хи-квадрат с k - 1 степень свободы. Нулевая гипотеза отклоняется, если статистика теста находится в критической области. Если гипотеза об идентичных распределениях отвергается, можно выполнить множественные сравнения процедура определения того, какие пары популяций имеют тенденцию различаться. Население j1 и j2 кажутся другими, если выполняется следующее неравенство:
с т1 - α / 2 (1 - α / 2) -квантиль из t-распределение.
Сравнение с тестом Краскела-Уоллиса
Наиболее распространенным непараметрическим тестом для однофакторной модели является Тест Краскала-Уоллиса. Тест Краскела-Уоллиса основан на ранжировании данных. Преимущество теста Ван дер Вардена состоит в том, что он обеспечивает высокую эффективность стандартного анализа ANOVA, когда предположения нормальности фактически выполняются, но он также обеспечивает надежность теста Краскела-Уоллиса, когда предположения нормальности не выполняются.
Рекомендации
- Коновер, У. Дж. (1999). Практическая непараметрическая статистика (Третье изд.). Вайли. С. 396–406.
- van der Waerden, B.L. (1952). «Заказать тесты для двухвыборочной задачи и их мощность», Indagationes Mathematicae, 14, 453–458.
- van der Waerden, B.L. (1953). «Заказать тесты для двухвыборочной задачи. II, III», Слушания Koninklijke Nederlandse Akademie van Wetenschappen, Serie A, 564, 303–310, 311–316.
Эта статья включаетматериалы общественного достояния от Национальный институт стандартов и технологий интернет сайт https://www.nist.gov.