Тест тенденции Джонкхереса - Википедия - Jonckheeres trend test
В статистика, то Тест тенденции Jonckheere[1] (иногда называют Jonckheere – Terpstra[2] тест) - это тест на заказанный Альтернативная гипотеза в рамках независимого образца (между участниками) дизайна. Это похоже на Тест Краскала – Уоллиса в этом нулевая гипотеза состоит в том, что несколько независимых выборок из одной и той же популяции. Однако в тесте Крускала – Уоллиса нет априорного упорядочения популяций, из которых отбираются выборки. Когда есть априори заказывая, тест Jonckheere имеет больше статистическая мощность чем тест Краскела – Уоллиса. Тест был разработан Aimable Роберт Йонкхир, который был психологом и статистиком в Университетский колледж Лондона.
Нулевая и альтернативная гипотезы могут быть удобно выражены через медианы популяции для k населения (где k > 2). Сдача θя быть населением медиана для я-го населения, нулевая гипотеза:
Альтернативная гипотеза состоит в том, что медианы совокупности имеют априорный порядок, например:
- ≤ ≤ ≤
хотя бы с одним строгим неравенством.
Процедура
Тест можно рассматривать как частный случай Морис Кендалл Более общий метод ранговая корреляция[3] и использует метод Кендалла S статистика. Это можно вычислить одним из двух способов:
Метод «прямого подсчета»
- Расположите образцы в предсказанном порядке
- Для каждой оценки по очереди подсчитайте, сколько оценок в выборках справа больше, чем рассматриваемая оценка. Это п.
- Для каждой оценки по очереди посчитайте, сколько оценок в выборках справа меньше, чем рассматриваемая оценка. Это Q.
- S = п – Q
«Морской» метод
- Преобразуйте данные в упорядоченный Таблица сопряженности, с уровнями независимая переменная увеличивается слева направо, а значения зависимая переменная увеличиваясь сверху вниз.
- Для каждой записи в таблице подсчитайте все другие записи, которые лежат на «юго-востоке» конкретной записи. Это п.
- Для каждой записи в таблице подсчитайте все остальные записи, лежащие на «Юго-западе» конкретной записи. Это Q.
- S = п – Q
Обратите внимание, что всегда будут связи в независимой переменной (люди «связаны» в том смысле, что они находятся в одной группе), но связи в зависимой переменной могут быть или не быть. Если нет связей - или связи возникают в пределах определенной выборки (что не влияет на значение статистики теста) - точные таблицы S доступны; например, Jonckheere[1] предоставил избранные таблицы для значений k от 3 до 6 и равных размеров выборок (м) от 2 до 5. Выщелачивание представило критические значения S за k = 3 с размерами выборки от 2,2,1 до 5,5,5.[4]
Нормальное приближение к S
В стандартное нормальное распределение можно использовать для аппроксимации распределения S при нулевой гипотезе для случаев, когда точные таблицы недоступны. В иметь в виду распределения S всегда будет равен нулю, и если предположить, что нет оценок связей между значениями в двух (или более) разных выборках, отклонение дан кем-то
Где п - общее количество баллов, а тя - количество баллов в i-й выборке. Приближение к стандартному нормальному распределению можно улучшить с помощью поправки на непрерывность: Sc = |S| - 1. Таким образом, 1 вычитается из положительного S значение и 1 добавляется к отрицательному S ценить. Эквивалент z-оценки тогда определяется как
Галстуки
Если оценки связаны между значениями в двух (или более) разных выборках, то нет точной таблицы для S-распределения, и необходимо использовать приближение к нормальному распределению. В этом случае поправка на непрерывность не применяется к значению S и дисперсия дается
куда тя предельная сумма строки и тыя предельная сумма столбца в таблице непредвиденных обстоятельств. В z-счетный эквивалент тогда дается
Числовой пример
В частичном воспроизведении исследования Лофтуса и Палмера участников случайным образом распределили в одну из трех групп, а затем показали фильм, в котором две машины врезались друг в друга.[5] После просмотра фильма участникам одной группы был задан следующий вопрос: «Как быстро двигались машины, когда они связывались друг с другом?» Участников второй группы спросили: «Как быстро двигались машины, когда они врезались друг в друга?» Участников третьей группы спросили: «Как быстро двигались машины, когда они врезались друг в друга?» Лофтус и Палмер предсказали, что используемый глагол действия (контактировал, ударил, разбил) повлияет на оценки скорости в милях в час (миль в час), так что глаголы действия, подразумевающие большую энергию, приведут к более высоким оценкам скорости. Были получены следующие результаты (смоделированные данные):
Связались Наткнулся Разбит 10 12 20 12 18 25 14 20 27 16 22 30 mdn = 13 mdn = 19 mdn = 26
Метод «прямого подсчета»
- Образцы уже находятся в предсказанном порядке
- Для каждой оценки по очереди посчитайте, сколько оценок в выборках справа больше, чем рассматриваемая оценка, чтобы получить п:
- п = 8 + 7 + 7 + 7 + 4 + 4 + 3 + 3 = 43
- Для каждой оценки по очереди подсчитайте, сколько оценок в выборках справа меньше, чем рассматриваемая оценка, чтобы получить Q:
- Q = 0 + 0 + 1 + 1 + 0 + 0 + 0 + 1 = 3
- S = п - Q = 43 - 3
- S = 40
«Морской» метод
- Преобразование данных в упорядоченную таблицу непредвиденных обстоятельств
миль / ч Связались Наткнулся Разбит Итоги (тя) 10 1 0 0 1 12 1 1 0 2 14 1 0 0 1 16 1 0 0 1 18 0 1 0 1 20 0 1 1 2 22 0 1 0 1 25 0 0 1 1 27 0 0 1 1 30 0 0 1 1 Итоги (тыя) 4 4 4 12
- Для каждой записи в таблице подсчитайте все остальные записи, которые лежат к «Юго-востоку» от конкретной записи. Это п:
- п = (1 × 8) + (1 × 7) + (1 × 7) + (1 × 7) + (1 × 4) + (1 × 4) + (1 × 3) + ( 1 × 3) = 43
- Для каждой записи в таблице подсчитайте все остальные записи, лежащие на «Юго-западе» конкретной записи. Это Q:
- Q = (1 × 2) + (1 × 1) = 3
- S = п − Q = 43 − 3
- S = 40
Использование точных таблиц
Когда связей между образцами мало (как в этом примере) Лич предположил, что игнорирование связей и использование точных таблиц обеспечит достаточно точный результат.[4] Йонкхере предложил разорвать связи с альтернативной гипотезой, а затем использовать точные таблицы.[1] В текущем примере, где равные баллы отображаются только в соседних группах, значение S не изменяется, если разрываются связи с альтернативной гипотезой. Это можно проверить, заменив 11 миль в час вместо 12 миль в час в образце с ударом и 19 миль в час вместо 20 миль в час в разбитом и пересчитав статистику теста. Из таблиц с k = 3 и м = 4 критическая S ценность для α = 0,05 равно 36, поэтому результат будет объявлен статистически значимый на этом уровне.
Вычисление стандартного нормального приближения
Дисперсия S затем
И z дан кем-то
За α = 0,05 (односторонний) критический z значение 1,645, поэтому снова результат будет объявлен значимым на этом уровне. Аналогичный тест на тенденцию в контексте планов повторных измерений (внутри участников) и на основе коэффициента ранговой корреляции Спирмена был разработан Страница.[6]
Рекомендации
- ^ а б c Йонкхир, А. Р. (1954). "Без распространения k-выборочный тест против заказанных альтернатив ». Биометрика. 41: 133–145. Дои:10.2307/2333011.
- ^ Терпстра, Т. Дж. (1952). «Асимптотическая нормальность и последовательность теста Кендалла против тренда, когда связи присутствуют в одном рейтинге» (PDF). Indagationes Mathematicae. 14: 327–333.
- ^ Кендалл, М. Г. (1962). Методы ранговой корреляции (3-е изд.). Лондон: Чарльз Гриффин.
- ^ а б Лич, К. (1979). Введение в статистику: непараметрический подход для социальных наук. Чичестер: Джон Вили.
- ^ Loftus, E. F .; Палмер, Дж. К. (1974). «Реконструкция разрушения автомобиля: пример взаимодействия языка и памяти». Журнал вербального обучения и вербального поведения. 13: 585–589. Дои:10.1016 / S0022-5371 (74) 80011-3.
- ^ Пейдж, Э. Б. (1963). «Упорядоченные гипотезы для нескольких обработок: тест значимости для линейных рангов». Журнал Американской статистической ассоциации. 58 (301): 216–30. Дои:10.2307/2282965.
дальнейшее чтение
- Дэниел, Уэйн В. (1990). «Jonckheere – Terpstra tst для заказанных альтернатив». Прикладная непараметрическая статистика (2-е изд.). Бостон: PWS-Kent. С. 234–240. ISBN 0-534-91976-6.