Тест тенденции Джонкхереса - Википедия - Jonckheeres trend test

В статистика, то Тест тенденции Jonckheere[1] (иногда называют Jonckheere – Terpstra[2] тест) - это тест на заказанный Альтернативная гипотеза в рамках независимого образца (между участниками) дизайна. Это похоже на Тест Краскала – Уоллиса в этом нулевая гипотеза состоит в том, что несколько независимых выборок из одной и той же популяции. Однако в тесте Крускала – Уоллиса нет априорного упорядочения популяций, из которых отбираются выборки. Когда есть априори заказывая, тест Jonckheere имеет больше статистическая мощность чем тест Краскела – Уоллиса. Тест был разработан Aimable Роберт Йонкхир, который был психологом и статистиком в Университетский колледж Лондона.

Нулевая и альтернативная гипотезы могут быть удобно выражены через медианы популяции для k населения (где k > 2). Сдача θя быть населением медиана для я-го населения, нулевая гипотеза:

Альтернативная гипотеза состоит в том, что медианы совокупности имеют априорный порядок, например:

хотя бы с одним строгим неравенством.

Процедура

Тест можно рассматривать как частный случай Морис Кендалл Более общий метод ранговая корреляция[3] и использует метод Кендалла S статистика. Это можно вычислить одним из двух способов:

Метод «прямого подсчета»


  1. Расположите образцы в предсказанном порядке
  2. Для каждой оценки по очереди подсчитайте, сколько оценок в выборках справа больше, чем рассматриваемая оценка. Это п.
  3. Для каждой оценки по очереди посчитайте, сколько оценок в выборках справа меньше, чем рассматриваемая оценка. Это Q.
  4. S = пQ

«Морской» метод


  1. Преобразуйте данные в упорядоченный Таблица сопряженности, с уровнями независимая переменная увеличивается слева направо, а значения зависимая переменная увеличиваясь сверху вниз.
  2. Для каждой записи в таблице подсчитайте все другие записи, которые лежат на «юго-востоке» конкретной записи. Это п.
  3. Для каждой записи в таблице подсчитайте все остальные записи, лежащие на «Юго-западе» конкретной записи. Это Q.
  4. S = пQ

Обратите внимание, что всегда будут связи в независимой переменной (люди «связаны» в том смысле, что они находятся в одной группе), но связи в зависимой переменной могут быть или не быть. Если нет связей - или связи возникают в пределах определенной выборки (что не влияет на значение статистики теста) - точные таблицы S доступны; например, Jonckheere[1] предоставил избранные таблицы для значений k от 3 до 6 и равных размеров выборок (м) от 2 до 5. Выщелачивание представило критические значения S за k = 3 с размерами выборки от 2,2,1 до 5,5,5.[4]

Нормальное приближение к S


В стандартное нормальное распределение можно использовать для аппроксимации распределения S при нулевой гипотезе для случаев, когда точные таблицы недоступны. В иметь в виду распределения S всегда будет равен нулю, и если предположить, что нет оценок связей между значениями в двух (или более) разных выборках, отклонение дан кем-то

Где п - общее количество баллов, а тя - количество баллов в i-й выборке. Приближение к стандартному нормальному распределению можно улучшить с помощью поправки на непрерывность: Sc = |S| - 1. Таким образом, 1 вычитается из положительного S значение и 1 добавляется к отрицательному S ценить. Эквивалент z-оценки тогда определяется как

Галстуки


Если оценки связаны между значениями в двух (или более) разных выборках, то нет точной таблицы для S-распределения, и необходимо использовать приближение к нормальному распределению. В этом случае поправка на непрерывность не применяется к значению S и дисперсия дается

куда тя предельная сумма строки и тыя предельная сумма столбца в таблице непредвиденных обстоятельств. В z-счетный эквивалент тогда дается

Числовой пример

В частичном воспроизведении исследования Лофтуса и Палмера участников случайным образом распределили в одну из трех групп, а затем показали фильм, в котором две машины врезались друг в друга.[5] После просмотра фильма участникам одной группы был задан следующий вопрос: «Как быстро двигались машины, когда они связывались друг с другом?» Участников второй группы спросили: «Как быстро двигались машины, когда они врезались друг в друга?» Участников третьей группы спросили: «Как быстро двигались машины, когда они врезались друг в друга?» Лофтус и Палмер предсказали, что используемый глагол действия (контактировал, ударил, разбил) повлияет на оценки скорости в милях в час (миль в час), так что глаголы действия, подразумевающие большую энергию, приведут к более высоким оценкам скорости. Были получены следующие результаты (смоделированные данные):

СвязалисьНаткнулсяРазбит
101220
121825
142027
162230
mdn = 13mdn = 19mdn = 26

Метод «прямого подсчета»


  • Образцы уже находятся в предсказанном порядке
  • Для каждой оценки по очереди посчитайте, сколько оценок в выборках справа больше, чем рассматриваемая оценка, чтобы получить п:
п = 8 + 7 + 7 + 7 + 4 + 4 + 3 + 3 = 43
  • Для каждой оценки по очереди подсчитайте, сколько оценок в выборках справа меньше, чем рассматриваемая оценка, чтобы получить Q:
Q = 0 + 0 + 1 + 1 + 0 + 0 + 0 + 1 = 3
  • S = п - Q = 43 - 3
  • S = 40

«Морской» метод


  • Преобразование данных в упорядоченную таблицу непредвиденных обстоятельств
миль / чСвязалисьНаткнулсяРазбитИтоги (тя)
101001
121102
141001
161001
180101
200112
220101
250011
270011
300011
Итоги (тыя)44412
  • Для каждой записи в таблице подсчитайте все остальные записи, которые лежат к «Юго-востоку» от конкретной записи. Это п:
п = (1 × 8) + (1 × 7) + (1 × 7) + (1 × 7) + (1 × 4) + (1 × 4) + (1 × 3) + ( 1 × 3) = 43
  • Для каждой записи в таблице подсчитайте все остальные записи, лежащие на «Юго-западе» конкретной записи. Это Q:
Q = (1 × 2) + (1 × 1) = 3
  • S = пQ = 43 − 3
  • S = 40

Использование точных таблиц


Когда связей между образцами мало (как в этом примере) Лич предположил, что игнорирование связей и использование точных таблиц обеспечит достаточно точный результат.[4] Йонкхере предложил разорвать связи с альтернативной гипотезой, а затем использовать точные таблицы.[1] В текущем примере, где равные баллы отображаются только в соседних группах, значение S не изменяется, если разрываются связи с альтернативной гипотезой. Это можно проверить, заменив 11 миль в час вместо 12 миль в час в образце с ударом и 19 миль в час вместо 20 миль в час в разбитом и пересчитав статистику теста. Из таблиц с k = 3 и м = 4 критическая S ценность для α = 0,05 равно 36, поэтому результат будет объявлен статистически значимый на этом уровне.

Вычисление стандартного нормального приближения


Дисперсия S затем

И z дан кем-то

За α = 0,05 (односторонний) критический z значение 1,645, поэтому снова результат будет объявлен значимым на этом уровне. Аналогичный тест на тенденцию в контексте планов повторных измерений (внутри участников) и на основе коэффициента ранговой корреляции Спирмена был разработан Страница.[6]

Рекомендации

  1. ^ а б c Йонкхир, А. Р. (1954). "Без распространения k-выборочный тест против заказанных альтернатив ». Биометрика. 41: 133–145. Дои:10.2307/2333011.
  2. ^ Терпстра, Т. Дж. (1952). «Асимптотическая нормальность и последовательность теста Кендалла против тренда, когда связи присутствуют в одном рейтинге» (PDF). Indagationes Mathematicae. 14: 327–333.
  3. ^ Кендалл, М. Г. (1962). Методы ранговой корреляции (3-е изд.). Лондон: Чарльз Гриффин.
  4. ^ а б Лич, К. (1979). Введение в статистику: непараметрический подход для социальных наук. Чичестер: Джон Вили.
  5. ^ Loftus, E. F .; Палмер, Дж. К. (1974). «Реконструкция разрушения автомобиля: пример взаимодействия языка и памяти». Журнал вербального обучения и вербального поведения. 13: 585–589. Дои:10.1016 / S0022-5371 (74) 80011-3.
  6. ^ Пейдж, Э. Б. (1963). «Упорядоченные гипотезы для нескольких обработок: тест значимости для линейных рангов». Журнал Американской статистической ассоциации. 58 (301): 216–30. Дои:10.2307/2282965.

дальнейшее чтение