Тест Койперса - Википедия - Kuipers test

Тест Койпера используется в статистика к тест что ли данный распределение, или семейство распределений, противоречит свидетельствам из выборки данных. Он назван в честь голландского математика. Николаас Койпер.[1]

Тест Койпера тесно связан с более известным Тест Колмогорова – Смирнова (или тест K-S, как его часто называют). Как и в случае с тестом K-S, статистика расхождений D+ и D представляют собой абсолютные размеры наиболее положительных и наиболее отрицательных различий между двумя кумулятивные функции распределения которые сравниваются. Уловка с тестом Койпера заключается в использовании количества D+ + D как тестовая статистика. Это небольшое изменение делает тест Койпера столь же чувствительным как в хвостах, так и в медиана а также делает его инвариантным относительно циклических преобразований независимой переменной. В Тест Андерсона – Дарлинга - еще один тест, который обеспечивает такую ​​же чувствительность на хвостах, как и медиана, но не обеспечивает циклическую инвариантность.

Эта инвариантность относительно циклических преобразований делает тест Койпера неоценимым при тестировании на циклические вариации по времени года, дню недели или времени суток, и в более общем плане для проверки соответствия и различий между круговые распределения вероятностей.

Определение

Иллюстрация двухвыборочной статистики критерия Койпера. Каждая красная и синяя линии соответствуют эмпирической функции распределения, а черные стрелки показывают расстояния между точками, которые суммируются со статистикой Койпера.

Статистика теста, V, для критерия Койпера определяется следующим образом. Позволять F быть непрерывным кумулятивная функция распределения который должен быть нулевая гипотеза. Обозначим выборку данных, которые являются независимыми реализациями случайные переменные, имея F в качестве их функции распределения на Икся (я=1,...,п). Затем определите[2]

и наконец,

Доступны таблицы для критических точек статистики теста,[3] и они включают определенные случаи, когда тестируемое распределение не полностью известно, так что параметры семейства распределений по оценкам.

Пример

Мы могли бы проверить гипотезу о том, что в одно время года компьютеры выходят из строя чаще, чем в другое. Чтобы проверить это, мы собирали даты, когда тестовый набор компьютеров выходил из строя, и строили эмпирическая функция распределения. В нулевая гипотеза в том, что неудачи равномерно распределены. Статистика Койпера не меняется, если мы меняем начало года, и не требует, чтобы мы разбивали сбои на месяцы или подобное.[1][4] Другой тестовой статистикой, обладающей этим свойством, является статистика Уотсона,[2][4] что связано с Тест Крамера – фон Мизеса.

Однако, если отказы происходят в основном в выходные дни, многие тесты равномерного распределения, такие как K-S и Kuiper, пропустят это, так как выходные распределяются в течение года. Эта неспособность различать распределения с гребень -подобная форма из непрерывных однородных распределений - ключевая проблема со всей статистикой, основанной на варианте теста K-S. Тест Койпера, примененный к временам событий по модулю одна неделя, способен обнаружить такую ​​закономерность. Использование времени событий, которое было модулировано с помощью теста K-S, может привести к различным результатам в зависимости от того, как данные распределены по фазе. В этом примере тест K-S может обнаруживать неоднородность, если данные настроены на начало недели в субботу, но не может обнаружить неоднородность, если неделя начинается в среду.

Смотрите также

Рекомендации

  1. ^ а б Койпер, Н. (1960). «Тесты на случайные точки на окружности». Слушания Koninklijke Nederlandse Akademie van Wetenschappen, серия A. 63: 38–47.
  2. ^ а б Пирсон, Э., Хартли, Х. (1972) Таблицы биометрики для статистиков, Том 2, ЧАШКА. ISBN  0-521-06937-8 (стр.118)
  3. ^ Пирсон, Э., Хартли, Х. (1972) Таблицы биометрики для статистиков, Том 2, ЧАШКА. ISBN  0-521-06937-8 (Таблица 54)
  4. ^ а б Уотсон, Г.С. (1961) "Тесты согласия на круг", Биометрика, 48 (1/2), 109–114 JSTOR  2333135