Неравенство Дворецкого – Кифера – Вулфовица. - Dvoretzky–Kiefer–Wolfowitz inequality

На приведенной выше диаграмме показан пример применения неравенства DKW при построении доверительных границ (фиолетовым цветом) вокруг эмпирической функции распределения (голубым цветом). В этом случайном розыгрыше истинный CDF (оранжевый) полностью содержится в границах DKW.

В теории вероятность и статистика, то Неравенство Дворецкого – Кифера – Вулфовица. границы, насколько близко эмпирически определенная функция распределения будет к функция распределения из которых взяты эмпирические образцы. Он назван в честь Арье Дворецки, Джек Кифер, и Джейкоб Вулфовиц, который в 1956 г. доказал неравенство с неопределенной мультипликативной постояннойC перед экспонентой в правой части.[1] В 1990 г. Паскаль Массарт доказал неравенство с точной постоянной C = 2,[2] подтверждая предположение из-за Бирнбаум и Маккарти.[3]

Неравенство DKW

Учитывая натуральное число п, позволять Икс1, Икс2, …, Иксп иметь реальную ценность независимые и одинаково распределенные случайные переменные с кумулятивная функция распределения F(·). Позволять Fп обозначим связанный эмпирическая функция распределения определяется

Так это вероятность который Один случайная переменная меньше чем , и это дробная часть случайных величин, меньших, чем .

Неравенство Дворецкого – Кифера – Вулфовица ограничивает вероятность того, что случайная функция Fп отличается от F более чем на заданную константу ε > 0 в любом месте реальной строки. Точнее, есть односторонняя оценка

откуда также следует двусторонняя оценка[4]

Это усиливает Теорема Гливенко – Кантелли. путем количественной оценки скорость сходимости в качестве п стремится к бесконечности. Он также оценивает хвостовую вероятность Статистика Колмогорова – Смирнова. Приведенные выше неравенства следуют из случая, когда F соответствует быть равномерное распределение на [0,1] ввиду того, что[5]который Fп имеет те же распределения, что и граммп(F) куда граммп это эмпирическое распределениеU1, U2, …, Uп где они независимы и однородны (0,1), и учитывая, что

с равенством тогда и только тогда, когда F непрерывно.

Создание групп CDF

Неравенство Дворецкого – Кифера – Вольфовица - это один из методов построения доверительных границ на основе CDF и получения группа уверенности. Цель этого доверительного интервала состоит в том, чтобы содержать всю CDF на заданном уровне достоверности, в то время как альтернативные подходы пытаются достичь уровня достоверности только в каждой отдельной точке, который может позволить более жесткие границы. Границы DKW параллельны эмпирическому CDF и равны выше и ниже него. Равномерно распределенный доверительный интервал вокруг эмпирического CDF допускает разную частоту нарушений в рамках поддержки распределения. В частности, CDF чаще оказывается за пределами границы CDF, оцененной с использованием неравенства DKW около медианы распределения, чем около конечных точек распределения.

Интервал, содержащий истинный CDF, , с вероятностью часто указывается как

Смотрите также

Рекомендации

  1. ^ Дворецкий, А.; Кифер, Дж.; Вулфовиц, Дж. (1956), «Асимптотический минимаксный характер выборочной функции распределения и классической полиномиальной оценки», Анналы математической статистики, 27 (3): 642–669, Дои:10.1214 / aoms / 1177728174, МИСТЕР  0083864
  2. ^ Массарт, П. (1990), «Точная постоянная в неравенстве Дворецкого – Кифера – Вулфовица», Анналы вероятности, 18 (3): 1269–1283, Дои:10.1214 / aop / 1176990746, МИСТЕР  1062069
  3. ^ Birnbaum, Z. W .; Маккарти, Р. К. (1958). «Верхняя доверительная граница без распределения для Pr {Y . Анналы математической статистики. 29: 558–562. Дои:10.1214 / aoms / 1177706631. МИСТЕР  0093874. Zbl  0087.34002.
  4. ^ Косорок, М.Р. (2008), «Глава 11: Дополнительные результаты эмпирического процесса», Введение в эмпирические процессы и полупараметрический вывод, Springer, стр. 210, ISBN  9780387749778
  5. ^ Shorack, G.R .; Веллнер, Дж. (1986), Эмпирические процессы с приложениями к статистике, Wiley, ISBN  0-471-86725-X