Неравенство Дворецкого – Кифера – Вулфовица. - Dvoretzky–Kiefer–Wolfowitz inequality
В теории вероятность и статистика, то Неравенство Дворецкого – Кифера – Вулфовица. границы, насколько близко эмпирически определенная функция распределения будет к функция распределения из которых взяты эмпирические образцы. Он назван в честь Арье Дворецки, Джек Кифер, и Джейкоб Вулфовиц, который в 1956 г. доказал неравенство с неопределенной мультипликативной постояннойC перед экспонентой в правой части.[1] В 1990 г. Паскаль Массарт доказал неравенство с точной постоянной C = 2,[2] подтверждая предположение из-за Бирнбаум и Маккарти.[3]
Неравенство DKW
Учитывая натуральное число п, позволять Икс1, Икс2, …, Иксп иметь реальную ценность независимые и одинаково распределенные случайные переменные с кумулятивная функция распределения F(·). Позволять Fп обозначим связанный эмпирическая функция распределения определяется
Так это вероятность который Один случайная переменная меньше чем , и это дробная часть случайных величин, меньших, чем .
Неравенство Дворецкого – Кифера – Вулфовица ограничивает вероятность того, что случайная функция Fп отличается от F более чем на заданную константу ε > 0 в любом месте реальной строки. Точнее, есть односторонняя оценка
откуда также следует двусторонняя оценка[4]
Это усиливает Теорема Гливенко – Кантелли. путем количественной оценки скорость сходимости в качестве п стремится к бесконечности. Он также оценивает хвостовую вероятность Статистика Колмогорова – Смирнова. Приведенные выше неравенства следуют из случая, когда F соответствует быть равномерное распределение на [0,1] ввиду того, что[5]который Fп имеет те же распределения, что и граммп(F) куда граммп это эмпирическое распределениеU1, U2, …, Uп где они независимы и однородны (0,1), и учитывая, что
с равенством тогда и только тогда, когда F непрерывно.
Создание групп CDF
Неравенство Дворецкого – Кифера – Вольфовица - это один из методов построения доверительных границ на основе CDF и получения группа уверенности. Цель этого доверительного интервала состоит в том, чтобы содержать всю CDF на заданном уровне достоверности, в то время как альтернативные подходы пытаются достичь уровня достоверности только в каждой отдельной точке, который может позволить более жесткие границы. Границы DKW параллельны эмпирическому CDF и равны выше и ниже него. Равномерно распределенный доверительный интервал вокруг эмпирического CDF допускает разную частоту нарушений в рамках поддержки распределения. В частности, CDF чаще оказывается за пределами границы CDF, оцененной с использованием неравенства DKW около медианы распределения, чем около конечных точек распределения.
Интервал, содержащий истинный CDF, , с вероятностью часто указывается как
Смотрите также
- Неравенство концентраций - сводка оценок наборов случайных величин.
Рекомендации
- ^ Дворецкий, А.; Кифер, Дж.; Вулфовиц, Дж. (1956), «Асимптотический минимаксный характер выборочной функции распределения и классической полиномиальной оценки», Анналы математической статистики, 27 (3): 642–669, Дои:10.1214 / aoms / 1177728174, МИСТЕР 0083864
- ^ Массарт, П. (1990), «Точная постоянная в неравенстве Дворецкого – Кифера – Вулфовица», Анналы вероятности, 18 (3): 1269–1283, Дои:10.1214 / aop / 1176990746, МИСТЕР 1062069
- ^ Birnbaum, Z. W .; Маккарти, Р. К. (1958). «Верхняя доверительная граница без распределения для Pr {Y
. Анналы математической статистики. 29: 558–562. Дои:10.1214 / aoms / 1177706631. МИСТЕР 0093874. Zbl 0087.34002. - ^ Косорок, М.Р. (2008), «Глава 11: Дополнительные результаты эмпирического процесса», Введение в эмпирические процессы и полупараметрический вывод, Springer, стр. 210, ISBN 9780387749778
- ^ Shorack, G.R .; Веллнер, Дж. (1986), Эмпирические процессы с приложениями к статистике, Wiley, ISBN 0-471-86725-X