V-статистика - V-statistic
V-статистика это класс статистики, названный в честь Рихард фон Мизес кто разработал свои асимптотическая теория распределения в фундаментальной статье 1947 г.[1] V-статистика тесно связана с U-статистика[2][3] (U для "беспристрастный ") представлен Василий Хёффдинг в 1948 г.[4] V-статистика - это статистическая функция (выборки), определяемая конкретным статистическим функционалом распределения вероятностей.
Статистические функции
Статистика, которую можно представить в виде функционалов из эмпирическая функция распределения называются статистические функционалы.[5] Дифференцируемость функционального Т играет ключевую роль в подходе фон Мизеса; таким образом фон Мизес считает дифференцируемые статистические функционалы.[1]
Примеры статистических функций
- В k-го центральный момент это функциональный , куда это ожидаемое значение из Икс. Связанный статистическая функция это образец k-й центральный момент,
- В критерий согласия статистика - это статистическая функция Т(Fп), соответствующая статистическому функционалу
- В Крамер-фон-Мизес и Андерсон-Дарлинг статистика согласия основана на функциональном
Представление в виде V-статистики
Предполагать Икс1, ..., Иксп это образец. В типичных приложениях статистическая функция представлена как V-статистика.
куда час является симметричной ядерной функцией. Серфлинг[6] обсуждает, как найти ядро на практике. Vмин называется V-статистикой степеним.
Симметричное ядро степени 2 - это функция час(Икс, y), такое что час(Икс, y) = час(y, Икс) для всех Икс и y в области h. Для образцов Икс1, ..., Иксп, соответствующая V-статистика определяется
Пример V-статистики
- Примером V-статистики степени 2 является второй центральный момент м2.Если час(Икс, y) = (Икс − y)2/ 2, соответствующая V-статистика равна
- .
Асимптотическое распределение
В примерах 1–3 асимптотическое распределение статистики отличается: в (1) это нормальный, в (2) это хи-квадрат, а в (3) это взвешенная сумма переменных хи-квадрат.
Подход фон Мизеса - это объединяющая теория, охватывающая все перечисленные выше случаи.[1] Неофициально тип асимптотическое распределение статистической функции зависит от порядка "вырождения", который определяется тем, какой член является первым отличным от нуля членом в Расширение Тейлора функциональногоТ. В случае линейного члена предельное распределение нормальное; в противном случае возникают типы распределений более высокого порядка (при подходящих условиях, при которых выполняется центральная предельная теорема).
Существует иерархия случаев, параллельная асимптотической теории U-статистика.[7] Позволять А(м) быть свойством, определяемым:
- А(м):
- Вар (час(Икс1, ..., Иксk)) = 0 для k < м, и Var (час(Икс1, ..., Иксk))> 0 для k = м;
- пм/2рмин стремится к нулю (по вероятности). (рмин остаточный член в ряду Тейлора для Т.)
Дело м = 1 (Невырожденное ядро):
Если А(1) верно, статистика является выборочным средним, а Центральная предельная теорема следует, что T (Fп) является асимптотически нормальный.
В примере с дисперсией (4) m2 асимптотически нормально со средним и дисперсия , куда .
Дело м = 2 (Вырожденное ядро):
Предполагать А(2) верно, и и . Тогда nV2, п сходится по распределению к взвешенной сумме независимых переменных хи-квадрат:
куда независимы стандартный нормальный переменные и - константы, зависящие от распределения F и функционал Т. В этом случае асимптотическое распределение называется квадратичная форма центрированных гауссовских случайных величин. Статистика V2,п называется V-статистика вырожденного ядра. V-статистика, связанная с функционалом Крамера – фон Мизеса[1] (Пример 3) является примером вырожденной ядерной V-статистики.[8]
Смотрите также
Примечания
- ^ а б c d фон Мизес (1947)
- ^ Ли (1990)
- ^ Королюк и Боровскич (1994)
- ^ Хёффдинг (1948)
- ^ фон Мизес (1947), стр. 309; Серфлинг (1980), стр. 210.
- ^ Серфлинг (1980, раздел 6.5)
- ^ Серфлинг (1980, гл. 5–6); Ли (1990, гл. 3)
- ^ См. Ли (1990, стр. 160) о функции ядра.
Рекомендации
- Хёффдинг, В. (1948). «Класс статистики с асимптотически нормальным распределением». Анналы математической статистики. 19 (3): 293–325. Дои:10.1214 / aoms / 1177730196. JSTOR 2235637.CS1 maint: ref = harv (связь)
- Королюк, В.С .; Боровскич, Ю.В. (1994). Теория U-статистика (Английский перевод П.В. Малышева и Д.В. Малышева из украинского изд. 1989 г.). Дордрехт: Kluwer Academic Publishers. ISBN 0-7923-2608-3.CS1 maint: ref = harv (связь)
- Ли, А.Дж. (1990). U-Статистика: теория и практика. Нью-Йорк: Marcel Dekker, Inc. ISBN 0-8247-8253-4.CS1 maint: ref = harv (связь)
- Нейгауз, Г. (1977). «Функциональные предельные теоремы для U-статистика в вырожденном случае ». Журнал многомерного анализа. 7 (3): 424–439. Дои:10.1016 / 0047-259X (77) 90083-5.CS1 maint: ref = harv (связь)
- Розенблатт, М. (1952). «Предельные теоремы, связанные с вариантами статистики фон Мизеса». Анналы математической статистики. 23 (4): 617–623. Дои:10.1214 / aoms / 1177729341. JSTOR 2236587.CS1 maint: ref = harv (связь)
- Серфлинг, Р.Дж. (1980). Аппроксимационные теоремы математической статистики. Нью-Йорк: Джон Вили и сыновья. ISBN 0-471-02403-1.CS1 maint: ref = harv (связь)
- Taylor, R.L .; Daffer, P.Z .; Паттерсон, Р.Ф. (1985). Предельные теоремы для сумм заменяемых случайных величин. Нью-Джерси: Роуман и Алланхельд.CS1 maint: ref = harv (связь)
- фон Мизес, Р. (1947). «Об асимптотическом распределении дифференцируемых статистических функций». Анналы математической статистики. 18 (2): 309–348. Дои:10.1214 / aoms / 1177730385. JSTOR 2235734.CS1 maint: ref = harv (связь)