U-статистика - U-statistic
В статистическая теория, а U-статистика это класс статистики, который особенно важен в теория оценки; буква «U» означает беспристрастность. В элементарной статистике U-статистика естественным образом возникает при получении несмещенные оценки с минимальной дисперсией.
Теория U-статистики позволяет несмещенная оценка с минимальной дисперсией выводиться из каждого объективный оценщик из оцениваемый параметр (альтернативно, статистический функциональный ) для больших классов вероятностных распределений.[1][2] Оцениваемый параметр - это измеримая функция населения кумулятивное распределение вероятностей: Например, для каждого распределения вероятностей медиана совокупности является оцениваемым параметром. Теория U-статистики применяется к общим классам вероятностных распределений.
Многие статистические данные, первоначально полученные для конкретных параметрических семейств, были признаны U-статистикой для общих распределений. В непараметрическая статистика, теория U-статистики используется для установления статистических процедур (таких как оценки и тесты) и оценок, относящихся к асимптотическая нормальность и дисперсии (в конечных выборках) таких величин.[3] Теория использовалась для изучения более общей статистики, а также случайные процессы, Такие как случайные графы.[4][5][6]
Предположим, что проблема связана с независимые и одинаково распределенные случайные величины и что требуется оценка определенного параметра. Предположим, что простая несмещенная оценка может быть построена на основе всего нескольких наблюдений: это определяет базовую оценку, основанную на заданном количестве наблюдений. Например, одно наблюдение само по себе является объективной оценкой среднего, а пара наблюдений может использоваться для получения объективной оценки дисперсии. U-статистика, основанная на этой оценке, определяется как среднее (по всем комбинаторным выборкам данного размера из полного набора наблюдений) базовой оценки, примененной к подвыборкам.
Сен (1992) дает обзор статьи Василий Хёффдинг (1948), который ввел U-статистику и изложил относящуюся к ней теорию, и тем самым Сен подчеркивает важность U-статистики в статистической теории. Сен говорит[7] «Влияние Хёффдинга (1948) огромно в настоящее время и, скорее всего, сохранится и в ближайшие годы». Обратите внимание, что теория U-статистики не ограничивается[8] случай независимые и одинаково распределенные случайные величины или скалярным случайным величинам.[9]
Определение
Термин U-статистика, введенный Хёффдингом (1948), определяется следующим образом.
Позволять быть действительной или комплексной функцией от переменных. для каждого ассоциированная U-статистика равно среднему по заказанным образцам размера значений выборки .Другими словами, , среднее значение по разным упорядоченным выборкам размером взято из .Каждая U-статистика обязательно симметричная функция.
U-статистика очень естественна в статистической работе, особенно в контексте Хёффдинга. независимые и одинаково распределенные случайные величины, или в более общем плане для заменяемые последовательности, например, в простая случайная выборка от конечного населения, где определяющее свойство называется «наследование в среднем».
Фишера k-статистика и Тьюки поликайс являются примерами однородный многочлен U-статистика (Фишер, 1929; Тьюки, 1950). Для простой случайной выборки φ размерап взяты из популяцииN, U-статистика обладает тем свойством, что среднее значение выборкиƒп(xφ) в точности равно значению численности населенияƒN(Икс).
Примеры
Некоторые примеры: Если U-статистика - выборочное среднее.
Если , U-статистика - это среднее попарное отклонение, определенная для .
Если , U-статистика - это выборочная дисперсия с делителем , определенная для .
Третий -статистический ,образец перекос определены для , является U-статистикой.
Следующий случай подчеркивает важный момент. Если это медиана трех значений, не является медианой значения. Однако это несмещенная оценка минимальной дисперсии ожидаемого значения медианы трех значений, а не медианы совокупности. Подобные оценки играют центральную роль, когда параметры семейства распределений вероятностей оцениваются с помощью моментов, взвешенных по вероятности или L-моменты.
Смотрите также
Примечания
- ^ Кокс и Хинкли (1974), стр. 200, стр. 258
- ^ Hoeffding (1948), между уравнениями (4.3), (4.4)
- ^ Сен (1992)
- ^ Страница 508 в Королюк, В. С .; Боровскич, Ю. В. (1994). Теория U-статистика. Математика и ее приложения. 273 (Перевод П. В. Малышева и Д. В. Малышева из русского оригинала 1989 г.). Дордрехт: Kluwer Academic Publishers Group. с. x + 552. ISBN 0-7923-2608-3. МИСТЕР 1472486.
- ^ Страницы 381–382 в Боровских, Ю. В. (1996). U-статистика в банаховых пространствах. Утрехт: ВСП. С. xii + 420. ISBN 90-6764-200-2. МИСТЕР 1419498.
- ^ Страница xii в Квапень, Станислав; Войчинский, Войбор А. (1992). Случайные ряды и стохастические интегралы: одиночные и множественные. Вероятность и ее приложения. Бостон, Массачусетс: Birkhäuser Boston, Inc., стр. Xvi + 360. ISBN 0-8176-3572-6. МИСТЕР 1167198.
- ^ Сен (1992) стр. 307
- ^ Сен (1992), стр. 306
- ^ В последней главе Боровских обсуждается U-статистика для обмениваемый случайные элементы принимая ценности в векторное пространство (отделяемый Банахово пространство ).
Рекомендации
- Боровских, Ю. В. (1996). U-статистика в банаховых пространствах. Утрехт: ВСП. С. xii + 420. ISBN 90-6764-200-2. МИСТЕР 1419498.
- Кокс, Д. Р., Хинкли, Д. В. (1974) Теоретическая статистика. Чепмен и Холл. ISBN 0-412-12420-3
- Фишер, Р.А. (1929) Моменты и моменты произведения выборочных распределений. Труды Лондонского математического общества, 2, 30:199–238.
- Хёффдинг, В. (1948) Класс статистики с асимптотически нормальным распределением. Анналы статистики, 19: 293–325. (Частично перепечатано в: Kotz, S., Johnson, N. L. (1992) Прогресс в статистике, Том I, стр. 308–334. Springer-Verlag. ISBN 0-387-94037-5)
- Королюк, В. С .; Боровскич, Ю. В. (1994). Теория U-статистика. Математика и ее приложения. 273 (Перевод П. В. Малышева и Д. В. Малышева из русского оригинала 1989 г.). Дордрехт: Kluwer Academic Publishers Group. с. x + 552. ISBN 0-7923-2608-3. МИСТЕР 1472486.
- Ли, А. Дж. (1990) U-статистика: теория и практика. Марсель Деккер, Нью-Йорк. pp320 ISBN 0-8247-8253-4
- Сен, П. К. (1992) Введение в Хёффдинг (1948) Класс статистики с асимптотически нормальным распределением. В: Коц, С., Джонсон, Н. Л. Прогресс в статистике, Том I, стр. 299–307. Springer-Verlag. ISBN 0-387-94037-5.
- Серфлинг, Роберт Дж. (1980). Аппроксимационные теоремы математической статистики. Нью-Йорк: Джон Уайли и сыновья. ISBN 0-471-02403-1.CS1 maint: ref = harv (связь)
- Тьюки, Дж. У. (1950). «Упрощенная выборка». Журнал Американской статистической ассоциации. 45 (252): 501–519. Дои:10.1080/01621459.1950.10501142.
- Халмос, П. (1946). «Теория объективного оценивания». Анналы математической статистики. 1 (17): 34–43. Дои:10.1214 / aoms / 1177731020.