U-статистика - U-statistic

В статистическая теория, а U-статистика это класс статистики, который особенно важен в теория оценки; буква «U» означает беспристрастность. В элементарной статистике U-статистика естественным образом возникает при получении несмещенные оценки с минимальной дисперсией.

Теория U-статистики позволяет несмещенная оценка с минимальной дисперсией выводиться из каждого объективный оценщик из оцениваемый параметр (альтернативно, статистический функциональный ) для больших классов вероятностных распределений.[1][2] Оцениваемый параметр - это измеримая функция населения кумулятивное распределение вероятностей: Например, для каждого распределения вероятностей медиана совокупности является оцениваемым параметром. Теория U-статистики применяется к общим классам вероятностных распределений.

Многие статистические данные, первоначально полученные для конкретных параметрических семейств, были признаны U-статистикой для общих распределений. В непараметрическая статистика, теория U-статистики используется для установления статистических процедур (таких как оценки и тесты) и оценок, относящихся к асимптотическая нормальность и дисперсии (в конечных выборках) таких величин.[3] Теория использовалась для изучения более общей статистики, а также случайные процессы, Такие как случайные графы.[4][5][6]

Предположим, что проблема связана с независимые и одинаково распределенные случайные величины и что требуется оценка определенного параметра. Предположим, что простая несмещенная оценка может быть построена на основе всего нескольких наблюдений: это определяет базовую оценку, основанную на заданном количестве наблюдений. Например, одно наблюдение само по себе является объективной оценкой среднего, а пара наблюдений может использоваться для получения объективной оценки дисперсии. U-статистика, основанная на этой оценке, определяется как среднее (по всем комбинаторным выборкам данного размера из полного набора наблюдений) базовой оценки, примененной к подвыборкам.

Сен (1992) дает обзор статьи Василий Хёффдинг (1948), который ввел U-статистику и изложил относящуюся к ней теорию, и тем самым Сен подчеркивает важность U-статистики в статистической теории. Сен говорит[7] «Влияние Хёффдинга (1948) огромно в настоящее время и, скорее всего, сохранится и в ближайшие годы». Обратите внимание, что теория U-статистики не ограничивается[8] случай независимые и одинаково распределенные случайные величины или скалярным случайным величинам.[9]

Определение

Термин U-статистика, введенный Хёффдингом (1948), определяется следующим образом.

Позволять быть действительной или комплексной функцией от переменных. для каждого ассоциированная U-статистика равно среднему по заказанным образцам размера значений выборки .Другими словами, , среднее значение по разным упорядоченным выборкам размером взято из .Каждая U-статистика обязательно симметричная функция.

U-статистика очень естественна в статистической работе, особенно в контексте Хёффдинга. независимые и одинаково распределенные случайные величины, или в более общем плане для заменяемые последовательности, например, в простая случайная выборка от конечного населения, где определяющее свойство называется «наследование в среднем».

Фишера k-статистика и Тьюки поликайс являются примерами однородный многочлен U-статистика (Фишер, 1929; Тьюки, 1950). Для простой случайной выборки φ размерап взяты из популяцииN, U-статистика обладает тем свойством, что среднее значение выборкиƒп() в точности равно значению численности населенияƒN(Икс).

Примеры

Некоторые примеры: Если U-статистика - выборочное среднее.

Если , U-статистика - это среднее попарное отклонение, определенная для .

Если , U-статистика - это выборочная дисперсия с делителем , определенная для .

Третий -статистический ,образец перекос определены для , является U-статистикой.

Следующий случай подчеркивает важный момент. Если это медиана трех значений, не является медианой значения. Однако это несмещенная оценка минимальной дисперсии ожидаемого значения медианы трех значений, а не медианы совокупности. Подобные оценки играют центральную роль, когда параметры семейства распределений вероятностей оцениваются с помощью моментов, взвешенных по вероятности или L-моменты.

Смотрите также

Примечания

  1. ^ Кокс и Хинкли (1974), стр. 200, стр. 258
  2. ^ Hoeffding (1948), между уравнениями (4.3), (4.4)
  3. ^ Сен (1992)
  4. ^ Страница 508 в Королюк, В. С .; Боровскич, Ю. В. (1994). Теория U-статистика. Математика и ее приложения. 273 (Перевод П. В. Малышева и Д. В. Малышева из русского оригинала 1989 г.). Дордрехт: Kluwer Academic Publishers Group. с. x + 552. ISBN  0-7923-2608-3. МИСТЕР  1472486.
  5. ^ Страницы 381–382 в Боровских, Ю. В. (1996). U-статистика в банаховых пространствах. Утрехт: ВСП. С. xii + 420. ISBN  90-6764-200-2. МИСТЕР  1419498.
  6. ^ Страница xii в Квапень, Станислав; Войчинский, Войбор А. (1992). Случайные ряды и стохастические интегралы: одиночные и множественные. Вероятность и ее приложения. Бостон, Массачусетс: Birkhäuser Boston, Inc., стр. Xvi + 360. ISBN  0-8176-3572-6. МИСТЕР  1167198.
  7. ^ Сен (1992) стр. 307
  8. ^ Сен (1992), стр. 306
  9. ^ В последней главе Боровских обсуждается U-статистика для обмениваемый случайные элементы принимая ценности в векторное пространство (отделяемый Банахово пространство ).

Рекомендации