U-статистика - U-statistic

В статистическая теория, а U-статистика это класс статистики, который особенно важен в теория оценки; буква «U» означает беспристрастность. В элементарной статистике U-статистика естественным образом возникает при получении несмещенные оценки с минимальной дисперсией.

Теория U-статистики позволяет несмещенная оценка с минимальной дисперсией выводиться из каждого объективный оценщик из оцениваемый параметр (альтернативно, статистический функциональный ) для больших классов вероятностных распределений.^[1]^[2] Оцениваемый параметр - это измеримая функция населения кумулятивное распределение вероятностей: Например, для каждого распределения вероятностей медиана совокупности является оцениваемым параметром. Теория U-статистики применяется к общим классам вероятностных распределений.

Многие статистические данные, первоначально полученные для конкретных параметрических семейств, были признаны U-статистикой для общих распределений. В непараметрическая статистика, теория U-статистики используется для установления статистических процедур (таких как оценки и тесты) и оценок, относящихся к асимптотическая нормальность и дисперсии (в конечных выборках) таких величин.^[3] Теория использовалась для изучения более общей статистики, а также случайные процессы, Такие как случайные графы.^[4]^[5]^[6]

Предположим, что проблема связана с независимые и одинаково распределенные случайные величины и что требуется оценка определенного параметра. Предположим, что простая несмещенная оценка может быть построена на основе всего нескольких наблюдений: это определяет базовую оценку, основанную на заданном количестве наблюдений. Например, одно наблюдение само по себе является объективной оценкой среднего, а пара наблюдений может использоваться для получения объективной оценки дисперсии. U-статистика, основанная на этой оценке, определяется как среднее (по всем комбинаторным выборкам данного размера из полного набора наблюдений) базовой оценки, примененной к подвыборкам.

Сен (1992) дает обзор статьи Василий Хёффдинг (1948), который ввел U-статистику и изложил относящуюся к ней теорию, и тем самым Сен подчеркивает важность U-статистики в статистической теории. Сен говорит^[7] «Влияние Хёффдинга (1948) огромно в настоящее время и, скорее всего, сохранится и в ближайшие годы». Обратите внимание, что теория U-статистики не ограничивается^[8] случай независимые и одинаково распределенные случайные величины или скалярным случайным величинам.^[9]

Определение

Термин U-статистика, введенный Хёффдингом (1948), определяется следующим образом.

Позволять ${displaystyle fcolon R ^ {r} o R}$ быть действительной или комплексной функцией от ${displaystyle r}$ переменных. для каждого ${displaystyle ngeq r}$ ассоциированная U-статистика ${displaystyle f_ {n} двоеточие R ^ {n} o R}$ равно среднему по заказанным образцам ${displaystyle varphi (1), ldots, varphi (r)}$ размера ${displaystyle r}$ значений выборки ${displaystyle f (x_ {varphi})}$ .Другими словами, ${displaystyle f_ {n} (x_ {1}, ldots, x_ {n}) = имя оператора {ave} f (x_ {varphi (1)}, ldots, x_ {varphi (r)})}$ , среднее значение по разным упорядоченным выборкам размером ${displaystyle r}$ взято из ${displaystyle {1, ldots, n}}$ .Каждая U-статистика ${displaystyle f_ {n} (x_ {1}, ldots, x_ {n})}$ обязательно симметричная функция.

U-статистика очень естественна в статистической работе, особенно в контексте Хёффдинга. независимые и одинаково распределенные случайные величины, или в более общем плане для заменяемые последовательности, например, в простая случайная выборка от конечного населения, где определяющее свойство называется «наследование в среднем».

Фишера k-статистика и Тьюки поликайс являются примерами однородный многочлен U-статистика (Фишер, 1929; Тьюки, 1950). Для простой случайной выборки φ размерап взяты из популяцииN, U-статистика обладает тем свойством, что среднее значение выборкиƒ_п(xφ) в точности равно значению численности населенияƒ_N(Икс).

Примеры

Некоторые примеры: Если ${displaystyle f (x) = x}$ U-статистика ${displaystyle f_ {n} (x) = {ar {x}} _ {n} = (x_ {1} + cdots + x_ {n}) / n}$ - выборочное среднее.

Если ${displaystyle f (x_ {1}, x_ {2}) = | x_ {1} -x_ {2} |}$ , U-статистика - это среднее попарное отклонение ${displaystyle f_ {n} (x_ {1}, ldots, x_ {n}) = 2 / (n (n-1)) сумма _ {i> j} | x_ {i} -x_ {j} |}$ , определенная для ${displaystyle ngeq 2}$ .

Если ${displaystyle f (x_ {1}, x_ {2}) = (x_ {1} -x_ {2}) ^ {2} / 2}$ , U-статистика - это выборочная дисперсия ${displaystyle f_ {n} (x) = sum (x_ {i} - {ar {x}} _ {n}) ^ {2} / (n-1)}$ с делителем ${displaystyle n-1}$ , определенная для ${displaystyle ngeq 2}$ .

Третий ${displaystyle k}$ -статистический ${displaystyle k_ {3, n} (x) = sum (x_ {i} - {ar {x}} _ {n}) ^ {3} n / ((n-1) (n-2))}$ ,образец перекос определены для ${displaystyle ngeq 3}$ , является U-статистикой.

Следующий случай подчеркивает важный момент. Если ${displaystyle f (x_ {1}, x_ {2}, x_ {3})}$ это медиана трех значений, ${displaystyle f_ {n} (x_ {1}, ldots, x_ {n})}$ не является медианой ${displaystyle n}$ значения. Однако это несмещенная оценка минимальной дисперсии ожидаемого значения медианы трех значений, а не медианы совокупности. Подобные оценки играют центральную роль, когда параметры семейства распределений вероятностей оцениваются с помощью моментов, взвешенных по вероятности или L-моменты.

Смотрите также

V-статистика

Примечания

^ Кокс и Хинкли (1974), стр. 200, стр. 258
^ Hoeffding (1948), между уравнениями (4.3), (4.4)
^ Сен (1992)
^ Страница 508 в Королюк, В. С .; Боровскич, Ю. В. (1994). Теория U-статистика. Математика и ее приложения. 273 (Перевод П. В. Малышева и Д. В. Малышева из русского оригинала 1989 г.). Дордрехт: Kluwer Academic Publishers Group. с. x + 552. ISBN 0-7923-2608-3. МИСТЕР 1472486.
^ Страницы 381–382 в Боровских, Ю. В. (1996). U-статистика в банаховых пространствах. Утрехт: ВСП. С. xii + 420. ISBN 90-6764-200-2. МИСТЕР 1419498.
^ Страница xii в Квапень, Станислав; Войчинский, Войбор А. (1992). Случайные ряды и стохастические интегралы: одиночные и множественные. Вероятность и ее приложения. Бостон, Массачусетс: Birkhäuser Boston, Inc., стр. Xvi + 360. ISBN 0-8176-3572-6. МИСТЕР 1167198.
^ Сен (1992) стр. 307
^ Сен (1992), стр. 306
^ В последней главе Боровских обсуждается U-статистика для обмениваемый случайные элементы принимая ценности в векторное пространство (отделяемый Банахово пространство ).

U-статистика - U-statistic

Содержание

Определение

Примеры

Смотрите также

Примечания

Рекомендации