Ядро (статистика) - Kernel (statistics)

Период, термин ядро используется в статистический анализ ссылаться на оконная функция. Термин «ядро» имеет несколько различных значений в разных отраслях статистики.

Байесовская статистика

В статистике, особенно в Байесовская статистика, ядро функция плотности вероятности (pdf) или функция массы вероятности (pmf) - это форма pdf или pmf, в которой опускаются любые факторы, не являющиеся функциями какой-либо из переменных в домене.[нужна цитата ] Обратите внимание, что такие факторы вполне могут быть функциями параметры из PDF или PMF. Эти факторы составляют часть коэффициент нормализации из распределение вероятностей, и во многих ситуациях они не нужны. Например, в выборка псевдослучайных чисел, большинство алгоритмов выборки игнорируют коэффициент нормализации. Кроме того, в Байесовский анализ из сопряженный предшествующий распределений, нормировочные коэффициенты обычно игнорируются во время вычислений, и учитывается только ядро. В конце проверяется форма ядра, и если она соответствует известному распределению, коэффициент нормализации может быть восстановлен. В противном случае в этом может быть нет необходимости (например, если нужно только выбрать распределение).

Для многих дистрибутивов ядро ​​можно записать в замкнутой форме, но не нормировочную константу.

Примером может служить нормальное распределение. это функция плотности вероятности является

и связанное ядро

Обратите внимание, что множитель перед экспонентой был опущен, хотя он содержит параметр , потому что это не функция переменной домена .

Анализ паттернов

Ядро воспроизводящее ядро ​​гильбертова пространства используется в наборе техник, известных как методы ядра для выполнения таких задач, как статистическая классификация, регрессивный анализ, и кластерный анализ на данных в неявном пространстве. Это использование особенно распространено в машинное обучение.

Непараметрическая статистика

В непараметрическая статистика, ядро ​​- это весовая функция, используемая в непараметрический методы оценки. Ядра используются в оценка плотности ядра оценить случайные переменные ' функции плотности, или в регрессия ядра оценить условное ожидание случайной величины. Ядра также используются в Временные ряды, в использовании периодограмма оценить спектральная плотность где они известны как оконные функции. Дополнительное использование - оценка изменяющейся во времени интенсивности для точечный процесс где оконные функции (ядра) свертываются с данными временных рядов.

Обычно ширина ядра также должна быть указана при запуске непараметрической оценки.

Определение

Ядро - это неотрицательный ценный интегрируемый функция К. Для большинства приложений желательно определить функцию для удовлетворения двух дополнительных требований:

  • Симметрия:

Первое требование гарантирует, что метод оценки плотности ядра дает функция плотности вероятности. Второе требование гарантирует, что среднее значение соответствующего распределения равно среднему значению используемой выборки.

Если K ядро, то и функция K* определяется K*(ты) = λKты), где λ> 0. Это можно использовать для выбора масштаба, подходящего для данных.

Общие функции ядра

Все ядра ниже в единой системе координат.

Обычно используются несколько типов функций ядра: равномерная, треугольная, Епанечникова,[1] квартика (двувес), трикуб,[2] трехвес, гауссовский, квадратичный[3] и косинус.

В таблице ниже, если дается с ограниченным поддержка, тогда для ценностей ты лежа вне опоры.

Функции ядра, K(ты)Эффективность[4] относительно ядра Епанечникова
Равномерное («прямоугольное окно»)

Поддержка:

Ядро uniform.svg

"Функция товарного вагона "

    92.9%
Треугольная

Поддержка:

Ядро треугольник.svg    98.6%
Епанечников

(параболический)

Поддержка:

Ядро epanechnikov.svg    100%
Quartic
(двухвес)

Поддержка:

Ядро quartic.svg    99.4%
Трехвес

Поддержка:

Ядро triweight.svg    98.7%
Tricube

Поддержка:

Ядро tricube.svg    99.8%
ГауссовскийЯдро exponential.svg    95.1%
Косинус

Поддержка:

Ядро cosine.svg    99.9%
ЛогистикаЯдро logistic.svg    88.7%
Сигмовидная функцияЯдро logistic.svg    84.3%
Ядро Сильвермана[5]Ядро Silverman.svg    непригодный

Смотрите также

использованная литература

  1. ^ Названный для Епанечников, В. А. (1969). "Непараметрическая оценка многомерной плотности вероятности". Теория вероятн. Приложение. 14 (1): 153–158. Дои:10.1137/1114019.
  2. ^ Альтман, Н.С. (1992). «Введение в непараметрическую регрессию ядра и ближайшего соседа». Американский статистик. 46 (3): 175–185. Дои:10.1080/00031305.1992.10475879. HDL:1813/31637.
  3. ^ Кливленд, У.С.; Девлин, С. Дж. (1988). «Локально взвешенная регрессия: подход к регрессионному анализу путем локальной подгонки». Журнал Американской статистической ассоциации. 83 (403): 596–610. Дои:10.1080/01621459.1988.10478639.
  4. ^ Эффективность определяется как .
  5. ^ Сильверман, Б. В. (1986). Оценка плотности для статистики и анализа данных. Чепмен и Холл, Лондон.
  • Ли, Ци; Расин, Джеффри С. (2007). Непараметрическая эконометрика: теория и практика. Издательство Принстонского университета. ISBN  978-0-691-12161-1.
  • Comaniciu, D; Меер, П. (2002). «Среднее смещение: надежный подход к анализу пространства признаков». IEEE Transactions по анализу шаблонов и машинному анализу. 24 (5): 603–619. CiteSeerX  10.1.1.76.8968. Дои:10.1109/34.1000236.