Нормализация (статистика) - Normalization (statistics)

В статистика и приложения статистики, нормализация может иметь ряд значений.[1] В простейших случаях нормализация рейтингов означает приведение значений, измеренных в различных шкалах, к условно общему масштабу, часто до усреднения. В более сложных случаях нормализация может относиться к более сложным корректировкам, цель которых состоит в том, чтобы распределения вероятностей скорректированных значений в выравнивание. В случае нормализация оценок в образовательной оценке может быть намерение привести распределения в соответствие с нормальное распределение. Другой подход к нормализации распределений вероятностей - квантильная нормализация, где квантили различных мер приведены в соответствие.

В другом использовании в статистике нормализация относится к созданию смещенных и масштабированных версий статистики, при этом предполагается, что эти нормализованные значения позволяют сравнивать соответствующие нормализованные значения для разных наборов данных таким образом, чтобы исключить эффекты определенных грубых влияний, как в аномальный временной ряд. Некоторые типы нормализации включают только изменение масштаба для получения значений, относящихся к некоторой переменной размера. С точки зрения уровни измерения, такие соотношения имеют смысл только для соотношение измерения (где значимы соотношения измерений), а не интервал измерения (где значимы только расстояния, но не отношения).

В теоретической статистике параметрическая нормализация часто может приводить к основные количества - функции, чьи выборочное распределение не зависит от параметров - и до вспомогательная статистика - основные величины, которые можно вычислить из наблюдений, не зная параметров.

Примеры

В статистике существуют разные типы нормализации - безразмерные отношения ошибок, остатки, средние и Стандартное отклонение, которые, следовательно, масштабный инвариант - некоторые из них можно резюмировать следующим образом. Обратите внимание, что с точки зрения уровни измерения эти соотношения имеют смысл только для соотношение измерения (где значимы соотношения измерений), а не интервал измерения (где значимы только расстояния, но не отношения). Смотрите также Категория: Статистические коэффициенты.

ИмяФормулаИспользовать
Стандартный баллНормализация ошибок, когда известны параметры популяции. Хорошо работает для групп населения, которые нормально распределенный[2]
T-статистика Стьюдентаотклонение оценочного значения параметра от его предполагаемого значения, нормированного на его стандартную ошибку.
Студентизованный остатокНормализация остатков при оценке параметров, особенно по разным точкам данных в регрессивный анализ.
Стандартный моментНормирующие моменты с использованием стандартного отклонения как мера масштаба.
Коэффициент
вариация
Нормализация дисперсии с использованием среднего в качестве меры масштаба, особенно для положительного распределения, такого как экспоненциальное распределение и распределение Пуассона.
Минимальное-максимальное масштабирование функцииМасштабирование функций используется для приведения всех значений в диапазон [0,1]. Это также называется нормализацией на основе единицы. Это можно обобщить, чтобы ограничить диапазон значений в наборе данных между любыми произвольными точками. и , используя, например, .

Обратите внимание, что некоторые другие соотношения, такие как отношение дисперсии к среднему , также выполняются для нормализации, но не являются безразмерными: единицы не отменяются, и, таким образом, отношение имеет единицы измерения и не является масштабно-инвариантным.

Другие типы

Другие безразмерные нормализации, которые можно использовать без предположений о распределении, включают:

  • Присвоение процентили. Это обычное дело для стандартных тестов. Смотрите также квантильная нормализация.
  • Нормализация путем добавления и / или умножения на константы, чтобы значения попадали между 0 и 1. Это используется для функции плотности вероятности, с приложениями в таких областях, как физическая химия, для определения вероятностей |ψ|2.

Смотрите также

Рекомендации

  1. ^ Dodge, Y (2003) Оксфордский словарь статистических терминов, ОУП. ISBN  0-19-920613-9 (запись для нормализации оценок)
  2. ^ Фридман, Дэвид; Пизани, Роберт; Первес, Роджер (2007-02-20). Статистика: Четвертое международное студенческое издание. W.W. Нортон и компания. ISBN  9780393930436.