Статистическая дисперсия - Statistical dispersion
Эта статья нужны дополнительные цитаты для проверка.Декабрь 2010 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
В статистика, разброс (также называемый изменчивость, разбросать, или же распространять) - это степень, в которой распределение растягивается или сжимается.[1] Распространенными примерами мер статистической дисперсии являются отклонение, стандартное отклонение, и межквартильный размах.
Дисперсия контрастирует с местоположением или основная тенденция, и вместе они являются наиболее часто используемыми свойствами распределений.
Меры
Мера статистической дисперсии неотрицательна. настоящий номер это ноль, если все данные одинаковы, и увеличивается по мере того, как данные становятся более разнообразными.
Большинство мер дисперсии имеют одинаковые единицы как количество измеряется. Другими словами, если измерения даны в метрах или секундах, то и дисперсия измеряется. Примеры мер рассеивания включают:
- Стандартное отклонение
- Межквартильный размах (IQR)
- Классифицировать
- Средняя абсолютная разница (также известная как абсолютная разница среднего значения Джини)
- Среднее абсолютное отклонение (СУМАСШЕДШИЙ)
- Среднее абсолютное отклонение (или просто среднее отклонение)
- Стандартное отклонение расстояния
Они часто используются (вместе с масштабные коэффициенты ) в качестве оценщики из параметры шкалы, в каком качестве они называются оценки масштаба. Надежные меры масштаба те, на кого не влияет небольшое количество выбросы, и включают IQR и MAD.
Все перечисленные выше меры статистической дисперсии обладают тем полезным свойством, что они инвариантный и линейный по шкале. Это означает, что если случайная переменная Икс имеет разброс SИкс затем линейное преобразование Y = aX + б за настоящий а и б должен иметь разброс SY = |а|SИкс, где |а| это абсолютная величина из а, то есть игнорирует предыдущий отрицательный знак –.
Другие меры дисперсии: безразмерный. Другими словами, у них нет единиц измерения, даже если у самой переменной есть единицы. К ним относятся:
- Коэффициент вариации
- Квартильный коэффициент дисперсии
- Относительная средняя разница, равный удвоенному Коэффициент Джини
- Энтропия: Хотя энтропия дискретной переменной инвариантна относительно местоположения и не зависит от масштаба и, следовательно, не является мерой дисперсии в указанном выше смысле, энтропия непрерывной переменной инвариантна относительно местоположения и аддитивна по масштабу: если Гц энтропия непрерывной переменной z и у = ах + Ь, тогда Hy = Hx + log (а).
Существуют и другие меры рассеивания:
- Дисперсия (квадрат стандартного отклонения) - не зависит от местоположения, но не линейно по масштабу.
- Отношение дисперсии к среднему - в основном используется для подсчитывать данные когда срок коэффициент дисперсии используется и когда это соотношение безразмерный, поскольку данные подсчета сами по себе безразмерны, не иначе.
Некоторые меры рассеивания имеют специализированные цели, в том числе Вариация Аллана и Дисперсия Адамара.
За категориальные переменные реже измеряют дисперсию одним числом; видеть качественная вариация. Одним из таких показателей является дискретный энтропия.
Источники
в физические науки, такая изменчивость может быть результатом случайных ошибок измерения: измерения прибора часто не идеально точный, т.е. воспроизводимый, и есть дополнительные межэкспертная изменчивость в интерпретации и представлении результатов измерений. Можно предположить, что измеряемая величина стабильна, и что различия между измерениями связаны с ошибка наблюдения. Система из большого количества частиц характеризуется средними значениями относительно небольшого количества макроскопических величин, таких как температура, энергия и плотность. Стандартное отклонение - важная мера в теории флуктуаций, которая объясняет многие физические явления, в том числе почему небо голубое.[2]
в Биологические науки, измеряемая величина редко бывает неизменной и стабильной, и наблюдаемое изменение может дополнительно быть внутренний к явлению: это может быть связано с межличностная изменчивость, то есть отдельные члены популяции, отличающиеся друг от друга. Кроме того, это может быть связано с внутрииндивидуальная изменчивость, то есть один и тот же субъект, различающийся тестами, сданными в разное время или в других различных условиях. Подобные типы изменчивости также наблюдаются на арене производимой продукции; даже там дотошный ученый находит вариации.
В экономика, финансы, и другие дисциплины, регрессивный анализ попытки объяснить дисперсию зависимая переменная, как правило, измеряется его дисперсией с использованием одного или нескольких независимые переменные каждая из которых сама имеет положительную дисперсию. Объясненная доля дисперсии называется коэффициент детерминации.
Частичное упорядочение дисперсии
А средний сохраняющий спред (MPS) - это переход от одного распределения вероятностей A к другому распределению вероятностей B, где B формируется путем распределения одной или нескольких частей функции плотности вероятности A, при этом среднее (ожидаемое значение) остается неизменным.[3] Концепция сохраняющего среднее значение спреда обеспечивает частичный заказ распределений вероятностей в соответствии с их дисперсиями: из двух распределений вероятностей одно может быть оценено как имеющее большую дисперсию, чем другое, или, альтернативно, ни одно из них не может быть оценено как имеющее большую дисперсию.
Смотрите также
- Средний
- Сводные статистические данные
- Качественная вариация
- Надежные меры масштаба
- Погрешность измерения
Рекомендации
- ^ Электронный справочник статистических методов NIST / SEMATECH. «1.3.6.4. Параметры положения и масштаба». www.itl.nist.gov. Министерство торговли США.
- ^ Маккуорри, Дональд А. (1976). Статистическая механика. Нью-Йорк: Харпер и Роу. ISBN 0-06-044366-9.
- ^ Ротшильд, Майкл; Стиглиц, Джозеф (1970). «Возрастающий риск I: определение». Журнал экономической теории. 2 (3): 225–243. Дои:10.1016/0022-0531(70)90038-4.