Распределение частоты - Frequency distribution

В статистика, а Распределение частоты представляет собой список, таблицу или график, отображающий частоту различных результатов в образец.[1] Каждая запись в таблице содержит частота или подсчет вхождений значений в определенной группе или интервале.

Пример

Вот пример одномерного (одиночного Переменная ) частотная таблица. Отображается частота каждого ответа на вопрос опроса.

КлассифицироватьСтепень согласияЧисло
1Полностью согласен20
2Отчасти согласен30
3Точно сказать не могу20
4Несколько не согласен15
5Категорически не согласен15

Другая схема табуляции агрегирует значения в ячейки, так что каждая ячейка охватывает диапазон значений. Например, рост учащихся в классе можно объединить в следующую таблицу частот.

Диапазон высотыКоличество студентовНакопительное число
менее 5,0 футов2525
5,0–5,5 футов3560
5,5–6,0 футов2080
6,0–6,5 футов20100

Частотное распределение показывает нам обобщенную группировку данных, разделенных на взаимоисключающие классы, и количество вхождений в классе. Это способ отображения неорганизованных данных, особенно для отображения результатов выборов, доходов людей в определенном регионе, продаж продукта за определенный период, сумм студенческих ссуд для выпускников и т. Д. Некоторые графики, которые можно использовать с частотные распределения гистограммы, линейные диаграммы, гистограммы и круговые диаграммы. Распределения частот используются как для качественных, так и для количественных данных.

Строительство

  1. Определитесь с количеством занятий. Слишком много классов или слишком мало классов могут не раскрыть основную форму набора данных, также будет трудно интерпретировать такое частотное распределение. Идеальное количество классов можно определить или оценить по формуле: (основание 10), или выбор квадратного корня формула куда п - общее количество наблюдений в данных. (Последнее будет слишком большим для больших наборов данных, таких как статистика населения.) Однако эти формулы не являются жестким правилом, и результирующее количество классов, определяемое формулой, не всегда может точно соответствовать обрабатываемым данным.
  2. Рассчитайте диапазон данных (Диапазон = Макс. - Мин.) путем нахождения минимального и максимального значений данных. Диапазон будет использоваться для определения интервала или ширины класса.
  3. Определите ширину классов, обозначенную час и получен (при условии, что интервалы классов одинаковы для всех классов).

Обычно интервал классов или ширина классов одинаковы для всех классов. Все классы, взятые вместе, должны охватывать как минимум расстояние от самого низкого (минимального) значения в данных до самого высокого (максимального) значения. Равные интервалы классов предпочтительны в распределении частот, в то время как неравные интервалы классов (например, логарифмические интервалы) могут быть необходимы в определенных ситуациях, чтобы обеспечить хороший разброс наблюдений между классами и избежать большого количества пустых или почти пустых классов.[2]

  1. Определите индивидуальные ограничения класса и выберите подходящую начальную точку первого класса, которая является произвольной; оно может быть меньше или равно минимальному значению. Обычно он запускается до минимального значения таким образом, чтобы средняя точка (среднее значение нижнего и верхнего пределов первого класса) была правильно[требуется разъяснение ] размещен.
  2. Возьмите наблюдение и отметьте вертикальной чертой (|) класс, к которому оно принадлежит. Текущий счет ведется до последнего наблюдения.
  3. Найдите нужные частоты, относительную частоту, совокупную частоту и т. Д.

Совместные частотные распределения

Двумерные совместные частотные распределения часто представлены как (двусторонние) таблицы непредвиденных обстоятельств:

Двусторонняя таблица непредвиденных обстоятельств с предельными частотами
ТанецСпортивныйтелевидениеОбщий
Мужчины210820
Женщины166830
Общий18161650

В итоговой строке и итоговом столбце указаны предельные частоты или предельное распределение, а в теле таблицы указаны совместные частоты.[3]

Приложения

Управлять данными в таблице частот и работать с ними намного проще, чем с необработанными данными. Есть простые алгоритмы для вычисления медианы, среднего, стандартного отклонения и т. Д. Из этих таблиц.

Статистическая проверка гипотез основан на оценке различий и сходств между частотными распределениями. Эта оценка включает меры основная тенденция или же средние, такой как иметь в виду и медиана, и меры изменчивости или статистическая дисперсия, такой как стандартное отклонение или же отклонение.

Частотное распределение называется перекошенный когда его среднее значение и медиана существенно различаются, или, в более общем смысле, когда это асимметричный. В эксцесс частотного распределения - это мера доли экстремальных значений (выбросов), которые появляются на обоих концах гистограмма. Если распределение более подвержено выбросам, чем нормальное распределение говорят, что это лептокуртика; если менее склонен к выбросам, это называется плоскостопием.

Частота писем дистрибутивы также используются в частотный анализ взломать шифры, и используются для сравнения относительной частоты букв на разных языках, при этом часто используются другие языки, такие как греческий, латинский и т. д.

Смотрите также

Примечания

  1. ^ Австралийское статистическое бюро, http://www.abs.gov.au/websitedbs/a3121120.nsf/home/statistical+language+-+frequency+distribution
  2. ^ Маникандан, С. (1 января 2011 г.). "Распределение частоты". Журнал фармакологии и фармакотерапии. 2 (1): 54–55. Дои:10.4103 / 0976-500X.77120. ISSN  0976-500X. ЧВК  3117575. PMID  21701652.
  3. ^ Stat Trek, Глоссарий статистики и вероятностей, s.v. Совместная частота

внешняя ссылка