Двумерные данные - Bivariate data

В статистика, двумерные данные является данные на каждом из двух переменные, где каждое значение одной из переменных связано со значением другой переменной.[1] Обычно было бы интересно исследовать возможную связь между двумя переменными.[2] Связь может быть изучена с помощью табличного или графического отображения или с помощью выборочной статистики, которая может использоваться для вывода. Метод, используемый для исследования ассоциации, будет зависеть от уровень измерения переменной.

Для двух количественных переменных (интервал или соотношение в уровень измерения ) можно использовать диаграмму рассеяния и коэффициент корреляции или же регресс модель может быть использована для количественной оценки ассоциации.[3] Для двух качественных переменных (номинальной или порядковой в уровень измерения ) а Таблица сопряженности может использоваться для просмотра данных, а также может использоваться мера ассоциации или тест независимости.[3]

Если переменные являются количественными, пары значений этих двух переменных часто представлены в виде отдельных точек в таблице. самолет используя диаграмма рассеяния. Это сделано для того, чтобы можно было легко увидеть связь (если таковая имеется) между переменными.[4] Например, двумерные данные на диаграмме рассеяния можно использовать для изучения взаимосвязи между длиной шага и длиной ног.

Зависимые и независимые переменные

В некоторых случаях двумерных данных определяется, что одна переменная влияет или определяет вторую переменную, и используются термины зависимые и независимые переменные, чтобы различать два типа переменных. В приведенном выше примере длина ног человека является независимой переменной. Длина шага определяется длиной ног человека, поэтому она является зависимой переменной. Длинные ноги увеличивают длину шага, но увеличение длины шага не увеличивает длину ваших ног.[5]

Корреляции между двумя переменными определяются как сильная или слабая корреляция и оцениваются по шкале от –1 до 1, где 1 - идеальная прямая корреляция, –1 - идеальная обратная корреляция, а 0 - отсутствие корреляции. В случае длинных ног и больших шагов будет сильная прямая корреляция.[6]

Анализ двумерных данных

При анализе двумерных данных обычно либо сравнивают сводные статистические данные каждой из переменных или использует регрессивный анализ чтобы найти силу и направление конкретной взаимосвязи между переменными. Если каждая переменная может принимать только одно из небольшого числа значений, например только «мужской» или «женский», или только «левосторонний» или «правосторонний», тогда совместное распределение частот может отображаться в Таблица сопряженности, который можно проанализировать на предмет силы связи между двумя переменными.

Рекомендации

  1. ^ «Двумерный». Wolfram Research. Получено 2011-08-15.
  2. ^ Мур, Дэвид; Маккейб, Джордж (1999). Введение в статистическую практику (Третье изд.). Нью-Йорк: W.H. Фримен и компания. п. 104.
  3. ^ а б Отт, Лайман; Лонгнекер, Майкл (2010). Введение в статистические методы и анализ данных (Шестое изд.). Бельмонт, Калифорния: Брукс / Коул. С. 102–112.
  4. ^ Национальный совет учителей математики. «Статистика и проблема вероятностей». Получено 7 августа 2013 г. из http://www.nctm.org/uploadedFiles/Statistics%20and%20Probability%20Problem%202.pdf#search=%22bivariate[постоянная мертвая ссылка ] данные% 22
  5. ^ Национальный центр статистики образования. «Что такое независимые и зависимые переменные? Детская зона NCES». Получено 7 августа 2013 г. из http://nces.ed.gov/nceskids/help/user_guide/graph/variables.asp
  6. ^ Пирс, Род. (4 января 2013 г.). «Корреляция». Математика - это весело. Получено 7 августа 2013 г. из http://www.mathsisfun.com/data/correlation.html