Крамерс V - Википедия - Cramérs V
В статистика, Крамера V (иногда называют Фи Крамера и обозначается как φc) является мерой ассоциация между двумя номинальные переменные, что дает значение от 0 до +1 (включительно). Он основан на Статистика хи-квадрат Пирсона и был опубликован Харальд Крамер в 1946 г.[1]
Использование и интерпретация
φc является взаимной корреляцией двух дискретных переменных[2] и может использоваться с переменными, имеющими два или более уровней. φc является симметричной мерой, не имеет значения, какую переменную мы помещаем в столбцы, а какие в строки. Кроме того, порядок строк / столбцов не имеет значения, поэтому φc может использоваться с номинальными типами данных или выше (особенно упорядоченными или числовыми).
V Крамера также может применяться к степень соответствия модели хи-квадрат, когда есть 1 × k стол (в данном случае р = 1). В этом случае k принимается как количество необязательных результатов и служит мерой тенденции к единственному результату.[нужна цитата ]
Крамеровский V изменяется от 0 (соответствует нет ассоциации между переменными) до 1 (полная ассоциация) и может достигать 1 только тогда, когда каждая переменная полностью определяется другой.
φc2 это средний квадрат каноническая корреляция между переменными.[нужна цитата ]
В случае 2 × 2 Таблица сопряженности V Крамера равно Коэффициент Phi.
Обратите внимание, что, поскольку значения хи-квадрат имеют тенденцию увеличиваться с увеличением количества ячеек, тем больше разница между р (строки) и c (столбцы), более вероятно, что φc будет стремиться к 1 без убедительных доказательств значимой корреляции.[нужна цитата ]
V можно рассматривать как связь между двумя переменными в процентах от их максимально возможного изменения. V2 это средний квадрат каноническая корреляция между переменными.[нужна цитата ]
Расчет
Пусть образец размером п одновременно распределенных переменных и за задаваться частотами
- количество раз значения наблюдались.
Тогда статистика хи-квадрат будет:
V Крамера вычисляется путем деления квадратного корня из статистики хи-квадрат на размер выборки и минимальное измерение минус 1:
куда:
- - коэффициент фи.
- выводится из критерия хи-квадрат Пирсона
- это общая сумма наблюдений и
- количество столбцов.
- количество строк.
В p-значение для значимость из V тот же самый, который рассчитывается с использованием Критерий хи-квадрат Пирсона.[нужна цитата ]
Формула дисперсии V= φc известен.[3]
В R функция cramerV ()
из пакета спутник
[4] вычисляет V с помощью функции chisq.test из пакета stats. В отличие от функции cramersV ()
от ЛСР
[5] упаковка, cramerV ()
также предлагает возможность исправить систематическую ошибку. Применяется исправление, описанное в следующем разделе.
Коррекция смещения
V Крамера может быть сильно предвзятой оценкой своего аналога по населению и, как правило, переоценивает силу ассоциации. Поправка смещения, используя приведенные выше обозначения, дается выражением[6]
куда
и
потом оценивает ту же численность населения, что и V Крамера, но обычно с гораздо меньшими среднеквадратичная ошибка. Причина исправления заключается в том, что в условиях независимости.[7]
Смотрите также
Другие меры корреляции для номинальных данных:
- В коэффициент фи
- Т. Чупрова
- В коэффициент неопределенности
- В Лямбда коэффициент
- В Индекс Рэнда
- Индекс Дэвиса – Боулдина
- Индекс Данна
- Индекс Жаккара
- Индекс Фаулкса – Маллоуса
Другие статьи по теме:
Рекомендации
- ^ Крамер, Харальд. 1946 г. Математические методы статистики. Princeton: Princeton University Press, стр. 282 (Глава 21. Двумерный случай). ISBN 0-691-08004-6 (таблица содержания В архиве 2016-08-16 в Wayback Machine )
- ^ Шескин, Дэвид Дж. (1997). Справочник по параметрическим и непараметрическим статистическим процедурам. Бока-Ратон, Флорида: CRC Press.
- ^ Либетрау, Альберт М. (1983). Меры ассоциации. Ньюбери-Парк, Калифорния: Sage Publications. Количественные применения в серии социальных наук № 32 (страницы 15–16)
- ^ «Rcompanion: функции для поддержки оценки программы дополнительного образования». 2019-01-03.
- ^ "Lsr: Companion to" Learning Statistics with R"". 2015-03-02.
- ^ Бергсма, Уичер (2013). "Коррекция смещения для V Крамера и T Чупрова". Журнал Корейского статистического общества. 42 (3): 323–328. Дои:10.1016 / j.jkss.2012.10.002.
- ^ Бартлетт, Морис С. (1937). «Свойства достаточности и статистических тестов». Труды Лондонского королевского общества. Серия А. 160 (901): 268–282. Дои:10.1098 / rspa.1937.0109. JSTOR 96803.
внешняя ссылка
- Мера ассоциации для непараметрической статистики (Алан К. Акок и Гордон Р. Ставиг, страница 1381 из 1381–1386)
- Номинальная ассоциация: Phi and Cramer's Vl.[мертвая ссылка ] с домашней страницы Пэта Даттало.