Подтверждающий факторный анализ - Confirmatory factor analysis

В статистика, подтверждающий факторный анализ (CFA) является особой формой факторный анализ, чаще всего используется в социальных исследованиях.[1] Он используется для проверки того, насколько строить согласуются с пониманием исследователем природы этой конструкции (или фактора). Таким образом, цель подтверждающего факторного анализа состоит в том, чтобы проверить, соответствуют ли данные предполагаемой модели измерения. Эта предполагаемая модель основана на теории и / или предыдущих аналитических исследованиях.[2] CFA был впервые разработан Йореског[3] и построил и заменил старые методы анализа конструировать действительность такой как Матрица MTMM как описано Campbell & Fiske (1959).[4]

В подтверждающем факторном анализе исследователь сначала разрабатывает гипотеза о том, какие факторы, по их мнению, лежат в основе используемых показателей (например, "Депрессия "являясь фактором, лежащим в основе Инвентаризация депрессии Бека и Шкала оценки депрессии Гамильтона ) и может накладывать ограничения на модель, основанную на этих априори гипотезы. Налагая эти ограничения, исследователь заставляет модель соответствовать своей теории. Например, если предполагается, что есть два фактора, определяющие ковариация в измерениях и что эти факторы не связаны друг с другом, исследователь может создать модель, в которой корреляция между фактором A и фактором B ограничена нулем. Затем можно получить меры соответствия модели, чтобы оценить, насколько хорошо предложенная модель отражает ковариацию между всеми элементами или показателями модели. Если ограничения, наложенные исследователем на модель, несовместимы с данными выборки, то результаты статистических тестов соответствия модели будут указывать на плохое соответствие, и модель будет отклонена. Если посадка плохая, это может быть связано с тем, что некоторые предметы измеряют несколько факторов. Также может быть, что некоторые элементы внутри фактора больше связаны друг с другом, чем другие.

Для некоторых приложений требование «нулевых нагрузок» (для индикаторов, не предполагающих нагрузку на определенный фактор) было сочтено слишком строгим. Недавно разработанный метод анализа, «исследовательское моделирование структурным уравнением», определяет гипотезы о связи между наблюдаемыми показателями и их предполагаемыми первичными скрытые факторы с возможностью оценки нагрузок и другими скрытыми факторами.[5]

Статистическая модель

При подтверждающем факторном анализе исследователей обычно интересует степень, в которой ответы на п Вектор x 1 наблюдаемых случайных величин может использоваться для присвоения значения одной или более ненаблюдаемой переменной (ам) η. Исследование в значительной степени осуществляется путем оценки и оценки загрузки каждого элемента, используемого для выявления аспектов ненаблюдаемой скрытой переменной. То есть y [i] - вектор наблюдаемых ответов, предсказанных ненаблюдаемой скрытой переменной. , который определяется как:

,

куда это п x 1 вектор наблюдаемых случайных величин, - ненаблюдаемые скрытые переменные или переменные в многомерном случае, и это п Икс k матрица с k равно количеству скрытых переменных.[6] С, несовершенные меры , модель также состоит из ошибки, . Оценки в случае максимального правдоподобия (ML), полученные путем итеративной минимизации функции соответствия,

куда - ковариационная матрица, подразумеваемая предлагаемой моделью факторного анализа, и - наблюдаемая ковариационная матрица дисперсии.[6] То есть находят значения для освобожденных параметров модели, которые минимизируют разницу между подразумеваемой моделью ковариационной матрицей и наблюдаемой ковариационной матрицей дисперсии.

Альтернативные стратегии оценки

Хотя для оценки моделей CFA использовались многочисленные алгоритмы, метод максимального правдоподобия (ML) остается первичной процедурой оценки.[7] При этом модели CFA часто применяются к условиям данных, которые отклоняются от нормальных требований теории для достоверной оценки ML. Например, социологи часто оценивают модели CFA с ненормальными данными и показателями, масштабируемыми с использованием дискретных упорядоченных категорий.[8] Соответственно, были разработаны альтернативные алгоритмы, которые учитывают различные условия данных, с которыми сталкиваются прикладные исследователи. Альтернативные оценки были охарактеризованы в два основных типа: (1) робастные и (2) ограниченные информации оценки.[9]

Когда ML реализуется с данными, которые отклоняются от предположений нормальной теории, модели CFA могут давать смещенные оценки параметров и вводящие в заблуждение выводы.[10] Робастная оценка обычно пытается исправить проблему путем корректировки модели нормальной теории χ2 и стандартные ошибки.[9] Например, Саторра и Бентлер (1994) рекомендовали использовать оценку машинного обучения обычным способом и впоследствии разделить модель на χ2 мерой степени многомерного эксцесса.[11] Дополнительным преимуществом надежных оценщиков машинного обучения является их доступность в общем программном обеспечении SEM (например, LAVAAN).[12]

К сожалению, робастные оценщики машинного обучения могут оказаться непригодными в условиях обычных данных. В частности, когда показатели масштабируются с использованием нескольких категорий ответов (например, не согласен, нейтральный, согласны) надежные оценщики машинного обучения, как правило, работают плохо.[10] Оценщики с ограниченной информацией, такие как взвешенный метод наименьших квадратов (WLS), вероятно, будут лучшим выбором, когда явные индикаторы принимают порядковую форму.[13] В целом, оценщики с ограниченной информацией обращаются к порядковым индикаторам, используя полихорические корреляции соответствовать моделям CFA.[14] Полихорические корреляции отражают ковариацию между двумя скрытыми переменными, когда наблюдается только их категоризованная форма, что достигается в основном за счет оценки пороговых параметров.[15]

Исследовательский факторный анализ

Обе исследовательский факторный анализ (ОДВ) и подтверждающий факторный анализ (CFA) используются для понимания общей дисперсии измеряемых переменных, которая, как считается, связана с фактором или латентной конструкцией. Однако, несмотря на это сходство, EFA и CFA представляют собой концептуально и статистически разные анализы.

Цель EFA - выявить факторы на основе данных и максимизировать объясненную дисперсию.[16] От исследователя не требуется иметь каких-либо конкретных гипотез о том, сколько факторов возникнет, и какие элементы или переменные будут включать эти факторы. Если эти гипотезы существуют, они не учитываются и не влияют на результаты статистического анализа. Напротив, CFA оценивает априори гипотезы и во многом основывается на теории. Анализ CFA требует, чтобы исследователь заранее выдвинул гипотезу о количестве факторов, о том, коррелированы ли эти факторы, и какие элементы / меры влияют и отражают какие факторы.[17] Таким образом, в отличие от исследовательского факторный анализ, где все нагрузки могут изменяться, CFA допускает явное ограничение определенных нагрузок равным нулю.

EFA часто считается более подходящим, чем CFA, на ранних этапах разработки шкалы, потому что CFA не показывает, насколько хорошо ваши элементы влияют на негипотетические факторы. [18] Еще один веский аргумент в пользу первоначального использования ОДВ заключается в том, что неверное указание количества факторов на ранней стадии разработки шкалы, как правило, не будет обнаружено подтверждающим факторным анализом. На более поздних стадиях разработки шкалы подтверждающие методы могут предоставить больше информации за счет явного противопоставления конкурирующих структур факторов. [18]

EFA иногда упоминается в исследованиях, когда CFA может быть лучшим статистическим подходом.[19] Утверждалось, что CFA может быть ограничительным и неуместным при использовании в исследовательских целях.[20] Однако идея о том, что CFA является исключительно «подтверждающим» анализом, иногда может вводить в заблуждение, поскольку индексы модификации, используемые в CFA, носят в некоторой степени исследовательский характер. Индексы модификации показывают улучшение соответствия модели, если конкретный коэффициент не ограничивается.[21] Точно так же EFA и CFA не обязательно должны быть взаимоисключающими анализами; Считается, что EFA является разумным продолжением плохо подходящей модели CFA.[22]

Структурное моделирование уравнение

Структурное моделирование уравнение программное обеспечение обычно используется для выполнения подтверждающего факторного анализа. LISREL,[23] EQS,[24] AMOS,[25] Mplus[26] и пакет лавы в R[27] являются популярными программами. CFA также часто используется в качестве первого шага для оценки предлагаемой модели измерения в модели структурного уравнения. Многие правила интерпретации, касающиеся оценки соответствия модели и модификации модели в структурное моделирование уравнение в равной степени относятся и к CFA. CFA отличается от моделирования структурным уравнением тем, что в CFA нет направленных стрелок между скрытые факторы. Другими словами, в то время как в CFA не предполагается, что факторы напрямую вызывают друг друга, SEM часто определяет конкретные факторы и переменные как причинные по своей природе. В контексте SEM, CFA часто называют «моделью измерения», в то время как отношения между скрытые переменные (с направленными стрелками) называются «структурной моделью».

Оценка соответствия модели

В CFA используется несколько статистических тестов, чтобы определить, насколько хорошо модель соответствует данным.[16] Обратите внимание, что хорошее соответствие между моделью и данными не означает, что модель «правильная», или даже что она объясняет большую часть ковариации. «Хорошая подгонка модели» означает только то, что модель правдоподобна.[28] При сообщении результатов подтверждающего факторного анализа настоятельно рекомендуется сообщать: а) предлагаемые модели, б) любые внесенные изменения, в) меры, определяющие каждую скрытую переменную, г) корреляции между скрытыми переменными, д) любую другую соответствующую информацию. , например, используются ли ограничения.[29] Что касается выбора статистики соответствия модели для отчета, не следует просто сообщать статистику, которая оценивает наилучшее соответствие, хотя это может быть заманчивым. Хотя существует несколько различных мнений, Клайн (2010) рекомендует использовать критерий хи-квадрат, среднеквадратичную ошибку аппроксимации (RMSEA), сравнительный индекс соответствия (CFI) и стандартизованный среднеквадратичный остаток (SRMR).[1]

Индексы абсолютной пригодности

Индексы абсолютного соответствия определяют, насколько хорошо априорная модель соответствует или воспроизводит данные.[30] Индексы абсолютного соответствия включают, помимо прочего, критерий хи-квадрат, RMSEA, GFI, AGFI, RMR и SRMR.[31]

Тест хи-квадрат

Тест хи-квадрат указывает на разницу между наблюдаемым и ожидаемым ковариационные матрицы. Значения, близкие к нулю, указывают на лучшее соответствие; меньшая разница между ожидаемой и наблюдаемой ковариационной матрицей.[21] Статистику хи-квадрат также можно использовать для прямого сравнения соответствия вложенные модели к данным. Однако одна трудность с критерием соответствия модели хи-квадрат заключается в том, что исследователи могут не отклонить несоответствующую модель при малых размерах выборки и отклонить подходящую модель при больших размерах выборки.[21] В результате были разработаны другие меры соответствия.

Среднеквадратичная ошибка аппроксимации

Среднеквадратичная ошибка аппроксимации (RMSEA) позволяет избежать проблем, связанных с размером выборки, путем анализа несоответствия между гипотетической моделью с оптимально выбранными оценками параметров и ковариационной матрицей совокупности.[31] RMSEA находится в диапазоне от 0 до 1, меньшие значения указывают на лучшее соответствие модели. Значение 0,06 или меньше указывает на приемлемое соответствие модели.[32][33]

Среднеквадратичный остаток и стандартизованный среднеквадратичный остаток

Среднеквадратичный остаток (RMR) и стандартизованный среднеквадратичный остаток (SRMR) являются квадратным корнем из расхождения между выборочной ковариационной матрицей и ковариационной матрицей модели.[31] Однако RMR может быть несколько сложно интерпретировать, поскольку его диапазон основан на шкалах показателей в модели (это становится сложно, когда у вас есть несколько показателей с разными шкалами, например, два вопросника, один по шкале от 0 до 10. , другой по шкале от 1 до 3).[1] Стандартизированная среднеквадратичная невязка устраняет эту трудность в интерпретации и составляет от 0 до 1, при этом значение 0,08 или меньше указывает на приемлемую модель.[32]

Индекс согласия и скорректированный индекс согласия

Индекс согласия (GFI) - это мера соответствия между гипотетической моделью и наблюдаемой ковариационной матрицей. Скорректированный индекс согласия (AGFI) корректирует GFI, на который влияет количество индикаторов каждой скрытой переменной. GFI и AGFI находятся в диапазоне от 0 до 1, при этом значение более 0,9 обычно указывает на приемлемое соответствие модели.[34]

Индексы относительной подгонки

Индексы относительного соответствия (также называемые «индексами возрастающего соответствия»)[35] и «сравнительные индексы соответствия»[36]) сравните хи-квадрат для предполагаемой модели с одной из «нулевой» или «базовой» модели.[30] Эта нулевая модель почти всегда содержит модель, в которой все переменные не коррелированы, и, как следствие, имеет очень большой хи-квадрат (что указывает на плохое соответствие).[31] Индексы относительного соответствия включают нормированный индекс соответствия и индекс сравнительного соответствия.

Нормированный индекс соответствия и ненормированный индекс соответствия

Нормированный индекс соответствия (NFI) анализирует несоответствие между значением хи-квадрат гипотетической модели и значением хи-квадрат нулевой модели.[37] Однако NFI имеет тенденцию быть отрицательным.[38] Ненормированный индекс соответствия (NNFI; также известный как индекс Такера-Льюиса, поскольку он был построен на индексе, сформированном Такером и Льюисом в 1973 г.[39]) решает некоторые проблемы отрицательного смещения, хотя значения NNFI иногда могут выходить за пределы диапазона от 0 до 1.[36] Значения как для NFI, так и для NNFI должны находиться в диапазоне от 0 до 1, с порогом 0,95 или выше, указывающим на хорошее соответствие модели.[40]

Сравнительный индекс соответствия

Индекс сравнительного соответствия (CFI) анализирует соответствие модели, исследуя несоответствие между данными и гипотетической моделью, с поправкой на проблемы размера выборки, присущие критерию соответствия модели хи-квадрат,[21] и нормированный индекс соответствия.[36] Значения CFI варьируются от 0 до 1, причем большие значения указывают на лучшее соответствие. Раньше считалось, что значение CFI 0,90 или больше указывает на приемлемое соответствие модели.[40] Однако недавние исследования показали, что необходимо значение больше 0,90, чтобы гарантировать, что неправильно указанные модели не будут считаться приемлемыми (Hu & Bentler, 1999). Таким образом, значение CFI 0,95 или выше в настоящее время считается показателем хорошего соответствия (Hu & Bentler, 1999).

Идентификация и недооценка

Чтобы оценить параметры модели, модель должна быть правильно идентифицирована. То есть количество предполагаемых (неизвестных) параметров (q) должно быть меньше или равно количеству уникальных дисперсий и ковариаций среди измеряемых переменных; п(п + 1) / 2. Это уравнение известно как «правило t». Если имеется слишком мало информации, на которой можно основывать оценки параметров, модель считается недооцененной, и параметры модели не могут быть правильно оценены.[41]

Смотрите также

Рекомендации

  1. ^ а б c Клайн, Р. Б. (2010). Принципы и практика моделирования структурным уравнением (3-е изд.). Нью-Йорк, Нью-Йорк: Guilford Press.
  2. ^ Приди, В. Р. и Уотсон, Р. Р. (2009) Справочник по бремени болезней и показателям качества жизни. Нью-Йорк: Спрингер.
  3. ^ Йореског, К. Г. (1969). Общий подход к подтверждающему анализу факторов максимального правдоподобия. Психометрика, 34 (2), 183-202.
  4. ^ Кэмпбелл, Д. Т. и Фиск, Д. В. (1959). Сходящаяся и дискриминантная проверка с помощью матрицы мультитрейт-мультиметод. Психологический бюллетень, 56, 81-105.
  5. ^ Аспарухов, Т. и Мутен, Б. (2009). Исследовательское моделирование структурными уравнениями. Структурное моделирование уравнение, 16, 397-438
  6. ^ а б Ян-Валлентин, Фан; Йореског, Карл Г .; Ло, Хао (13.07.2010). «Подтверждающий факторный анализ порядковых переменных с неверно указанными моделями». Моделирование структурным уравнением: многопрофильный журнал. 17 (3): 392–423. Дои:10.1080/10705511.2010.489003. ISSN  1070-5511.
  7. ^ Флора, Дэвид Б .; Курран, Патрик Дж. (2004). «Эмпирическая оценка альтернативных методов оценки для подтверждающего факторного анализа с порядковыми данными». Психологические методы. 9 (4): 466–491. Дои:10.1037 / 1082-989x.9.4.466. ЧВК  3153362. PMID  15598100.
  8. ^ Миллсап, Роджер Э .; Юн-Тейн, Дженн (01.07.2004). «Оценка факторной инвариантности в упорядоченно-категориальных мерах». Многомерное поведенческое исследование. 39 (3): 479–515. Дои:10.1207 / S15327906MBR3903_4. ISSN  0027-3171.
  9. ^ а б Бандалос, Дебора Л. (02.01.2014). «Относительная производительность категориального диагонально взвешенного метода наименьших квадратов и робастная оценка максимального правдоподобия». Моделирование структурным уравнением: многопрофильный журнал. 21 (1): 102–116. Дои:10.1080/10705511.2014.859510. ISSN  1070-5511.
  10. ^ а б Ли, Чэн-Сянь (15.07.2015). «Подтверждающий факторный анализ с порядковыми данными: сравнение надежного максимального правдоподобия и диагонально взвешенных наименьших квадратов». Методы исследования поведения. 48 (3): 936–949. Дои:10.3758 / s13428-015-0619-7. ISSN  1554-3528. PMID  26174714.
  11. ^ Брайант, Фред Б .; Саторра, Альберт (2012-07-20). «Принципы и практика проверки хи-квадрат по шкале разности». Моделирование структурным уравнением: многопрофильный журнал. 19 (3): 372–398. Дои:10.1080/10705511.2012.687671. ISSN  1070-5511.
  12. ^ Россель, Ив (2012). "Lavaan: пакет R для моделирования структурных уравнений | Россель | Журнал статистического программного обеспечения". Журнал статистического программного обеспечения. 48 (2). Дои:10.18637 / jss.v048.i02.
  13. ^ Ремтулла, Мийке; Brosseau-Liard, Patricia É .; Савалей, Виктория (2012). «Когда можно рассматривать категориальные переменные как непрерывные? Сравнение надежных методов непрерывной и категориальной оценки SEM при неоптимальных условиях». Психологические методы. 17 (3): 354–373. Дои:10.1037 / a0029315. PMID  22799625.
  14. ^ Ян-Валлентин, Фан; Йореског, Карл Г .; Ло, Хао (13.07.2010). «Подтверждающий факторный анализ порядковых переменных с неверно указанными моделями». Моделирование структурным уравнением: многопрофильный журнал. 17 (3): 392–423. Дои:10.1080/10705511.2010.489003. ISSN  1070-5511.
  15. ^ Ольссон, Ульф (1979). «Оценка максимального правдоподобия коэффициента полихорической корреляции». Психометрика. 44 (4): 443–460. Дои:10.1007 / BF02296207. ISSN  0033-3123.
  16. ^ а б Зур, Д. Д. (2006) - «Исследовательский или подтверждающий факторный анализ?» в Статистика и анализ данных, 31, Получено 20 апреля 2012 г., из http://www2.sas.com/proceedings/sugi31/200-31.pdf
  17. ^ Томпсон, Б. (2004). Исследовательский и подтверждающий факторный анализ: понимание концепций и приложений. Вашингтон, округ Колумбия, США: Американская психологическая ассоциация.
  18. ^ а б Келлоуэй, Э. К. (1995). Моделирование структурным уравнением в перспективе. Журнал организационного поведения, 16 (3), 215-224.
  19. ^ Левин, Т. Р. (2005). Подтверждающий факторный анализ и валидация шкалы в коммуникационных исследованиях. Отчеты о коммуникационных исследованиях, 22(4), 335-338.
  20. ^ Браун, М. В. (2001). Обзор аналитической ротации в исследовательском факторном анализе. Многомерное поведенческое исследование, 36, 111-150.
  21. ^ а б c d Гатиньон, Х. (2010). Подтверждающий факторный анализ в статистическом анализе управленческих данных. DOI: 10.1007 / 978-1-4419-1270-1_4
  22. ^ Шмитт, Т.А. (2011). Текущие методологические аспекты исследовательского и подтверждающего факторного анализа. Журнал психообразовательной оценки, 29(4), 304-321.
  23. ^ CFA с LISREL В архиве 2009-05-28 на Wayback Machine
  24. ^ Бирн, Б. М. (2006). Моделирование структурным уравнением с помощью EQS: основные концепции, применение и программирование. Нью-Джерси: Лоуренс Эльбаум Ассошиэйтс.
  25. ^ CFA с использованием AMOS
  26. ^ Домашняя страница Mplus
  27. ^ "Проект лавы".
  28. ^ Schermelleh-Engel, K., Moosbrugger, H., & Müller, H. (2003). Оценка соответствия моделей структурных уравнений: тесты значимости и описательные критерии согласия, Методы психологического исследования онлайн, 8(2), 23-74
  29. ^ Джексон, Д. Л., Гилласпи, Дж. А., и Перк-Стефенсон, Р. (2009). Практика отчетности в подтверждающем факторном анализе: обзор и некоторые рекомендации. Психологические методы, 14(1), 6-23.
  30. ^ а б Макдональд, Р. П., & Хо, М. Х. Р. (2002). Принципы и практика составления отчетов по анализу статистических уравнений. Психологические методы, 7(1), 64-82
  31. ^ а б c d Хупер, Д., Кофлан, Дж., И Маллен, М.Р. (2008). Моделирование структурным уравнением: Рекомендации по определению соответствия модели. Журнал методов бизнес-исследований, 6, 53–60
  32. ^ а б Ху, Ли-цзы; Бентлер, Питер М. (1999). «Критерии отсечения для индексов соответствия в анализе ковариационной структуры: обычные критерии по сравнению с новыми альтернативами». Моделирование структурным уравнением: многопрофильный журнал. 6 (1): 1–55. Дои:10.1080/10705519909540118. HDL:2027.42/139911. ISSN  1070-5511.
  33. ^ Браун, Тимоти (2015). Подтверждающий факторный анализ для прикладных исследований. Нью-Йорк Лондон: Гилфорд Пресс. п. 72. ISBN  978-1-4625-1779-4.
  34. ^ Баумгартнер, Х., и Хомбур, К. (1996). Применение моделирования структурных уравнений в маркетинге и исследованиях потребителей: обзор. Международный журнал исследований в области маркетинга, 13, 139-161.
  35. ^ Танака, Дж. С. (1993). Многогранные концепции соответствия в моделях структурных уравнений. В K. A. Bollen & J.S. Лонг (Ред.), Тестирование моделей структурных уравнений (стр. 136-162). Ньюбери-Парк, Калифорния: Сейдж.
  36. ^ а б c Бентлер, П. М. (1990). Сравнительные показатели соответствия в структурных моделях. Психологический бюллетень, 107(2), 238-46.
  37. ^ Бентлер, П. М., и Бонетт, Д. Г. (1980). Тесты значимости и согласия при анализе ковариационных структур. Психологический бюллетень, 88, 588-606.
  38. ^ . Бентлер, П. М. (1990). Сравнительные показатели соответствия в структурных моделях. Психологический бюллетень, 107 (2), 238-46.
  39. ^ Такер Л. Р. и Льюис К. (1973). Коэффициент надежности для анализа факторов максимального правдоподобия. Психометрика, 38, 1-10.
  40. ^ а б Ху Л. и Бентлер П. М. (1999). Критерии отсечения для индексов соответствия в анализе ковариационной структуры: обычные критерии по сравнению с новыми альтернативами. Структурное моделирование уравнение, 6(1), 1-55.
  41. ^ Бабяк, М.А., и Грин, С.Б. (2010). Подтверждающий факторный анализ: введение для исследователей психосоматической медицины. Психосоматическая медицина, 72, 587-597.

дальнейшее чтение

  • Браун, Т.А. (2006). Подтверждающий факторный анализ для прикладных исследований. Нью-Йорк: Гилфорд.
  • ДиСтефано, К., и Хесс, Б. (2005). Использование подтверждающего факторного анализа для проверки конструкции: эмпирический обзор. Журнал психообразовательной оценки, 23, 225-241.
  • Харрингтон, Д. (2009). Подтверждающий факторный анализ. Нью-Йорк: Издательство Оксфордского университета.
  • Маруяма, Г. М. (1998). Основы моделирования структурными уравнениями. Таузенд-Оукс, Калифорния: Сейдж.

внешняя ссылка