Альфа Кронбаха - Википедия - Cronbachs alpha

Тау-эквивалент надежности ()[1] оценка надежности за один прием (т. е. надежность людей по сравнению с фиксированными случаями хранения[2]) коэффициент, обычно называемый Альфа Кронбаха или же коэффициент альфа. является наиболее известным и часто используемым среди коэффициентов надежности, но недавние исследования рекомендуют не использовать его безоговорочно.[3][4][5][6][7][8] В качестве альтернативы часто рекомендуются коэффициенты надежности, основанные на моделировании структурным уравнением (SEM).

Формула и расчет

Систематическая и традиционная формула

Позволять обозначают наблюдаемую оценку элемента и обозначают сумму всех пунктов в тесте, состоящем из Предметы. Позволять обозначают ковариацию между и , обозначают дисперсию , и обозначают дисперсию . состоит из дисперсий по элементам и ковариаций по элементам. То есть, . Позволять обозначают среднее значение ковариаций между элементами. То есть, .

"систематический"[1] формула
.


Наиболее часто используемый, но более сложный для понимания вариант формулы -
.

Пример расчета

Применительно к соответствующим данным

применяется к следующим данным, которые удовлетворяют условию тау-эквивалентности.

Наблюдаемая ковариационная матрица

, ,

,

и .

Применительно к несоответствующим данным

применяется к следующим данным, которые не удовлетворяют условию тау-эквивалентности.

Наблюдаемая ковариационная матрица

, ,

,

и .

Сравните это значение со значением применения сходная надежность к тем же данным.

Предпосылки для использования надежности тау-эквивалента

Чтобы использовать в качестве коэффициента надежности данные должны удовлетворять следующим условиям.

1) Одномерность

2) (Существенная) тау-эквивалентность

3) Независимость между ошибками

Условия параллельности, тау-эквивалентности и родственности

Параллельное состояние

На уровне генеральной совокупности параллельные данные имеют равные межэлементные ковариации (т. Е. Недиагональные элементы ковариационной матрицы) и равные дисперсии (т. Е. Диагональные элементы ковариационной матрицы). Например, следующие данные удовлетворяют условию параллельности. В параллельных данных, даже если корреляционная матрица используется вместо ковариационной матрицы, потери информации не происходит. Все параллельные данные также эквивалентны тау, но обратное неверно. Таким образом, из трех условий наиболее трудно выполнить параллельное.

Наблюдаемая ковариационная матрица

Тау-эквивалентное условие

Модель измерения, эквивалентная тау, является частным случаем модели аналогичного измерения, при этом предполагается, что все факторные нагрузки одинаковы, т.е.

На уровне популяции тау-эквивалентные данные имеют равные ковариации, но их дисперсии могут иметь разные значения. Например, следующие данные удовлетворяют условию тау-эквивалентности. Все элементы в данных, эквивалентных тау, имеют равную дискриминацию или важность. Все данные, эквивалентные тау, также совпадают, но обратное неверно.

Наблюдаемая ковариационная матрица

Врожденное состояние

Конгенерическая модель измерения

На уровне популяции сходные данные не обязательно должны иметь одинаковые дисперсии или ковариации при условии, что они одномерны. Например, следующие данные соответствуют условию совпадения. Все элементы в сопоставимых данных могут иметь различную дискриминацию или различную важность.

Наблюдаемая ковариационная матрица

Связь с другими коэффициентами надежности

Классификация коэффициентов надежности при однократном администрировании

Условные имена

Есть множество коэффициентов надежности. Среди них условные названия связанных и часто используемых коэффициентов надежности резюмируются следующим образом:[1]

Условные названия коэффициентов надежности
Разделить половинуОдномерныйМногомерный
ПараллельныйФормула Спирмена-БраунаСтандартизированный (Без условного названия)
Тау-эквивалентФормула Фланагана
Формула Рулона
Формула Фланагана-Рулона
Гуттмана
Кронбаха
коэффициент
Гуттмана
КР-20
Хойт надежность
Стратифицированный
РодственныйКоэффициент Ангоффа-Фельдта
Коэффициент Раджу (1970)
совокупная надежность
построить надежность
сходная надежность
коэффициент
одномерный
Коэффициент Раджу (1977)
коэффициент
общий
Макдоналдс
многомерный

Комбинирование названий строк и столбцов дает предпосылки для соответствующего коэффициента надежности. Например, Кронбах и Гутмана - коэффициенты надежности, полученные при условии одномерной и тау-эквивалентности.

Систематические названия

Обычные названия неупорядочены и бессистемны. Обычные названия не дают информации о природе каждого коэффициента или вводят в заблуждение (например, совокупную надежность). Обычные имена несовместимы. Некоторые из них являются формулами, а другие - коэффициентами. Некоторые из них названы в честь первоначального разработчика, некоторые названы в честь кого-то, кто не является первоначальным разработчиком, а другие не содержат имени какого-либо человека. В то время как одна формула обозначается несколькими именами, несколько формул обозначаются одной нотацией (например, альфа и омега). Предлагаемые систематические названия и их обозначения для этих коэффициентов надежности следующие: [1]

Систематические названия коэффициентов надежности
Разделить половинуОдномерныйМногомерный
Параллельныйраздельно-полупараллельная надежность ()параллельная надежность ()многомерная параллельная надежность ()
Тау-эквивалентнадежность, эквивалентная половине тау-эквивалента ()тау-эквивалентная надежность ()многомерная тау-эквивалентная надежность ()
Родственныйразделенная половина одинаковой надежности ()сходная надежность ()Бифакторная модель
Бифакторная надежность ()
Факторная модель второго порядка
Фактор надежности второго порядка ()
Коррелированная факторная модель
Коррелированная факторная надежность ()

Связь с параллельной надежностью

часто называют коэффициентом альфа и часто называют стандартизированной альфа-версией. из-за стандартного модификатора часто ошибочно принимают за более стандартную версию, чем .Нет исторической основы для ссылки на как стандартизированная альфа. Кронбах (1951)[9] не назвал этот коэффициент альфой и не рекомендовал его использовать. редко использовался до 1970-х годов. Когда SPSS начал предоставлять под названием стандартизированной альфы этот коэффициент стали иногда использовать.[10] Использование не рекомендуется, потому что условие параллельности трудно выполнить в реальных данных.

Связь с надежностью, эквивалентной половинному тау-эквиваленту

равно среднему значению значения, полученные для всех возможных разделенных половин. Это соотношение, доказанное Кронбахом (1951),[9] часто используется для объяснения интуитивного значения . Однако в этой интерпретации не учитывается тот факт, что недооценивает надежность, когда применяется к данным, не эквивалентным тау. На уровне населения максимум из всех возможных значения ближе к надежности, чем среднее из всех возможных значения.[6] Этот математический факт был известен еще до публикации Кронбаха (1951).[11] Сравнительное исследование[12] сообщает, что максимум - самый точный коэффициент надежности.

Веселье (1979)[13] относится к минимуму всех возможных значения как коэффициент , и рекомендует предоставляет дополнительную информацию, которая не.[5]

Связь с одинаковой надежностью

Если выполнены предположения одномерности и тау-эквивалентности, равно .

Если одномерность удовлетворена, но тау-эквивалентность не выполняется, меньше чем .[6]

является наиболее часто используемым коэффициентом надежности после . Пользователи, как правило, представляют и то, и другое, а не заменяют с .[1]

Исследование, посвященное исследованиям, в которых представлены оба коэффициента, сообщает, что на 0,02 меньше, чем в среднем.[14]

Связь с многомерными коэффициентами надежности и

Если применяется к многомерным данным, его значение меньше, чем коэффициенты многомерной надежности, и больше, чем .[1]

Связь с внутриклассовой корреляцией

называется версией с повышенной согласованностью коэффициент внутриклассовой корреляции, который обычно используется в наблюдательных исследованиях. Но это лишь условно. С точки зрения компонентов дисперсии, это условие для выборки элемента: если и только если значение компонента дисперсии элемента (оценщика, в случае рейтинга) равно нулю. Если этот компонент дисперсии отрицательный, недооценит усиленный коэффициент внутриклассовой корреляции; если этот компонент дисперсии положительный, будет переоценивать это усиление коэффициент внутриклассовой корреляции.

История[10]

До 1937 г.

[15][16] был единственным известным коэффициентом надежности. Проблема заключалась в том, что оценки надежности зависели от того, как элементы были разделены пополам (например, нечетные / четные или передние / задние). Против этой ненадежности была высказана критика, но более 20 лет не было найдено принципиального решения.[17]

Кудер и Ричардсон (1937)

Кудер и Ричардсон (1937)[18] разработали несколько коэффициентов надежности, которые могли решить проблему . Конкретных названий коэффициентам надежности они не дали. Уравнение 20 в их статье . Эту формулу часто называют формулой Кудера-Ричардсона 20 или KR-20. Они имели дело со случаями, когда наблюдаемые оценки были дихотомическими (например, правильные или неправильные), поэтому выражение KR-20 немного отличается от традиционной формулы . Обзор этой статьи показывает, что они не представили общую формулу, потому что в этом не было необходимости, а не потому, что они не могли это сделать. Позволять обозначить соотношение правильных ответов по заданию , и обозначают неправильное соотношение ответов на вопрос (). Формула КР-20 следующая.

С , КР-20 и имеют то же значение.

Между 1937 и 1951 гг.

В нескольких исследованиях опубликована общая формула KR-20.

Кудер и Ричардсон (1937) сделали ненужные предположения для вывода . Несколько исследований показали иначе, чем у Кудера и Ричардсона (1937).

Хойт (1941)[19] полученный с использованием ANOVA (дисперсионный анализ). Сирил Хойт можно считать первым разработчиком общей формулы KR-20, но он не представил явно формулу .

Первое выражение современной формулы появляется у Джексона и Фергюсона (1941).[20] Представленная ими версия такова. Эдгертон и Томпсон (1942)[21] использовал ту же версию.

Гуттман (1945)[11] выведены шесть формул надежности, каждая из которых обозначена . Луи Гутман доказал, что все эти формулы всегда меньше или равны надежности, и на основе этих характеристик он назвал эти формулы «нижними границами надежности». Гуттмана является , и является . Он доказал, что всегда больше или равно (т.е. точнее). В то время все расчеты производились бумагой и карандашом, а поскольку формула было проще вычислить, он упомянул, что был полезен при определенных условиях.

Гулликсен (1950)[22] полученный с меньшим количеством предположений, чем в предыдущих исследованиях. Предположение, которое он использовал, является существенной тау-эквивалентностью в современных терминах.

Признание оригинальной формулы и общей формулы KR-20 того времени

Обе формулы были признаны идентичными, и выражение общей формулы KR-20 не использовалось. Hoyt[19] пояснил, что его метод «дает точно такой же результат», как и КР-20 (с.156). Джексон и Фергюсон[20] заявил, что две формулы «идентичны» (стр.74). Гутман[11] сказал "алгебраически идентичен" КР-20 (с.275). Гулликсен[22] также признал, что эти две формулы «идентичны» (с.224).

Даже исследования, критикующие KR-20, не указали, что исходная формула KR-20 может быть применена только к дихотомическим данным.[23]

Критика недооценки КР-20

Разработчики[18] этой формулы сообщил, что постоянно недооценивает надежность. Hoyt[24] утверждал, что одна эта характеристика делает более рекомендуемый, чем традиционный метод разделения половин, при котором неизвестно, стоит ли недооценивать или переоценивать надежность.

Кронбах (1943)[23] критически относился к недооценке . Он был обеспокоен тем, что неизвестно, сколько заниженная надежность. Он критиковал, что недооценка, вероятно, была чрезмерно серьезной, так что может иногда приводить к отрицательным значениям. из-за этих проблем, он утверждал, что не может быть рекомендован в качестве альтернативы технике разделения половин.

Кронбах (1951)

Как и в предыдущих исследованиях,[19][11][20][22] Кронбах (1951)[9] изобрел другой метод получения . Его интерпретация была интуитивно более привлекательной, чем у предыдущих исследований. То есть он доказал, что равно среднему значению значения, полученные для всех возможных разделенных половин. Он раскритиковал название KR-20 и предложил новое название, коэффициент альфа. Его подход имел огромный успех. Однако он не только опустил некоторые ключевые факты, но и дал неверное объяснение.

Во-первых, он позиционировал коэффициент альфа как общую формулу KR-20, но опустил объяснение, что существующие исследования опубликовали точно идентичную формулу. Те, кто читал только Кронбаха (1951) без каких-либо дополнительных знаний, могли неправильно понять, что он был первым, кто разработал общую формулу KR-20.

Во-вторых, он не объяснил, при каких условиях равняется надежности. Не эксперты могут неправильно понять, что был общим коэффициентом надежности, который можно было использовать для всех данных независимо от предпосылок.

В-третьих, он не объяснил, почему изменил свое отношение к . В частности, он не дал четкого ответа на проблему недооценки , который он сам[23] критиковал.

В-четвертых, он утверждал, что высокая стоимость указал на однородность данных.

После 1951 г.

Новик и Льюис (1967)[25] доказали необходимое и достаточное условие для быть равным надежности, и назвал это условием по существу тау-эквивалентности.

Кронбах (1978)[2] упомянул, что причина того, что Кронбах (1951) получил много цитат, заключалась в том, «главным образом потому, что [он] поставил название бренда на коэффициент общего места» (стр. 263).[1] Он пояснил, что изначально планировал назвать другие типы коэффициентов надежности (например, надежность между экспертами или надежность повторных тестов) последовательными греческими буквами (например, , , ), но позже передумал.

Кронбах и Шавельсон (2004)[26] призвал читателей использовать теорию обобщаемости, а не . Он выступал против использования имени альфа Кронбаха. Он прямо отрицал существование существующих исследований, в которых была опубликована общая формула KR-20 до Кронбаха (1951).

Распространенные заблуждения о надежности тау-эквивалента[6]

Значение тау-эквивалентной надежности колеблется от нуля до единицы.

По определению надежность не может быть меньше нуля и не может быть больше единицы. Многие учебники ошибочно приравнивают с надежностью и дать неточное объяснение его диапазона. может быть меньше надежности при применении к данным, не эквивалентным тау. Предположим, что скопировал значение как есть, и скопировано путем умножения значения на -1. Ковариационная матрица между элементами выглядит следующим образом: .

Наблюдаемая ковариационная матрица

Отрицательный может произойти по таким причинам, как негативная дискриминация или ошибки при обработке элементов с обратной оценкой.

В отличие от , Коэффициенты надежности на основе SEM (например, ) всегда больше или равняется нулю.

На эту аномалию впервые указал Кронбах (1943).[23] критиковать , но Кронбах (1951)[9] не комментировал эту проблему в своей статье, в которой обсуждались все мыслимые вопросы, связанные с и он сам[26] описывается как «энциклопедический» (с.396).

Если нет ошибки измерения, значение тау-эквивалентной надежности равно единице.

Эта аномалия также возникает из-за того, что недооценивает надежность. Предположим, что скопировал значение как есть, и скопировано путем умножения значения на два. Ковариационная матрица между элементами выглядит следующим образом: .

Наблюдаемая ковариационная матрица

Для приведенных выше данных оба и имеют значение один.

Приведенный выше пример представлен Чо и Ким (2015).[6]

Высокое значение надежности тау-эквивалента указывает на однородность между элементами.

Многие учебники ссылаются на как индикатор однородности между элементами. Это заблуждение проистекает из неточного объяснения Кронбаха (1951).[9] так высоко значения показывают однородность между элементами. Однородность - это термин, который редко используется в современной литературе, и соответствующие исследования интерпретируют этот термин как относящийся к одномерности. Несколько исследований предоставили доказательства или контрпримеры того, что значения не указывают на одномерность.[27][6][28][29][30][31] См. Контрпримеры ниже.

Одномерные данные

в одномерных данных выше.

Многомерные данные

в многомерных данных выше.

Многомерные данные с чрезвычайно высокой надежностью

Приведенные выше данные имеют , но многомерны.

Одномерные данные с недопустимо низкой надежностью

Приведенные выше данные имеют , но одномерны.

Одномерность - предпосылка для . Перед вычислением следует проверить одномерность , а не вычислять проверить одномерность.[1]

Высокое значение надежности тау-эквивалента указывает на внутреннюю согласованность.

Термин внутренняя согласованность обычно используется в литературе по надежности, но его значение четко не определено. Этот термин иногда используется для обозначения определенного вида надежности (например, надежности внутренней согласованности), но неясно, какие именно коэффициенты надежности включены здесь в дополнение к . Кронбах (1951)[9] использовал этот термин в нескольких смыслах без четкого определения. Чо и Ким (2015)[6] показало, что не является индикатором любого из них.

Удаление элементов с помощью "альфа-версии, если элемент удален" всегда повышает надежность

Удаление элемента с использованием «альфа, если элемент удален» может привести к «альфа-инфляции», когда сообщается, что надежность на уровне выборки выше, чем надежность на уровне генеральной совокупности.[32] Это также может снизить надежность на уровне популяции.[33] Исключение менее надежных элементов должно основываться не только на статистической, но также на теоретической и логической основе. Также рекомендуется разделить всю выборку на две части и пройти перекрестную проверку.[32]

Идеальный уровень надежности и как повысить надежность

Рекомендации Nunnally по уровню надежности

Наиболее часто цитируемым источником информации о том, какими должны быть коэффициенты надежности, является книга Наннелли.[34][35][36] Однако его рекомендации цитируются вопреки его намерениям. Он имел в виду применение разных критериев в зависимости от цели или стадии исследования. Однако, независимо от характера исследования, такого как поисковые исследования, прикладные исследования и исследования масштабных разработок, повсеместно используется критерий 0,7.[37] .7 - это критерий, который он рекомендовал для ранних стадий исследования, чего не является большинство исследований, опубликованных в журнале. Критерий 0,8, относящийся к прикладным исследованиям Наннелли, больше подходит для большинства эмпирических исследований, чем 0,7.[37]

Рекомендации Nunnally по уровню надежности
1-е издание[34]2-й[35] И третий[36] версия
Ранняя стадия исследования.5 или .6.7
Прикладное исследование.8.8
При принятии важных решений0,95 (минимум 0,9)0,95 (минимум 0,9)

Его уровень рекомендаций не подразумевал точку отсечения. Если критерий означает точку отсечения, важно, соблюдается она или нет, но неважно, насколько она выше или ниже. Он не имел в виду, что это должно быть строго .8, когда речь идет о критериях .8. Если надежность имеет значение около 0,8 (например, 78), можно считать, что его рекомендация была выполнена.[38]

Его идея заключалась в том, что повышение надежности требует затрат, поэтому нет необходимости пытаться получить максимальную надежность в каждой ситуации.

Стоимость получения высокого уровня надежности

Во многих учебниках объясняется, что чем выше значение надежности, тем лучше. Потенциальные побочные эффекты высокой надежности редко обсуждаются. Однако принцип жертвовать чем-то, чтобы получить что-то, применим и к надежности.

Компромисс между надежностью и действительностью[6]

Измерения с абсолютной надежностью недействительны. Например, человек, который сдает тест с точностью до единицы, получит высшую или нулевую оценку, потому что испытуемый, который даст правильный или неправильный ответ по одному пункту, даст правильный или неверный ответ по всем остальным пунктам. . Явление, в котором достоверность приносится в жертву повышению надежности, называется парадоксом затухания.[39][40]

Высокое значение надежности может вступать в противоречие с достоверностью контента. Для обеспечения высокой достоверности содержания каждый элемент должен быть сконструирован таким образом, чтобы иметь возможность всесторонне представлять содержание, которое необходимо измерить. Однако стратегия многократного измерения одного и того же вопроса разными способами часто используется только с целью повышения надежности.[41][42]

Компромисс между надежностью и эффективностью

Когда другие условия равны, надежность возрастает с увеличением количества элементов. Однако увеличение количества элементов снижает эффективность измерений.

Способы повышения надежности

Несмотря на затраты, связанные с повышением надежности, рассмотренные выше, может потребоваться высокий уровень надежности. Следующие методы могут быть рассмотрены для повышения надежности.

Перед сбором данных

Устраните двусмысленность объекта измерения.

Не измеряйте то, чего не знают респонденты.

Увеличивайте количество предметов. Однако следует проявлять осторожность, чтобы чрезмерно не снижать эффективность измерения.

Используйте весы, которые известны своей высокой надежностью.[43]

Проведите предварительную проверку. Заранее откройте для себя проблему надежности.

Исключить или изменить элементы, которые по содержанию или форме отличаются от других элементов (например, элементы с обратной оценкой).

После сбора данных

Удалите проблемные элементы, используя «альфа, если элемент удален». Однако это удаление должно сопровождаться теоретическим обоснованием.

Используйте более точный коэффициент надежности, чем . Например, 0,02 больше, чем в среднем.[14]

Какой коэффициент надежности использовать

Должны ли мы продолжать использовать надежность, эквивалентную тау?

используется в подавляющем большинстве случаев. По оценкам одного из исследований, примерно 97% исследований используют как коэффициент надежности.[1]

Однако исследования моделирования, сравнивающие точность нескольких коэффициентов надежности, привели к общему результату: - неточный коэффициент надежности.[44][12][5][45][46]

Методологические исследования критически относятся к использованию . Выводы существующих исследований упрощаются и классифицируются следующим образом.

(1) Условное использование: использование только при соблюдении определенных условий.[1][6][8]

(2) Противодействие использованию: является неполноценным и не должен использоваться. [47][4][48][5][3][49]

Альтернативы надежности тау-эквивалента

Существующие исследования практически единодушны в том, что они выступают против широко распространенной практики использования безусловно по всем данным. Однако высказываются разные мнения о том, какой коэффициент надежности следует использовать вместо .

Различные коэффициенты надежности занимают первое место в каждом исследовании моделирования[44][12][5][45][46] сравнение точности нескольких коэффициентов надежности.[6]

По мнению большинства, использовать коэффициенты надежности на основе SEM в качестве альтернативы .[1][6][47][4][48][8][5][49]

Однако нет единого мнения о том, какой из нескольких коэффициентов надежности на основе SEM (например, одномерные или многомерные модели) лучше всего использовать.

Некоторые говорят [5] в качестве альтернативы, но показывает информацию, которая полностью отличается от достоверности. - это тип коэффициента, сравнимый с коэффициентом Ревелла .[13][5] Они не заменяют, а дополняют надежность.[1]

Среди коэффициентов надежности, основанных на SEM, многомерные коэффициенты надежности используются редко, и наиболее часто используется .[1]

Программное обеспечение для расчета коэффициентов надежности на основе SEM

Статистическое программное обеспечение общего назначения, такое как SPSS и SAS, включает функцию расчета . Пользователи, которые не знают формулы нет проблем с получением оценок всего несколькими щелчками мыши.

Программное обеспечение SEM, такое как AMOS, LISREL и MPLUS, не имеет функции для расчета коэффициентов надежности на основе SEM. Пользователи должны вычислить результат, введя его в формулу. Чтобы избежать этого неудобства и возможной ошибки, даже исследования, сообщающие об использовании SEM, полагаются на вместо коэффициентов надежности на основе SEM.[1] Есть несколько альтернатив для автоматического расчета коэффициентов надежности на основе SEM.

1) R (бесплатно): Психологический пакет [50] рассчитывает различные коэффициенты надежности.

2) EQS (платно):[51] Это программное обеспечение SEM имеет функцию для расчета коэффициентов надежности.

3) RelCalc (бесплатно):[1] Доступно в Microsoft Excel. могут быть получены без использования программного обеспечения SEM. Различные многомерные коэффициенты надежности SEM и различные типы может быть рассчитан на основе результатов программного обеспечения SEM.

Вывод формулы[1]

Предположение 1. Наблюдаемая оценка элемента состоит из истинной оценки элемента и ошибки элемента, которая не зависит от истинной оценки.

Лемма.

Предположение 2. Ошибки независимы друг от друга.

Допущение 3. (Предположение о том, что он является по существу тау-эквивалентом) Истинная оценка элемента состоит из истинной оценки, общей для всех элементов, и постоянной оценки элемента.

Позволять обозначают сумму истинных баллов по пункту.

Дисперсия называется истинной дисперсией оценки.

Определение. Надежность - это отношение истинной дисперсии оценок к наблюдаемой дисперсии оценок.

Следующее соотношение устанавливается на основании сделанных выше предположений.

Следовательно, ковариационная матрица между элементами выглядит следующим образом.

Наблюдаемая ковариационная матрица

Ты это видишь равно среднему значению ковариаций между элементами. То есть,

Позволять обозначают надежность при выполнении вышеуказанных предположений. является:


Рекомендации

  1. ^ а б c d е ж грамм час я j k л м п о п Чо, Э. (2016). Обеспечение надежности надежности: систематический подход к коэффициентам надежности. Методы организационных исследований, 19 (4), 651–682.https://doi.org/10.1177/1094428116656239
  2. ^ а б Кронбах, Л. Дж. (1978). Цитирование классиков. Текущее содержание, 13, 263.
  3. ^ а б Сийцма, К. (2009). Об использовании, неправильном использовании и очень ограниченной полезности альфа Кронбаха. Психометрика, 74 (1), 107–120. https://doi.org/10.1007/s11336-008-9101-0
  4. ^ а б c Грин, С. Б., и Янг, Ю. (2009). Комментарий к коэффициенту альфа: поучительная история. Психометрика, 74 (1), 121–135. https://doi.org/10.1007/s11336-008-9098-4
  5. ^ а б c d е ж грамм час Ревелль, В. и Зинбарг, Р. Э. (2009).Коэффициенты альфа, бета, омега и glb: Комментарии на Sijtsma. Психометрика, 74 (1), 145–154. https://doi.org/10.1007/s11336-008-9102-z
  6. ^ а б c d е ж грамм час я j k Чо Э. и Ким С. (2015). Коэффициент альфа Кронбаха: хорошо известен, но плохо изучен. Организационные методы исследования, 18 (2), 207–230.https://doi.org/10.1177/1094428114555994
  7. ^ Макниш, Д. (2017). Спасибо коэффициенту альфа, возьмем его отсюда. Психологические методы, 23 (3), 412–433. https://doi.org/10.1037/met0000144
  8. ^ а б c Райков, Т., и Маркулидес, Г.А. (2017). Спасибо коэффициенту альфа, вы нам еще нужны! Образовательные и психологические измерения, 79 (1), 200–210. https://doi.org/10.1177/0013164417725127
  9. ^ а б c d е ж Кронбах, LJ (1951). Коэффициент альфа и внутренняя структура тестов. Психометрика, 16 (3), 297–334. https://doi.org/10.1007/BF02310555
  10. ^ а б Чо, Э. и Чун, С. (2018), Ремонт сломанных часов: исторический обзор создателей коэффициентов надежности, включая альфа Кронбаха. Обзорные исследования, 19 (2), 23–54.
  11. ^ а б c d Гуттман, Л. (1945). Основа для анализа надежности ретестов. Психометрика, 10 (4), 255–282. https://doi.org/10.1007/BF02288892
  12. ^ а б c Осберн, Х. Г. (2000). Коэффициент альфа и соответствующие коэффициенты надежности внутренней согласованности. Психологические методы, 5 (3), 343–355. https://doi.org/10.1037/1082-989X.5.3.343
  13. ^ а б Ревель, В. (1979). Иерархический кластерный анализ и внутренняя структура тестов. Многомерное исследование поведения, 14 (1), 57–74. https://doi.org/10.1207/s15327906mbr1401_4
  14. ^ а б Петерсон, Р. А., Ким, Ю. (2013). О связи между коэффициентом альфа и совокупной надежностью. Журнал прикладной психологии, 98 (1), 194–198. https://doi.org/10.1037/a0030767
  15. ^ Браун, W. (1910). Некоторые экспериментальные результаты по корреляции способностей. Британский журнал психологии, 3 (3), 296–322. https://doi.org/10.1111/j.2044-8295.1910.tb00207.x
  16. ^ Спирмен, К. (1910). Корреляция рассчитана на основе ошибочных данных. Британский журнал психологии, 3 (3), 271–295. https://doi.org/10.1111/j.2044-8295.1910.tb00206.x
  17. ^ Келли, Т. Л. (1924). Примечание о надежности теста: ответ на критику доктора Крама. Журнал педагогической психологии, 15 (4), 193–204. https://doi.org/10.1037/h0072471
  18. ^ а б Кудер, Г. Ф., и Ричардсон, М. У. (1937). Теория оценки надежности тестов. Психометрика, 2 (3), 151–160. https://doi.org/10.1007/BF02288391
  19. ^ а б c Хойт, К. (1941). Надежность теста оценивается дисперсионным анализом. Психометрика, 6 (3), 153–160. https://doi.org/10.1007/BF02289270
  20. ^ а б c Джексон, Р. В. Б. и Фергюсон, Г. А. (1941). Исследования на надежность тестов. Бюллетень Департамента исследований в области образования Университета Торонто, 12, 132.
  21. ^ Эджертон, Х.А., и Томсон, К.Ф. (1942). Результаты тестов проверяются с помощью lexis ratio. Психометрика, 7 (4), 281–288. https://doi.org/10.1007/BF02288629
  22. ^ а б c Гулликсен, Х. (1950). Теория ментальных тестов. Джон Вили и сыновья. https://doi.org/10.1037/13240-000
  23. ^ а б c d Кронбах, Л. Дж. (1943). Об оценках надежности теста. Журнал педагогической психологии, 34 (8), 485–494. https://doi.org/10.1037/h0058608
  24. ^ Хойт, К. Дж. (1941). Примечание об упрощенном методе вычисления надежности теста: Образовательные и психологические измерения, 1 (1). https://doi.org/10.1177/001316444100100109
  25. ^ Новик М. Р. и Льюис К. (1967). Коэффициент альфа и надежность сводных измерений. Психометрика, 32 (1), 1–13. https://doi.org/10.1007/BF02289400
  26. ^ а б Кронбах, Л. Дж., И Шавелсон, Р. Дж. (2004). Мои текущие мысли об альфа-коэффициенте и последующих процедурах. Образовательные и психологические измерения, 64 (3), 391–418. https://doi.org/10.1177/0013164404266386
  27. ^ Кортина, Дж. М. (1993). Что такое коэффициент альфа? Изучение теории и приложений. Журнал прикладной психологии, 78 (1), 98–104. https://doi.org/10.1037/0021-9010.78.1.98
  28. ^ Грин, С. Б., Лиссиц, Р. В., и Мулайк, С. А. (1977). Ограничения коэффициента альфа как показателя одномерности теста. Образовательные и психологические измерения, 37 (4), 827–838. https://doi.org/10.1177/001316447703700403
  29. ^ Макдональд, Р. П. (1981). Размерность тестов и заданий. Британский журнал математической и статистической психологии, 34 (1), 100–117. https://doi.org/10.1111/j.2044-8317.1981.tb00621.x
  30. ^ Шмитт, Н. (1996). Использование и злоупотребление коэффициентом альфа. Психологическая оценка, 8 (4), 350–353. https://doi.org/10.1037/1040-3590.8.4.350
  31. ^ Тен Берге, Дж. М. Ф. и Сочан, Г. (2004). Наибольшая нижняя граница надежности теста и гипотезы одномерности. Психометрика, 69 (4), 613–625. https://doi.org/10.1007/BF02289858
  32. ^ а б Копалле, П. К., и Леманн, Д. Р. (1997). Альфа-инфляция? Влияние исключения масштабных элементов на альфу Кронбаха. Организационное поведение и процессы принятия решений людьми, 70 (3), 189–197. https://doi.org/10.1006/obhd.1997.2702
  33. ^ Райков, Т. (2007). Надежность при удалении, а не «альфа при удалении»: оценка надежности шкалы после удаления компонента. Британский журнал математической и статистической психологии, 60 (2), 201–216. https://doi.org/10.1348/000711006X115954
  34. ^ а б Наннэлли, Дж. К. (1967). Психометрическая теория. Нью-Йорк, штат Нью-Йорк: Макгроу-Хилл.
  35. ^ а б Наннэлли, Дж. К. (1978). Психометрическая теория (2-е изд.). Нью-Йорк, штат Нью-Йорк: Макгроу-Хилл.
  36. ^ а б Наннэлли, Дж. К., и Бернштейн, И. Х. (1994). Психометрическая теория (3-е изд.). Нью-Йорк, штат Нью-Йорк: Макгроу-Хилл.
  37. ^ а б Ланс, К. Э., Баттс, М. М., и Майкельс, Л. С. (2006). Что они на самом деле сказали? Организационные методы исследования, 9 (2), 202–220. https://doi.org/10.1177/1094428105284919
  38. ^ Чо, Э. (2020). Комплексный обзор так называемой альфы Кронбаха. Журнал исследований продуктов, 38 (1), 9–20.
  39. ^ Loevinger, J. (1954). Парадокс затухания в теории испытаний. Психологический бюллетень, 51 (5), 493–504. https://doi.org/10.1002/j.2333-8504.1954.tb00485.x
  40. ^ Хамфрис, Л. (1956). Нормальная кривая и парадокс затухания в теории испытаний. Психологический бюллетень, 53 (6), 472–476. https://doi.org/10.1037/h0041091
  41. ^ Бойл, Дж. Дж. (1991). Указывает ли однородность заданий на внутреннюю согласованность или избыточность заданий в психометрических шкалах? Личность и индивидуальные различия, 12 (3), 291–294. https://doi.org/10.1016/0191-8869(91)90115-R
  42. ^ Штрайнер, Д. Л. (2003). Начиная с начала: Введение в коэффициент альфа и внутреннюю согласованность. Журнал оценки личности, 80 (1), 99–103. https://doi.org/10.1207/S15327752JPA8001_18
  43. ^ Ли, Х. (2017). Методология исследования (2-е изд.), Hakhyunsa.
  44. ^ а б Камата, А., Турхан, А., и Дарандари, Э. (2003). Оценка надежности многомерной составной шкалы баллов. Ежегодное собрание Американской ассоциации исследований в области образования, Чикаго, апрель 2003 г., 1–27 апреля.
  45. ^ а б Тан, В., и Цуй, Ю. (2012). Имитационное исследование для сравнения трех нижних оценок надежности. Доклад, представленный 17 апреля 2012 г. в AERA Division D: Методология измерения и исследования, Раздел 1: Образовательные измерения, психометрия и оценка., 1–25.
  46. ^ а б ван дер Арк, Л. А., ван дер Пальм, Д. В., & Сийтсма, К. (2011). Подход латентного класса к оценке надежности результатов теста. Прикладное психологическое измерение, 35 (5), 380–392. https://doi.org/10.1177/0146621610392911
  47. ^ а б Данн, Т. Дж., Багули, Т., и Брунсден, В. (2014). От альфы к омеге: практическое решение распространенной проблемы оценки внутренней согласованности. Британский журнал психологии, 105 (3), 399–412. https://doi.org/10.1111/bjop.12046
  48. ^ а б Петерс, Г. Ю. (2014). Альфа и омега шкалы надежности и достоверности всесторонняя оценка качества шкалы. Европейский психолог здоровья, 1 (2), 56–69.
  49. ^ а б Янг Ю. и Грин С. Б. (2011). Коэффициент альфа: коэффициент надежности для 21 века? Журнал психообразовательной оценки, 29 (4), 377–392. https://doi.org/10.1177/0734282911406668
  50. ^ http://personality-project.org/r/overview.pdf
  51. ^ http://www.mvsoft.com/eqs60.htm

внешняя ссылка

  • Альфа-учебник Кронбаха по SPSS
  • Бесплатный веб-интерфейс и пакет R cocron [1] позволяет статистически сравнивать два или более зависимых или независимых альфа-коэффициента Кронбаха.