Формула предсказания Спирмена – Брауна - Spearman–Brown prediction formula

В Формула предсказания Спирмена – Брауна, также известный как Формула пророчества Спирмена – Брауна, является формулой, связывающей психометрический надежность для длины теста и используется психометристами для прогнозирования надежности теста после изменения длины теста.[1] Метод был опубликован независимо Копейщик (1910) и Коричневый (1910).[2][3]

Расчет

Прогнозируемая надежность, , оценивается как:

где п количество "тестов" вместе (см. ниже) и это надежность текущего «теста». Формула предсказывает надежность нового теста, составленного путем воспроизведения текущего теста. п раз (или, что то же самое, создание теста с п параллельные формы текущего экзамена). Таким образом п = 2 означает удвоение длины экзамена за счет добавления элементов с теми же свойствами, что и в текущем экзамене. Ценности п меньше единицы можно использовать для прогнозирования эффекта сокращения теста.

Прогнозирование продолжительности теста

Формулу также можно изменить, чтобы предсказать количество повторений, необходимых для достижения определенной степени надежности:

Разделенная надежность

До развития тау-эквивалентная надежность, раздельная надежность с использованием формулы Спирмена-Брауна была единственным способом получить надежность между элементами. [4] После разделения всего элемента на произвольные половины корреляцию между разделенными половинами можно преобразовать в надежность, применив формулу Спирмена-Брауна. Это,

,где корреляция Пирсона между половинками. Хотя формула Спирмена-Брауна редко используется в качестве коэффициента надежности половинной доли после разработки тау-эквивалентная надежность, этот метод по-прежнему полезен для весов с двумя пунктами. [5]

Его связь с другими коэффициентами надежности с разделением половин

Параллельная надежность с разделением и половиной

Чо (2016)[6] предлагает использовать систематизированную номенклатуру и формульные выражения, критикуя, что коэффициенты надежности были представлены неорганизованным и непоследовательным образом с исторически неточными и неинформативными названиями. Предположение формулы Спирмена-Брауна состоит в том, что разделенные половины параллельны, а это означает, что дисперсии разделенных половин равны. Систематическое название, предложенное для формулы Спирмена-Брауна, - параллельная надежность с разделением половин. Кроме того, была предложена следующая систематическая формула.

Надежность, эквивалентная половине тау-эквивалента

Разделить половину тау-эквивалентная надежность - коэффициент надежности, который можно использовать, когда дисперсии разделенных половин не равны. Фланаган-Рулон [7] (, ), Гутман [8] () предложил следующие формулы-выражения:, , и.

Где , , , и - это дисперсия первой разделенной половины, второй половины, суммы двух разделенных половин и разницы двух разделенных половин, соответственно.

Все эти формулы алгебраически эквивалентны. Систематическая формула [9] составляет.

.

Разделенная половина аналогичной надежности

Надежность, эквивалентная разделению половин и тау-эквиваленту, предполагает, что разделенные половины имеют одинаковую длину. Разделить половину сходная надежность смягчает это предположение. Однако, поскольку их больше параметры которые необходимо оценить, чем данная информация, необходимо другое предположение. Раджу (1970)[10] исследовали коэффициент одинаковой надежности разделенных половин, когда была известна относительная длина каждой разделенной половины. Ангофф (1953)[11] и Фельдт (1975)[12] опубликовал конгенерическую надежность разделенных половин, предполагая, что длина каждой разделенной половины пропорциональна сумме дисперсий и ковариаций[13].

История

Название Спирмен-Браун, кажется, подразумевает партнерство, но два автора соревновались друг с другом. Эта формула восходит к двум статьям, опубликованным одновременно Брауном (1910) и Спирменом (1910) в Британский журнал психологии. Чарльз Спирман имел враждебные отношения с Карл Пирсон которые работали вместе в Королевский колледж Лондона, и они обменивались бумагами, критиковавшими и высмеивающими друг друга. [14] Уильям Браун получил докторскую степень. под руководством Пирсона. Важная часть докторской диссертации Брауна [15]был посвящен критике работы Спирмена[16]. Спирмен появляется первым в этой формуле перед Брауном, потому что он более престижный ученый, чем Браун. [17] Например, Спирмен создал первую теорию надежности.[18] и называется «отцом классической теории надежности».[19] Это пример Мэтью Эффект или Закон Стиглера эпонимии.

Эту формулу следует называть формулой Брауна-Спирмена по следующим причинам: [20] Во-первых, формула, которую мы используем сегодня, - это не версия Спирмена (1910), а версия Брауна (1910). Браун (1910) явно представил эту формулу как коэффициент надежности, разделенный на половину, но Спирмен (1910) не сделал этого. Во-вторых, формальный вывод Брауна (1910) более лаконичен и элегантен, чем у Спирмена (1910). [21] В-третьих, вполне вероятно, что Браун (1910) был написан до Спирмена (1910). Браун (1910) основан на его докторской диссертация, который уже был доступен на момент публикации. Спирмен (1910) критиковал Брауна (1910), но Браун (1910) критиковал только Спирмена (1904). В-четвертых, это Стиль APA перечислить авторов в алфавитном порядке.

Использование и связанные темы

Эта формула обычно используется психометристами для прогнозирования надежности теста после изменения длины теста. Эта взаимосвязь особенно важна для методов оценки надежности с разделением половин и связанных с ними методов (где этот метод иногда называют формулой «Step Up»).[22]

Формула также помогает понять нелинейную взаимосвязь между надежностью теста и длиной теста. Длина теста должна увеличиваться на все большие значения по мере приближения желаемой надежности к 1,0.

Если более длинный / более короткий тест не параллелен текущему, то прогноз не будет строго точным. Например, если высоконадежный тест был продлен за счет добавления множества плохих элементов, то достигнутая надежность, вероятно, будет намного ниже, чем предсказывается по этой формуле.

Для надежности теста из двух пунктов формула более подходит, чем Альфа Кронбаха (используемая таким образом формула Спирмена-Брауна также называется «стандартизированной альфа Кронбаха», так как она аналогична альфе Кронбаха, вычисляемой с использованием средней взаимной корреляции элементов и дисперсии единиц-элементов, а не средней ковариации элементов и средней дисперсии элементов ).[23]

Теория отклика предмета информация о предмете предоставляет гораздо более точные средства прогнозирования изменений качества измерения путем добавления или удаления отдельных элементов.[нужна цитата ]

Цитаты

  1. ^ Allen, M .; Йен В. (1979). Введение в теорию измерений. Монтерей, Калифорния: Брукс / Коул. ISBN  0-8185-0283-5.
  2. ^ Стэнли, Дж. (1971). Надежность. В Р. Л. Торндайке (ред.), Образовательные измерения. Второе издание. Вашингтон, округ Колумбия: Американский совет по образованию
  3. ^ Вайнер, Х., & Тиссен Д. (2001). Правдивая теория оценки: традиционный метод. В Х. Вайнер и Д. Тиссен (ред.), Оценка теста. Махва, Нью-Джерси: Лоуренс Эрлбаум
  4. ^ Келли, Т. Л. (1924). Примечание о надежности теста: ответ на критику доктора Крам. Журнал педагогической психологии, 15, 193–204. DOI: 10,1037 / ч0072471.
    Кудер, Г. Ф., и Ричардсон, М. У. (1937). Теория оценки надежности тестов. Психометрика, 2, 151-160. DOI: 10.1007 / BF02288391.
  5. ^ Eisinga, R .; Te Grotenhuis, M .; Пельцер, Б. (2013). «Надежность шкалы из двух пунктов: Пирсона, Кронбаха или Спирмена-Брауна?». Международный журнал общественного здравоохранения. 58 (4): 637-642. DOI: 10.1007 / s00038-012-0416-3
  6. ^ Чо, Э. (2016). Делаем надежность надежной: систематический подход к коэффициентам надежности. Организационные методы исследования, 19, 651-682. DOI: 10,1177 / 1094428116656239.
  7. ^ Фланаган, Дж. К. (1937). Предлагаемая процедура повышения эффективности объективных тестов. Журнал педагогической психологии, 28, 17-21. DOI: 10,1037 / h0057430. Рулон, П. Дж. (1939). Упрощенная процедура определения надежности теста по половинкам. Harvard Educational Review, 9, 99-103.
  8. ^ Гуттман, Л. (1945). Основа для анализа надежности ретестов. Психометрика, 10, 255-282. DOI: 10.1007 / BF02288892.
  9. ^ Чо, Э. (2016). Делаем надежность надежной: систематический подход к коэффициентам надежности. Организационные методы исследования, 19, 651-682. DOI: 10,1177 / 1094428116656239.
  10. ^ Раджу, Н. С. (1970). Новая формула для оценки общей надежности теста по частям неравной длины. Материалы 78-го ежегодного съезда АПА, 5, 143-144.
  11. ^ Ангофф, В. Х. (1953). Надежность теста и эффективная длина теста. Психометрика, 18 (1), 1-14.
  12. ^ Фельдт, Л. С. (1975). Оценка надежности теста разделена на две неравные по длине части. Психометрика, 40 (4), 557-561.
  13. ^ Чо, Э. (2016). Делаем надежность надежной: систематический подход к коэффициентам надежности. Организационные методы исследования, 19, 651-682. DOI: 10,1177 / 1094428116656239.
  14. ^ Коулз, М. (2005) Статистика в психологии: историческая перспектива. Нью-Йорк: Психология Пресс.
  15. ^ Позднее опубликован в виде книги У. Брауна (1911). Основы ментального измерения. Лондон: Издательство Кембриджского университета.
  16. ^ Спирмен, К. (1904). Доказательство и измерение связи между двумя вещами. Американский журнал психологии, 15, 72-101.
  17. ^ Чо, Э. и Чун, С. (2018). Ремонт сломанных часов: исторический обзор коэффициентов надежности создателей, включая альфа Кронбаха. Обзорное исследование, 19 (2), 23-54.
  18. ^ Спирмен, К. (1904). Доказательство и измерение связи между двумя вещами. Американский журнал психологии, 15, 72-101.
  19. ^ Кронбах, Л. Дж., Раджаратнам, Н., и Глезер, Г. К. (1963). Теория обобщаемости: либерализация теории надежности. Британский журнал статистической психологии, 16, 137–163. DOI: 10.1111 / j.2044-8317.1963.tb00206.x.
  20. ^ Чо, Э. и Чун, С. (2018). Ремонт сломанных часов: исторический обзор коэффициентов надежности создателей, включая альфа Кронбаха. Обзорное исследование, 19 (2), 23-54.
  21. ^ Трауб, Р. Э. (1997). Классическая теория тестирования в исторической перспективе. Образовательные измерения: проблемы и практика, 16, 8-14. DOI: 10.1111 / j.1745-3992.1997.tb00603.x.
  22. ^ Стэнли, Дж. (1971). Надежность. В Р. Л. Торндайке (ред.), Образовательные измерения. Второе издание. Вашингтон, округ Колумбия: Американский совет по образованию
  23. ^ Eisinga, R .; Te Grotenhuis, M .; Пельцер, Б. (2013). «Надежность шкалы из двух пунктов: Пирсона, Кронбаха или Спирмена-Брауна?». Международный журнал общественного здравоохранения. 58 (4): 637–642. Дои:10.1007 / s00038-012-0416-3. HDL:2066/116735. PMID  23089674.

Рекомендации

  • Спирмен, Чарльз, К. (1910). Корреляция рассчитана на основе ошибочных данных. Британский журнал психологии, 3, 271–295.
  • Браун, W. (1910). Некоторые экспериментальные результаты в соотношении умственных способностей. Британский журнал психологии, 3, 296–322.