Дополнительная валидность - Incremental validity

Дополнительная валидность это тип срок действия который используется, чтобы определить, есть ли новый психометрический оценка увеличит предсказательная способность сверх того, что предусмотрено существующим методом оценки.[1] Другими словами, инкрементная валидность пытается ответить, добавляет ли новый тест много информации, которую можно было бы получить с помощью более простых, уже существующих методов.[2]

Определение и примеры

Когда оценка используется с целью прогнозирования результата (возможно, другого результата теста или какой-либо другой поведенческой меры), новый инструмент должен показать, что он может расширить наши знания или прогнозирование переменной результата сверх того, что уже известно на основе существующие инструменты.[3]

Положительным примером может быть клиницист, который использует технику интервью, а также специальный вопросник, чтобы определить, есть ли у пациента психическое заболевание, и имеет больший успех в определении психических заболеваний, чем клиницист, который использует только метод интервью. Таким образом, конкретный вопросник будет считаться действующим постепенно. Поскольку анкета в сочетании с интервью позволила получить более точные определения и добавить информацию для клинициста, анкета становится действующей постепенно.

Статистические тесты

Дополнительная валидность обычно оценивается с помощью множественная регрессия методы. Сначала к данным подбирается регрессионная модель с другими переменными, а затем к модели добавляется основная переменная. Значительное изменение R-квадрат статистика (с использованием F-тест для определения значимости) интерпретируется как указание на то, что вновь добавленная переменная предлагает значительные дополнительные возможности прогнозирования для зависимой переменной по сравнению с переменными, ранее включенными в регрессионную модель. Напомним, что статистика R-квадрата в множественная регрессия отражает процент дисперсии, учтенной в переменной Y с использованием всех переменных X. Таким образом, изменение R-квадрата будет отражать процент отклонения, объясняемый переменной, добавленной в модель. Изменение R-квадрата более уместно, чем простой просмотр необработанных корреляций, потому что необработанные корреляции не отражают перекрытия вновь введенной меры и существующих мер.[3]

Примером этого метода является прогнозирование среднего балла колледжа (Средний балл ), где средний балл средней школы и результаты вступительных испытаний (например, СИДЕЛ, ДЕЙСТВОВАТЬ ) обычно составляют большую долю дисперсии среднего балла колледжа. Использование вступительных испытаний подтверждается дополнительными доказательствами действительности. Например, SAT до 2000 г. коррелировал 0,34 со средним баллом первокурсника, тогда как средний балл средней школы коррелировал 0,36 со средним баллом первокурсника.[4] Может показаться, что оба показателя являются сильными предикторами среднего балла первокурсника, но на самом деле средний балл средней школы и баллы SAT также сильно коррелированы, поэтому нам нужно проверить, насколько прогностическую силу мы получаем от SAT, когда мы учитываем средний балл средней школы. Возрастающая достоверность указывается изменением R-квадрата, когда в модель включен средний балл средней школы. В этом случае средний балл средней школы составляет 13% дисперсии среднего балла первокурсника, а комбинация среднего балла средней школы плюс SAT составляет 20% дисперсии среднего балла первокурсника. Таким образом, SAT добавляет 7 процентных пунктов к нашей предсказательной способности. Если это значительное и считается важным улучшением, то мы можем сказать, что SAT имеет дополнительную ценность по сравнению с использованием только среднего школьного GPA для прогнозирования GPA новичка. Любой новый критерий приема или тест должны иметь дополнительную прогностическую силу (инкрементную валидность), чтобы быть полезными при прогнозировании среднего балла в колледже, когда средний балл средней школы и результаты тестов уже известны.

Смотрите также

Рекомендации

  1. ^ Сакетт, П. Р. и Ливенс, Ф. 2008. «Подбор персонала». Ежегодный обзор психологии, 59, 419-450
  2. ^ Lillenfield et al. 2005 "Что не так с этой картиной?" www.psychologicalscience.org http://www.psychologicalscience.org/newsresearch/publications/journals/sa1_2.pdf
  3. ^ а б Haynes, S.N .; Ленч, Х. (2003). «Дополнительная валидность новых мер клинической оценки» (PDF). Психологическая оценка. 15 (4): 456–466. Дои:10.1037/1040-3590.15.4.456. Получено 13 декабря 2013.
  4. ^ Бриджмен, Б .; McCamley-Jenkins, L .; Эрвин, Н. (2000). «Прогнозы среднего успеваемости первокурсника по пересмотренному и перецентрированному SAT® I: тест на рассуждение» (PDF). ETS RR 00-1. Служба образовательного тестирования, Принстон, Нью-Джерси. Получено 13 декабря 2013.