Статистика Юденса J - Википедия - Youdens J statistic

Статистика Юдена J (также называемый Индекс Юдена) - это единственная статистика, которая фиксирует производительность дихотомический диагностический тест. Информированность является его обобщением на мультиклассовый случай и оценивает вероятность обоснованного решения.

Определение

Youden's J статистика

{ displaystyle J = { text {чувствительность}} + { text {специфичность}} - 1}

с двумя правыми величинами чувствительность и специфичность. Таким образом, расширенная формула:

{ displaystyle J = { frac { text {истинные положительные результаты}} {{ text {истинные положительные результаты}} + { text {ложные отрицательные результаты}}}} + { frac { text {истинные отрицательные результаты}} {{ text {истинные отрицательные результаты}} + { text {ложные срабатывания}}}} - 1}

Индекс был предложен W.J. Youden в 1950 г. ^[1] как способ обобщения результатов диагностического теста. Его значение варьируется от 0 до 1 (включительно).^[1], и имеет нулевое значение, если диагностический тест дает одинаковую долю положительных результатов для групп с заболеванием и без него, то есть тест бесполезен. Значение 1 указывает на отсутствие ложных срабатываний или ложных отрицательных результатов, т.е. тест идеален. Индекс дает равный вес ложноположительным и ложноотрицательным значениям, поэтому все тесты с одинаковым значением индекса дают одинаковую долю от общего числа неверно классифицированных результатов. Хотя технически возможно получить значение меньше нуля из этого уравнения, например Классификация дает только ложные положительные и ложные отрицательные результаты, значение меньше нуля просто указывает на то, что поменялись местами положительные и отрицательные метки. После исправления меток результат будет в диапазоне от 0 до 1.

Пример кривой рабочих характеристик приемника. Сплошной красный: кривая ROC; Пунктирная линия: уровень вероятности; Вертикальная линия (J) максимальное значение индекса Юдена для кривой ROC

Индекс Юдена часто используется вместе с рабочая характеристика приемника (ROC) анализ.^[2] Индекс определяется для всех точек кривой ROC, и максимальное значение индекса может использоваться в качестве критерия для выбора оптимальной точки отсечения, когда диагностический тест дает числовой, а не дихотомический результат. Индекс представлен графически в виде высоты над случайной линией, а также эквивалентен площади под кривой, охватываемой одной рабочей точкой.^[3]

Индекс Юдена также известен как дельтап ^[4] и обобщается от дихотомического к мультиклассовому случаю как информированность.^[3]

Использование единого индекса "обычно не рекомендуется",^[5] но информированность или индекс Юдена - это вероятность принятия обоснованного решения (в отличие от случайного предположения), который учитывает все прогнозы.^[3]

Несвязанная, но часто используемая комбинация базовой статистики из поиск информации это F-оценка, являясь (возможно, взвешенным) гармоническим средним отзыв и точность куда отзывать = чувствительность = истинно положительный показатель, но специфичность и точность это совершенно разные меры. Оценка F, как и отзыв и точность, учитывает только так называемые положительные прогнозы, причем отзыв представляет собой вероятность предсказания только положительного класса, точность представляет собой вероятность того, что положительный прогноз окажется правильным, а оценка F, приравнивающая эти вероятности к эффективное предположение, что положительные метки и положительные прогнозы должны иметь одинаковое распределение и распространенность,^[3] аналогично предположению, лежащему в основе Каппа Флейса. J Юдена, информированность, отзывчивость, точность и F-оценка по своей сути ненаправлены и направлены на оценку дедуктивный эффективность прогнозов в направлении, предложенном правилом, теорией или классификатором. Маркированность (дельтап) - это J Youden, используемый для оценки обратного или похищающий направление,^[3]^[6] и хорошо соответствует человеческому обучению ассоциации; правила и, суеверия как мы моделируем возможно причинность;^[4] в то время как корреляция и каппа оцениваются двунаправленно.

Коэффициент корреляции Мэтьюза это среднее геометрическое из коэффициент регрессии проблемы и ее двойной, где составляющие коэффициенты регрессии коэффициента корреляции Мэтьюза равны Отмеченность (инверсия Юдена J или дельтап) и информированность (Юдена J или дельтап). Статистика каппа, такая как Каппа Флейса и Каппа Коэна методы для расчета межэкспертная надежность основаны на различных предположениях о предельном или априорном распределении и все чаще используются в качестве шанс исправлен альтернативы точность в других контекстах. Каппа Флейса, как и оценка F, предполагает, что обе переменные взяты из одного и того же распределения и, следовательно, имеют одинаковую ожидаемую распространенность, в то время как Каппа Коэна предполагает, что переменные взяты из различных распределений и связаны с моделью ожидание это предполагает распространенность независимы.^[6]

Когда правда распространенность для двух положительных переменных равны, как предполагается в каппе Флейса и F-score, то есть количество положительных прогнозов совпадает с количеством положительных классов в дихотомическом (двухклассном) случае, различная каппа и мера корреляции разрушаются до идентичности с оценкой Юдена. J, а также отзыв, точность и F-оценка аналогичным образом идентичны точность.^[3]^[6]

Статистика Юденса J - Википедия - Youdens J statistic

Определение

Рекомендации