Ложные срабатывания и ложные отрицания - False positives and false negatives
А ложный положительный результат это ошибка в двоичная классификация в котором результат теста неверно указывает на наличие состояния, такого как болезнь, когда болезни нет, а ложноотрицательный - это противоположная ошибка, когда результат теста неверно не указывает на наличие условия, когда оно присутствует. Это два вида ошибок в двоичный тест, в отличие от двух видов правильного результата, истинно положительный и истинно отрицательный.) Они также известны в медицине как ложный положительный результат (или же ложноотрицательный) диагноз, И в статистическая классификация как ложный положительный результат (или же ложноотрицательный) ошибка.[1]
В статистическая проверка гипотез аналогичные концепции известны как ошибки типа I и типа II, где положительный результат соответствует отказу от нулевая гипотеза, а отрицательный результат соответствует не отклонению нулевой гипотезы. Эти термины часто используются как синонимы, но есть различия в деталях и интерпретациях из-за различий между медицинским тестированием и статистической проверкой гипотез.
Ложноположительная ошибка
А ложноположительная ошибка, или же ложный положительный результат, является результатом, который указывает, что данное условие существует, когда это не так. Например, тест на беременность, который показывает, что женщина беременна, хотя она не беременна, или осуждение невиновного человека.
Ложноположительная ошибка - это ошибка типа I где тест проверяет одно условие и ошибочно дает положительное (положительное) решение. Однако важно различать частоту ошибок типа 1 и вероятность того, что положительный результат окажется ложным. Последний известен как риск ложноположительных результатов (см. Неоднозначность в определении частоты ложных срабатываний, ниже ).[2]
Ложноотрицательная ошибка
А ложноотрицательная ошибка, или же ложноотрицательный, - результат теста, который ошибочно указывает на то, что условие не выполняется. Например, когда тест на беременность показывает, что женщина не беременна, но она беременна, или когда лицо, виновное в совершении преступления, оправдано, это ложноотрицательные результаты. Условие «женщина беременна» или «лицо виновно» выполняется, но тест (тест на беременность или судебный процесс) не учитывает это условие и ошибочно решает, что человек не беременен или не виновен.
Ложноотрицательная ошибка - это ошибка типа II возникает в тесте, где проверяется одно условие, и результат теста ошибочный, то есть условие отсутствует.[3]
Связанные термины
Ложноположительные и ложноотрицательные показатели
В ложноположительный рейтинг - это доля всех отрицательных результатов, которые по-прежнему дают положительные результаты теста, то есть условная вероятность положительного результата теста с учетом события, которого не было.
Уровень ложных срабатываний равен уровень значимости. В специфичность теста равно 1 минус количество ложных срабатываний.
В статистическая проверка гипотез, эта дробь обозначается греческой буквой α, а 1 − α определяется как специфичность теста. Повышение специфичности теста снижает вероятность ошибок типа I, но может повысить вероятность ошибок типа II (ложноотрицательные результаты, отклоняющие альтернативную гипотезу, когда она верна).[а]
Дополнительно ложноотрицательная ставка - это доля положительных результатов, которые дают отрицательные результаты теста с тестом, то есть условная вероятность отрицательного результата теста при наличии искомого условия.
В статистическая проверка гипотез этой дроби присваивается буква β. "мощность " (или "чувствительность ") теста равно 1 − β.
Неоднозначность определения частоты ложных срабатываний
Термин «частота ложных открытий» (FDR) использовался Colquhoun (2014).[4] означает вероятность того, что «значимый» результат был ложноположительным. Позже Колкухун (2017)[2] использовали термин ложноположительный риск (FPR) для одного и того же количества, чтобы избежать путаницы с термином FDR, используемым людьми, которые работают над множественными сравнениями. Исправления для множественных сравнений направлены только на исправление коэффициента ошибок типа I, поэтому результат (исправлено) п ценить. Таким образом, они подвержены такому же неверному толкованию, как и любые другие п ценить. Риск ложного срабатывания всегда выше, часто намного выше, чем п ценить.[4][2]Путаница этих двух идей, ошибка транспонированного условного выражения нанесла много вреда.[5] Из-за неоднозначности обозначений в этой области важно смотреть на определение в каждой статье. Опасности полагаться на п-значения были подчеркнуты в Colquhoun (2017)[2] указав, что даже наблюдение п = 0,001 не обязательно было убедительным доказательством против нулевой гипотезы. Несмотря на то, что отношение правдоподобия в пользу альтернативной гипотезы над нулевым значением близко к 100, если гипотеза была неправдоподобной, с априорной вероятностью реального эффекта, равной 0,1, даже наблюдение п = 0,001 даст 8% ложных срабатываний. Он даже не достигнет 5-процентного уровня. Как следствие, было рекомендовано[2][6] что каждый п значение должно сопровождаться априорной вероятностью наличия реального эффекта, который необходимо принять для достижения риска ложноположительного результата в 5%. Например, если мы наблюдаем п= 0,05 в одном эксперименте, мы должны быть на 87% уверены, что существует реальный эффект, прежде чем эксперимент будет проведен, чтобы достичь риска ложноположительных результатов в 5%.
Рабочая характеристика приемника
Статья "Рабочая характеристика приемника "обсуждаются параметры статистической обработки сигналов на основе соотношений ошибок различных типов.
Примечания
- ^ При разработке алгоритмов обнаружения или тестов необходимо выбирать баланс между рисками ложноотрицательных и ложных срабатываний. Обычно существует порог того, насколько близко должно быть достигнуто совпадение с заданной выборкой, прежде чем алгоритм сообщит о совпадении. Чем выше этот порог, тем больше ложных отрицательных результатов и меньше ложных срабатываний.
Рекомендации
- ^ Ложные срабатывания и ложные отрицания
- ^ а б c d е Колкухун, Дэвид (2017). «Воспроизводимость исследований и неправильная интерпретация p-значений». Королевское общество открытой науки. 4 (12): 171085. Дои:10.1098 / rsos.171085. ЧВК 5750014. PMID 29308247.
- ^ Банерджи, А; Читнис, УБ; Джадхав, SL; Bhawalkar, JS; Чаудхури, S (2009). «Проверка гипотез, ошибки типа I и типа II». Ind Psychiatry J. 18 (2): 127–31. Дои:10.4103/0972-6748.62274. ЧВК 2996198. PMID 21180491.
- ^ а б Колкухун, Дэвид (2014). "Расследование ложных открытий и неправильного толкования п-значения". Королевское общество открытой науки. 1 (3): 140216. Дои:10.1098 / rsos.140216. ЧВК 4448847. PMID 26064558.
- ^ Колкухун, Дэвид. «Проблема с p-значениями». Эон. Журнал Aeon. Получено 11 декабря 2016.
- ^ Колкухун, Дэвид (2018). «Риск ложного срабатывания: предложение относительно того, что делать с значениями p». Американский статистик. 73: 192–201. arXiv:1802.04888. Дои:10.1080/00031305.2018.1529622.
Смотрите также
внешняя ссылка
- Дневной график - Маловероятные результаты - Почему большинство опубликованных научных исследований, вероятно, ложны - Иллюстрация ложных срабатываний и ложных отрицаний в Экономист появляется в статье Проблемы с научными исследованиями Как наука идет наперекосяк Научные исследования изменили мир. Теперь ему нужно изменить себя (19 октября 2013 г.)