Q-значение (статистика) - Q-value (statistics)

В статистическая проверка гипотез в частности проверка нескольких гипотез, то q-ценность предоставляет средства для контроля положительный коэффициент ложного обнаружения (pFDR).[1] Так же, как п-ценность дает ожидаемый ложноположительный рейтинг полученный путем отклонения нулевая гипотеза для любого результата с равным или меньшим п-значение, q-value дает ожидаемую pFDR, полученную путем отклонения нулевой гипотезы для любого результата с равным или меньшим q-ценность.

История

В статистике проверка нескольких гипотез одновременно с использованием методов, подходящих для проверки одной гипотезы, имеет тенденцию давать много ложных срабатываний: так называемые проблема множественных сравнений.[2] Например, предположим, что нужно было проверить 1000 нулевых гипотез, все из которых верны, и (как это принято при проверке одной гипотезы) отклонить нулевые гипотезы с помощью уровень значимости 0,05; из-за случайной вероятности можно было бы ожидать, что 5% результатов окажутся значимыми (п <0,05), что дало 50 ложных срабатываний (отклонение нулевой гипотезы).[3] С 1950-х годов статистики разрабатывали методы множественных сравнений, которые снижали количество ложных срабатываний, такие как контроль частота ошибок в семье (FWER) с помощью Коррекция Бонферрони, но эти методы также увеличили количество ложноотрицательных результатов (т.е. уменьшили статистическая мощность ).[2] В 1995 г. Йоав Бенджамини и Йозеф Хохберг предложил контролировать коэффициент ложного обнаружения (FDR) в качестве более статистически мощной альтернативы контролю FWER при проверке множественных гипотез.[2] PFDR и q-значение были введены Джон Д. Стори в 2002 году, чтобы улучшить ограничение FDR, а именно то, что FDR не определяется, когда нет положительных результатов.[1][4]

Определение

Пусть имеется нулевая гипотеза и Альтернативная гипотеза . Выполнить проверка гипотез; пусть статистика тестов быть i.i.d. случайные переменные такой, что . То есть, если верно для теста (), тогда следует за нулевое распределение ; а если правда (), тогда следует альтернативному распределению . Позволять , то есть для каждого теста верно с вероятностью и верно с вероятностью . Обозначим критическая область (значения для которого отклонено) на уровень значимости от . Пусть эксперимент даст значение для тестовой статистики. В q-ценность формально определяется как

Это q-значение - это инфимум pFDR, если отклоняется для тестовой статистики со значениями . Эквивалентно q-значение равно

что представляет собой точную нижнюю грань вероятности того, что верно, учитывая, что отклоняется ( коэффициент ложного обнаружения ).[1]

Отношение к п-ценность

В п-значение определяется как

нижняя грань вероятности того, что отклоняется, учитывая, что верно ( ложноположительный рейтинг ). Сравнение определений п- и q-значения, видно, что q-значение минимальное апостериорная вероятность это правда.[1]

Интерпретация

В q-значение можно интерпретировать как коэффициент ложного обнаружения (FDR): доля ложных срабатываний среди всех положительных результатов. Учитывая набор тестовых статистик и связанных с ними q-значения, отклоняя нулевую гипотезу для всех тестов, чьи q-значение меньше или равно некоторому порогу гарантирует, что ожидаемое значение частоты ложного обнаружения .[5]

Приложения

Биология

Экспрессия гена

Полногеномный анализ дифференциальной экспрессии генов включать одновременное тестирование выражение тысяч генов. Управление FWER (обычно до 0,05) позволяет избежать чрезмерного количества ложных срабатываний (т. Е. Обнаружения дифференциальной экспрессии в гене, который не выражается дифференциально), но устанавливает строгий порог для п-значение, которое приводит к множеству ложноотрицательных результатов (многие дифференциально экспрессируемые гены не учитываются). Однако контроль pFDR путем отбора генов со значительным q-values ​​снижает количество ложноотрицательных результатов (увеличивает статистическую мощность), обеспечивая при этом низкое ожидаемое значение доли ложноположительных результатов среди всех положительных результатов (например, 5%).[5]

Например, предположим, что среди 10 000 протестированных генов 1 000 фактически дифференциально экспрессируются, а 9 000 - нет:

  • Если мы рассмотрим каждый ген с п-значение менее 0,05 для дифференциальной экспрессии, мы ожидаем, что 450 (5%) из 9000 генов, которые не экспрессируются дифференциально, окажутся дифференциально экспрессируемыми (450 ложноположительных результатов).
  • Если мы установим FWER равным 0,05, вероятность получения хотя бы одного ложного срабатывания составляет всего 5%. Однако этот очень строгий критерий снизит мощность, так что немногие из 1000 генов, которые действительно дифференциально экспрессируются, будут, по-видимому, дифференциально экспрессированы (много ложноотрицательных результатов).
  • Если мы контролируем pFDR до 0,05, рассматривая все гены с q-значение менее 0,05 для дифференциального выражения, тогда мы ожидаем, что 5% положительных результатов будут ложноположительными (например, 900 истинных положительных результатов, 45 ложных положительных результатов, 100 ложных отрицательных результатов, 8 955 истинных отрицательных результатов). Эта стратегия позволяет получить относительно небольшое количество как ложных срабатываний, так и ложноотрицательных результатов.

Реализации

Примечание: следующий список неполный.

р

  • В qvalue пакет в р оценки q-значения из списка п-ценности.[6]

использованная литература

  1. ^ а б c d Стори, Джон Д. (2003). «Положительный процент ложных открытий: байесовская интерпретация и q-значение». Анналы статистики. 31 (6): 2013–2035. Дои:10.1214 / aos / 1074290335.
  2. ^ а б c Бенджамини, Йоав; Хохберг, Йосеф (1995). «Контроль ложного обнаружения: практичный и мощный подход к множественному тестированию». Журнал Королевского статистического общества. Серия B (Методологическая). 57: 289–300. Дои:10.1111 / j.2517-6161.1995.tb02031.x.
  3. ^ Нуццо, Регина (2014). «Научный метод: статистические ошибки». Природа. Получено 5 марта 2019.
  4. ^ Стори, Джон Д. (2002). «Прямой подход к показателям ложных открытий». Журнал Королевского статистического общества: серия B (статистическая методология). 64 (3): 479–498. CiteSeerX  10.1.1.320.7131. Дои:10.1111/1467-9868.00346.
  5. ^ а б Стори, Джон Д .; Тибширани, Роберт (2003). «Статистическая значимость для полногеномных исследований». PNAS. 100 (16): 9440–9445. Bibcode:2003ПНАС..100.9440С. Дои:10.1073 / пнас.1530509100. ЧВК  170937. PMID  12883005.
  6. ^ Стори, Джон Д .; Басс, Эндрю Дж .; Дабни, Алан; Робинсон, Дэвид; Варнс, Грегори (2019). «qvalue: оценка Q-значения для контроля скорости обнаружения ложных». Биокондуктор.