Последовательный анализ - Sequential analysis

В статистика, последовательный анализ или же последовательная проверка гипотез является статистический анализ где размер образца не фиксируется заранее. Вместо этого данные оцениваются по мере их сбора, и дальнейшая выборка останавливается в соответствии с заранее определенным правило остановки как только наблюдаются существенные результаты. Таким образом, иногда вывод может быть сделан на гораздо более ранней стадии, чем это было бы возможно с более классической проверка гипотезы или же оценка, следовательно, с меньшими финансовыми и / или человеческими затратами.

История

Метод последовательного анализа впервые относится к Авраам Вальд[1] с Джейкоб Вулфовиц, У. Аллен Уоллис, и Милтон Фридман[2] в то время как в Колумбийского университета Группа статистических исследований как инструмент для более эффективного промышленного контроль качества в течение Вторая Мировая Война. Его ценность для военных действий была немедленно признана и привела к тому, что он получил "ограниченный" классификация.[3] В то же время, Джордж Барнард возглавил группу, работающую над необязательной остановкой в ​​Великобритании. Еще один ранний вклад в этот метод был сделан К.Дж. Стрелка с Д. Блэквелл и М.А.Гиршик.[4]

Подобный подход был независимо разработан из первых принципов примерно в то же время Алан Тьюринг, как часть Банбуризм техника, используемая в Bletchley Park, чтобы проверить гипотезы о том, что разные сообщения, закодированные на немецком Enigma машины должны быть соединены и проанализированы вместе. Эта работа оставалась секретной до начала 1980-х годов.[5]

Питер Армитаж ввел использование последовательного анализа в медицинских исследованиях, особенно в области клинических исследований. Последовательные методы стали все более популярными в медицине после Стюарт Покок работа, в которой были даны четкие рекомендации о том, как контролировать Ошибка типа 1 ставки в последовательных планах.[6]

Функции альфа-расходования

Когда исследователи повторно анализируют данные по мере добавления новых наблюдений, вероятность Ошибка типа 1 увеличивается. Следовательно, важно корректировать альфа-уровень при каждом промежуточном анализе, чтобы общая частота ошибок 1-го типа оставалась на желаемом уровне. Это концептуально похоже на использование Коррекция Бонферрони, но поскольку повторные просмотры данных являются зависимыми, можно использовать более эффективные поправки для альфа-уровня. Среди самых ранних предложений - Покок граница. Существуют альтернативные способы управления частотой ошибок типа 1, такие как Haybittle-Peto границ, а дополнительная работа по определению границ для промежуточного анализа была проделана O’Brien & Fleming[7] и Ван и Циатис.[8]

Ограничение исправлений, таких как граница Покока, заключается в том, что количество просмотров данных должно быть определено до того, как данные будут собраны, и что просмотры данных должны быть равномерно распределены (например, после 50, 100, 150 и 200 пациенты). Подход с использованием альфа-функции расходов, разработанный Demets & Lan[9] не имеет этих ограничений и в зависимости от параметров, выбранных для функции затрат, может быть очень похож на границы Покока или поправки, предложенные О'Брайеном и Флемингом.

Приложения последовательного анализа

Клинические испытания

В рандомизированном исследовании с двумя группами лечения групповое последовательное тестирование может, например, проводиться следующим образом: после того, как n субъектов в каждой группе доступны, проводится промежуточный анализ. Статистический тест проводится для сравнения двух групп, и если нулевая гипотеза отклонено, судебное разбирательство прекращено; в противном случае испытание продолжается, набирают еще n субъектов на группу и снова проводят статистический тест, включая всех субъектов. Если нуль отклонен, испытание прекращается, в противном случае оно продолжается с периодическими оценками до тех пор, пока не будет выполнено максимальное количество промежуточных анализов, после чего проводится последний статистический тест и испытание прекращается.[10]

Другие приложения

Последовательный анализ также имеет отношение к проблеме разорение игрока который был изучен, среди прочего, Гюйгенс в 1657 г.[11]

Обнаружение шагов это процесс обнаружения резких изменений среднего уровня Временные ряды или сигнал. Обычно его рассматривают как особый вид статистического метода, известный как обнаружение точки изменения. Часто шаг небольшой, а временной ряд искажается каким-то шумом, и это усложняет задачу, поскольку шаг может быть скрыт шумом. Поэтому часто требуются статистические алгоритмы и / или алгоритмы обработки сигналов. Когда алгоритмы запущены онлайн по мере поступления данных, особенно с целью создания предупреждения, это приложение последовательного анализа.

Предвзятость

Испытания, которые прекращаются досрочно, поскольку они отвергают нулевую гипотезу, обычно переоценивают истинную величину эффекта.[12] Это связано с тем, что в небольших выборках только большие оценки величины эффекта приведут к значительному эффекту и последующему прекращению исследования. Были предложены методы корректировки оценок величины эффекта в единичных испытаниях.[13] Обратите внимание, что это смещение в основном проблематично при интерпретации отдельных исследований. В мета-анализах завышенная величина эффекта из-за раннего прекращения уравновешивается недооценкой в ​​испытаниях, которые прекращаются поздно, что привело Скоу и Маршнер к выводу, что «раннее прекращение клинических испытаний не является существенным источником систематической ошибки в мета-анализах».[14]

Значение p-значений в последовательном анализе также меняется, потому что при использовании последовательного анализа выполняется более одного анализа, и типичное определение p-значения как данных, «по крайней мере, таких экстремальных», как наблюдается, необходимо переопределить. . Одно из решений состоит в том, чтобы упорядочить p-значения серии последовательных тестов на основе времени остановки и того, насколько высока статистика теста для данного вида, что известно как поэтапное упорядочение.[15] впервые предложено Армитаж.

Смотрите также

Примечания

  1. ^ Вальд, Авраам (Июнь 1945 г.). «Последовательная проверка статистических гипотез». Анналы математической статистики. 16 (2): 117–186. Дои:10.1214 / aoms / 1177731118. JSTOR  2235829.
  2. ^ Бергер, Джеймс (2008). Последовательный анализ. Новый экономический словарь Пэлгрейва, 2-е изд.. С. 438–439. Дои:10.1057/9780230226203.1513. ISBN  978-0-333-78676-5.
  3. ^ Вайгль, Ханс Гюнтер (2013). Абрахам Вальд: статистика как ключевая фигура современной эконометрики (PDF) (Докторская диссертация). Гамбургский университет.
  4. ^ Кеннет Дж. Эрроу, Дэвид Блэквелл и М.А.Гиршик (1949). «Байесовские и минимаксные решения задач последовательного решения». Econometrica. 17 (3/4): 213–244. Дои:10.2307/1905525. JSTOR  1905525.
  5. ^ Рэнделл, Брайан (1980), «Колосс», История вычислений в двадцатом веке, п. 30
  6. ^ У., Тернбулл, Брюс (2000). Группируйте последовательные методы с приложениями к клиническим испытаниям. Чепмен и Холл. ISBN  9780849303166. OCLC  900071609.
  7. ^ О'Брайен, Питер С.; Флеминг, Томас Р. (1979-01-01). «Процедура множественного тестирования для клинических испытаний». Биометрия. 35 (3): 549–556. Дои:10.2307/2530245. JSTOR  2530245. PMID  497341.
  8. ^ Wang, Samuel K .; Циатис, Анастасиос А. (1987-01-01). «Приблизительно оптимальные однопараметрические границы для групповых последовательных испытаний». Биометрия. 43 (1): 193–199. Дои:10.2307/2531959. JSTOR  2531959.
  9. ^ Демец, Дэвид Л .; Лан, К. К. Гордон (1994-07-15). «Промежуточный анализ: подход альфа-функции расходов». Статистика в медицине. 13 (13–14): 1341–1352. Дои:10.1002 / sim.4780131308. ISSN  1097-0258. PMID  7973215.
  10. ^ Коростелева Ольга (2008). Клиническая статистика: введение в клинические испытания, анализ выживаемости и лонгитюдный анализ данных (Первое изд.). Джонс и Бартлетт Издательство. ISBN  978-0-7637-5850-9.
  11. ^ Ghosh, B.K .; Сен, П. К. (1991). Справочник по последовательному анализу. Нью-Йорк: Марсель Деккер. ISBN  9780824784089.[страница нужна ]
  12. ^ Proschan, Michael A .; Лан, К. К. Гордан; Виттес, Джанет Терк (2006). Статистический мониторинг клинических исследований: единый подход. Springer. ISBN  9780387300597. OCLC  553888945.
  13. ^ Лю, А .; Холл, У. Дж. (1999-03-01). «Объективная оценка после группового последовательного теста». Биометрика. 86 (1): 71–78. Дои:10.1093 / biomet / 86.1.71. ISSN  0006-3444.
  14. ^ Schou, I. Manjula; Маршнер, Ян К. (10 декабря 2013 г.). «Метаанализ клинических испытаний с досрочным прекращением: исследование потенциальной систематической ошибки». Статистика в медицине. 32 (28): 4859–4874. Дои:10.1002 / sim.5893. ISSN  1097-0258. PMID  23824994.
  15. ^ Gordan., Lan, K. K .; Turk., Виттес, Джанет (01.01.2007). Статистический мониторинг клинических исследований: единый подход. Springer. ISBN  9780387300597. OCLC  553888945.

Рекомендации

внешняя ссылка

Коммерческий