Последовательный анализ - Sequential analysis
В статистика, последовательный анализ или же последовательная проверка гипотез является статистический анализ где размер образца не фиксируется заранее. Вместо этого данные оцениваются по мере их сбора, и дальнейшая выборка останавливается в соответствии с заранее определенным правило остановки как только наблюдаются существенные результаты. Таким образом, иногда вывод может быть сделан на гораздо более ранней стадии, чем это было бы возможно с более классической проверка гипотезы или же оценка, следовательно, с меньшими финансовыми и / или человеческими затратами.
История
Метод последовательного анализа впервые относится к Авраам Вальд[1] с Джейкоб Вулфовиц, У. Аллен Уоллис, и Милтон Фридман[2] в то время как в Колумбийского университета Группа статистических исследований как инструмент для более эффективного промышленного контроль качества в течение Вторая Мировая Война. Его ценность для военных действий была немедленно признана и привела к тому, что он получил "ограниченный" классификация.[3] В то же время, Джордж Барнард возглавил группу, работающую над необязательной остановкой в Великобритании. Еще один ранний вклад в этот метод был сделан К.Дж. Стрелка с Д. Блэквелл и М.А.Гиршик.[4]
Подобный подход был независимо разработан из первых принципов примерно в то же время Алан Тьюринг, как часть Банбуризм техника, используемая в Bletchley Park, чтобы проверить гипотезы о том, что разные сообщения, закодированные на немецком Enigma машины должны быть соединены и проанализированы вместе. Эта работа оставалась секретной до начала 1980-х годов.[5]
Питер Армитаж ввел использование последовательного анализа в медицинских исследованиях, особенно в области клинических исследований. Последовательные методы стали все более популярными в медицине после Стюарт Покок работа, в которой были даны четкие рекомендации о том, как контролировать Ошибка типа 1 ставки в последовательных планах.[6]
Функции альфа-расходования
Когда исследователи повторно анализируют данные по мере добавления новых наблюдений, вероятность Ошибка типа 1 увеличивается. Следовательно, важно корректировать альфа-уровень при каждом промежуточном анализе, чтобы общая частота ошибок 1-го типа оставалась на желаемом уровне. Это концептуально похоже на использование Коррекция Бонферрони, но поскольку повторные просмотры данных являются зависимыми, можно использовать более эффективные поправки для альфа-уровня. Среди самых ранних предложений - Покок граница. Существуют альтернативные способы управления частотой ошибок типа 1, такие как Haybittle-Peto границ, а дополнительная работа по определению границ для промежуточного анализа была проделана O’Brien & Fleming[7] и Ван и Циатис.[8]
Ограничение исправлений, таких как граница Покока, заключается в том, что количество просмотров данных должно быть определено до того, как данные будут собраны, и что просмотры данных должны быть равномерно распределены (например, после 50, 100, 150 и 200 пациенты). Подход с использованием альфа-функции расходов, разработанный Demets & Lan[9] не имеет этих ограничений и в зависимости от параметров, выбранных для функции затрат, может быть очень похож на границы Покока или поправки, предложенные О'Брайеном и Флемингом.
Приложения последовательного анализа
Клинические испытания
В рандомизированном исследовании с двумя группами лечения групповое последовательное тестирование может, например, проводиться следующим образом: после того, как n субъектов в каждой группе доступны, проводится промежуточный анализ. Статистический тест проводится для сравнения двух групп, и если нулевая гипотеза отклонено, судебное разбирательство прекращено; в противном случае испытание продолжается, набирают еще n субъектов на группу и снова проводят статистический тест, включая всех субъектов. Если нуль отклонен, испытание прекращается, в противном случае оно продолжается с периодическими оценками до тех пор, пока не будет выполнено максимальное количество промежуточных анализов, после чего проводится последний статистический тест и испытание прекращается.[10]
Другие приложения
Последовательный анализ также имеет отношение к проблеме разорение игрока который был изучен, среди прочего, Гюйгенс в 1657 г.[11]
Обнаружение шагов это процесс обнаружения резких изменений среднего уровня Временные ряды или сигнал. Обычно его рассматривают как особый вид статистического метода, известный как обнаружение точки изменения. Часто шаг небольшой, а временной ряд искажается каким-то шумом, и это усложняет задачу, поскольку шаг может быть скрыт шумом. Поэтому часто требуются статистические алгоритмы и / или алгоритмы обработки сигналов. Когда алгоритмы запущены онлайн по мере поступления данных, особенно с целью создания предупреждения, это приложение последовательного анализа.
Предвзятость
Испытания, которые прекращаются досрочно, поскольку они отвергают нулевую гипотезу, обычно переоценивают истинную величину эффекта.[12] Это связано с тем, что в небольших выборках только большие оценки величины эффекта приведут к значительному эффекту и последующему прекращению исследования. Были предложены методы корректировки оценок величины эффекта в единичных испытаниях.[13] Обратите внимание, что это смещение в основном проблематично при интерпретации отдельных исследований. В мета-анализах завышенная величина эффекта из-за раннего прекращения уравновешивается недооценкой в испытаниях, которые прекращаются поздно, что привело Скоу и Маршнер к выводу, что «раннее прекращение клинических испытаний не является существенным источником систематической ошибки в мета-анализах».[14]
Значение p-значений в последовательном анализе также меняется, потому что при использовании последовательного анализа выполняется более одного анализа, и типичное определение p-значения как данных, «по крайней мере, таких экстремальных», как наблюдается, необходимо переопределить. . Одно из решений состоит в том, чтобы упорядочить p-значения серии последовательных тестов на основе времени остановки и того, насколько высока статистика теста для данного вида, что известно как поэтапное упорядочение.[15] впервые предложено Армитаж.
Смотрите также
Примечания
- ^ Вальд, Авраам (Июнь 1945 г.). «Последовательная проверка статистических гипотез». Анналы математической статистики. 16 (2): 117–186. Дои:10.1214 / aoms / 1177731118. JSTOR 2235829.
- ^ Бергер, Джеймс (2008). Последовательный анализ. Новый экономический словарь Пэлгрейва, 2-е изд.. С. 438–439. Дои:10.1057/9780230226203.1513. ISBN 978-0-333-78676-5.
- ^ Вайгль, Ханс Гюнтер (2013). Абрахам Вальд: статистика как ключевая фигура современной эконометрики (PDF) (Докторская диссертация). Гамбургский университет.
- ^ Кеннет Дж. Эрроу, Дэвид Блэквелл и М.А.Гиршик (1949). «Байесовские и минимаксные решения задач последовательного решения». Econometrica. 17 (3/4): 213–244. Дои:10.2307/1905525. JSTOR 1905525.
- ^ Рэнделл, Брайан (1980), «Колосс», История вычислений в двадцатом веке, п. 30
- ^ У., Тернбулл, Брюс (2000). Группируйте последовательные методы с приложениями к клиническим испытаниям. Чепмен и Холл. ISBN 9780849303166. OCLC 900071609.
- ^ О'Брайен, Питер С.; Флеминг, Томас Р. (1979-01-01). «Процедура множественного тестирования для клинических испытаний». Биометрия. 35 (3): 549–556. Дои:10.2307/2530245. JSTOR 2530245. PMID 497341.
- ^ Wang, Samuel K .; Циатис, Анастасиос А. (1987-01-01). «Приблизительно оптимальные однопараметрические границы для групповых последовательных испытаний». Биометрия. 43 (1): 193–199. Дои:10.2307/2531959. JSTOR 2531959.
- ^ Демец, Дэвид Л .; Лан, К. К. Гордон (1994-07-15). «Промежуточный анализ: подход альфа-функции расходов». Статистика в медицине. 13 (13–14): 1341–1352. Дои:10.1002 / sim.4780131308. ISSN 1097-0258. PMID 7973215.
- ^ Коростелева Ольга (2008). Клиническая статистика: введение в клинические испытания, анализ выживаемости и лонгитюдный анализ данных (Первое изд.). Джонс и Бартлетт Издательство. ISBN 978-0-7637-5850-9.
- ^ Ghosh, B.K .; Сен, П. К. (1991). Справочник по последовательному анализу. Нью-Йорк: Марсель Деккер. ISBN 9780824784089.[страница нужна ]
- ^ Proschan, Michael A .; Лан, К. К. Гордан; Виттес, Джанет Терк (2006). Статистический мониторинг клинических исследований: единый подход. Springer. ISBN 9780387300597. OCLC 553888945.
- ^ Лю, А .; Холл, У. Дж. (1999-03-01). «Объективная оценка после группового последовательного теста». Биометрика. 86 (1): 71–78. Дои:10.1093 / biomet / 86.1.71. ISSN 0006-3444.
- ^ Schou, I. Manjula; Маршнер, Ян К. (10 декабря 2013 г.). «Метаанализ клинических испытаний с досрочным прекращением: исследование потенциальной систематической ошибки». Статистика в медицине. 32 (28): 4859–4874. Дои:10.1002 / sim.5893. ISSN 1097-0258. PMID 23824994.
- ^ Gordan., Lan, K. K .; Turk., Виттес, Джанет (01.01.2007). Статистический мониторинг клинических исследований: единый подход. Springer. ISBN 9780387300597. OCLC 553888945.
Рекомендации
- Вальд, Авраам (1947). Последовательный анализ. Нью-Йорк: Джон Уайли и сыновья.
- Бартрофф Дж., Лай Т.Л., Ши М.-К. (2013) Последовательные эксперименты в клинических испытаниях: дизайн и анализ. Springer.
- Гош, Бхаскар Кумар (1970). Последовательная проверка статистических гипотез. Чтение: Эддисон-Уэсли.
- Чернов, Герман (1972). Последовательный анализ и оптимальный дизайн. СИАМ.
- Зигмунд, Дэвид (1985). Последовательный анализ. Серии Спрингера в статистике. Нью-Йорк: Springer-Verlag. ISBN 978-0-387-96134-7.
- Бакман Р., Готтман Дж. М. (1997) Наблюдение за взаимодействием: Введение в последовательный анализ, Кембридж: Издательство Кембриджского университета.
- Дженнисон, К. и Тернбулл, Б.В. (2000) Групповые последовательные методы с применением в клинических испытаниях. Чепмен и Холл / CRC.
- Уайтхед, Дж. (1997). Дизайн и анализ последовательных клинических испытаний, 2-е издание. Джон Вили и сыновья.
внешняя ссылка
- Пакет R: тест последовательного отношения вероятностей Уолда к OnlineMarketr.com
- Программное обеспечение для проведения последовательного анализа и приложения последовательного анализа в исследовании группового взаимодействия в компьютерной коммуникации доктором Алланом Джеонгом из Университета штата Флорида
- Коммерческий
- Программное обеспечение размера образца PASS включает функции для настройки групповых последовательных дизайнов.