Последовательный анализ - Sequential analysis

В статистика, последовательный анализ или же последовательная проверка гипотез является статистический анализ где размер образца не фиксируется заранее. Вместо этого данные оцениваются по мере их сбора, и дальнейшая выборка останавливается в соответствии с заранее определенным правило остановки как только наблюдаются существенные результаты. Таким образом, иногда вывод может быть сделан на гораздо более ранней стадии, чем это было бы возможно с более классической проверка гипотезы или же оценка, следовательно, с меньшими финансовыми и / или человеческими затратами.

История

Метод последовательного анализа впервые относится к Авраам Вальд^[1] с Джейкоб Вулфовиц, У. Аллен Уоллис, и Милтон Фридман^[2] в то время как в Колумбийского университета Группа статистических исследований как инструмент для более эффективного промышленного контроль качества в течение Вторая Мировая Война. Его ценность для военных действий была немедленно признана и привела к тому, что он получил "ограниченный" классификация.^[3] В то же время, Джордж Барнард возглавил группу, работающую над необязательной остановкой в Великобритании. Еще один ранний вклад в этот метод был сделан К.Дж. Стрелка с Д. Блэквелл и М.А.Гиршик.^[4]

Подобный подход был независимо разработан из первых принципов примерно в то же время Алан Тьюринг, как часть Банбуризм техника, используемая в Bletchley Park, чтобы проверить гипотезы о том, что разные сообщения, закодированные на немецком Enigma машины должны быть соединены и проанализированы вместе. Эта работа оставалась секретной до начала 1980-х годов.^[5]

Питер Армитаж ввел использование последовательного анализа в медицинских исследованиях, особенно в области клинических исследований. Последовательные методы стали все более популярными в медицине после Стюарт Покок работа, в которой были даны четкие рекомендации о том, как контролировать Ошибка типа 1 ставки в последовательных планах.^[6]

Функции альфа-расходования

Когда исследователи повторно анализируют данные по мере добавления новых наблюдений, вероятность Ошибка типа 1 увеличивается. Следовательно, важно корректировать альфа-уровень при каждом промежуточном анализе, чтобы общая частота ошибок 1-го типа оставалась на желаемом уровне. Это концептуально похоже на использование Коррекция Бонферрони, но поскольку повторные просмотры данных являются зависимыми, можно использовать более эффективные поправки для альфа-уровня. Среди самых ранних предложений - Покок граница. Существуют альтернативные способы управления частотой ошибок типа 1, такие как Haybittle-Peto границ, а дополнительная работа по определению границ для промежуточного анализа была проделана O’Brien & Fleming^[7] и Ван и Циатис.^[8]

Ограничение исправлений, таких как граница Покока, заключается в том, что количество просмотров данных должно быть определено до того, как данные будут собраны, и что просмотры данных должны быть равномерно распределены (например, после 50, 100, 150 и 200 пациенты). Подход с использованием альфа-функции расходов, разработанный Demets & Lan^[9] не имеет этих ограничений и в зависимости от параметров, выбранных для функции затрат, может быть очень похож на границы Покока или поправки, предложенные О'Брайеном и Флемингом.

Приложения последовательного анализа

Клинические испытания

В рандомизированном исследовании с двумя группами лечения групповое последовательное тестирование может, например, проводиться следующим образом: после того, как n субъектов в каждой группе доступны, проводится промежуточный анализ. Статистический тест проводится для сравнения двух групп, и если нулевая гипотеза отклонено, судебное разбирательство прекращено; в противном случае испытание продолжается, набирают еще n субъектов на группу и снова проводят статистический тест, включая всех субъектов. Если нуль отклонен, испытание прекращается, в противном случае оно продолжается с периодическими оценками до тех пор, пока не будет выполнено максимальное количество промежуточных анализов, после чего проводится последний статистический тест и испытание прекращается.^[10]

Другие приложения

Последовательный анализ также имеет отношение к проблеме разорение игрока который был изучен, среди прочего, Гюйгенс в 1657 г.^[11]

Обнаружение шагов это процесс обнаружения резких изменений среднего уровня Временные ряды или сигнал. Обычно его рассматривают как особый вид статистического метода, известный как обнаружение точки изменения. Часто шаг небольшой, а временной ряд искажается каким-то шумом, и это усложняет задачу, поскольку шаг может быть скрыт шумом. Поэтому часто требуются статистические алгоритмы и / или алгоритмы обработки сигналов. Когда алгоритмы запущены онлайн по мере поступления данных, особенно с целью создания предупреждения, это приложение последовательного анализа.

Предвзятость

Испытания, которые прекращаются досрочно, поскольку они отвергают нулевую гипотезу, обычно переоценивают истинную величину эффекта.^[12] Это связано с тем, что в небольших выборках только большие оценки величины эффекта приведут к значительному эффекту и последующему прекращению исследования. Были предложены методы корректировки оценок величины эффекта в единичных испытаниях.^[13] Обратите внимание, что это смещение в основном проблематично при интерпретации отдельных исследований. В мета-анализах завышенная величина эффекта из-за раннего прекращения уравновешивается недооценкой в испытаниях, которые прекращаются поздно, что привело Скоу и Маршнер к выводу, что «раннее прекращение клинических испытаний не является существенным источником систематической ошибки в мета-анализах».^[14]

Значение p-значений в последовательном анализе также меняется, потому что при использовании последовательного анализа выполняется более одного анализа, и типичное определение p-значения как данных, «по крайней мере, таких экстремальных», как наблюдается, необходимо переопределить. . Одно из решений состоит в том, чтобы упорядочить p-значения серии последовательных тестов на основе времени остановки и того, насколько высока статистика теста для данного вида, что известно как поэтапное упорядочение.^[15] впервые предложено Армитаж.

Смотрите также

Примечания

^ Вальд, Авраам (Июнь 1945 г.). «Последовательная проверка статистических гипотез». Анналы математической статистики. 16 (2): 117–186. Дои:10.1214 / aoms / 1177731118. JSTOR 2235829.
^ Бергер, Джеймс (2008). Последовательный анализ. Новый экономический словарь Пэлгрейва, 2-е изд.. С. 438–439. Дои:10.1057/9780230226203.1513. ISBN 978-0-333-78676-5.
^ Вайгль, Ханс Гюнтер (2013). Абрахам Вальд: статистика как ключевая фигура современной эконометрики (PDF) (Докторская диссертация). Гамбургский университет.
^ Кеннет Дж. Эрроу, Дэвид Блэквелл и М.А.Гиршик (1949). «Байесовские и минимаксные решения задач последовательного решения». Econometrica. 17 (3/4): 213–244. Дои:10.2307/1905525. JSTOR 1905525.
^ Рэнделл, Брайан (1980), «Колосс», История вычислений в двадцатом веке, п. 30
^ У., Тернбулл, Брюс (2000). Группируйте последовательные методы с приложениями к клиническим испытаниям. Чепмен и Холл. ISBN 9780849303166. OCLC 900071609.
^ О'Брайен, Питер С.; Флеминг, Томас Р. (1979-01-01). «Процедура множественного тестирования для клинических испытаний». Биометрия. 35 (3): 549–556. Дои:10.2307/2530245. JSTOR 2530245. PMID 497341.
^ Wang, Samuel K .; Циатис, Анастасиос А. (1987-01-01). «Приблизительно оптимальные однопараметрические границы для групповых последовательных испытаний». Биометрия. 43 (1): 193–199. Дои:10.2307/2531959. JSTOR 2531959.
^ Демец, Дэвид Л .; Лан, К. К. Гордон (1994-07-15). «Промежуточный анализ: подход альфа-функции расходов». Статистика в медицине. 13 (13–14): 1341–1352. Дои:10.1002 / sim.4780131308. ISSN 1097-0258. PMID 7973215.
^ Коростелева Ольга (2008). Клиническая статистика: введение в клинические испытания, анализ выживаемости и лонгитюдный анализ данных (Первое изд.). Джонс и Бартлетт Издательство. ISBN 978-0-7637-5850-9.
^ Ghosh, B.K .; Сен, П. К. (1991). Справочник по последовательному анализу. Нью-Йорк: Марсель Деккер. ISBN 9780824784089.^{[страница нужна ]}
^ Proschan, Michael A .; Лан, К. К. Гордан; Виттес, Джанет Терк (2006). Статистический мониторинг клинических исследований: единый подход. Springer. ISBN 9780387300597. OCLC 553888945.
^ Лю, А .; Холл, У. Дж. (1999-03-01). «Объективная оценка после группового последовательного теста». Биометрика. 86 (1): 71–78. Дои:10.1093 / biomet / 86.1.71. ISSN 0006-3444.
^ Schou, I. Manjula; Маршнер, Ян К. (10 декабря 2013 г.). «Метаанализ клинических испытаний с досрочным прекращением: исследование потенциальной систематической ошибки». Статистика в медицине. 32 (28): 4859–4874. Дои:10.1002 / sim.5893. ISSN 1097-0258. PMID 23824994.
^ Gordan., Lan, K. K .; Turk., Виттес, Джанет (01.01.2007). Статистический мониторинг клинических исследований: единый подход. Springer. ISBN 9780387300597. OCLC 553888945.

внешняя ссылка

Пакет R: тест последовательного отношения вероятностей Уолда к OnlineMarketr.com
Программное обеспечение для проведения последовательного анализа и приложения последовательного анализа в исследовании группового взаимодействия в компьютерной коммуникации доктором Алланом Джеонгом из Университета штата Флорида

Коммерческий

Программное обеспечение размера образца PASS включает функции для настройки групповых последовательных дизайнов.

[1] Вальд, Авраам (Июнь 1945 г.). «Последовательная проверка статистических гипотез». Анналы математической статистики. 16 (2): 117–186. Дои:10.1214 / aoms / 1177731118. JSTOR 2235829.

[2] Бергер, Джеймс (2008). Последовательный анализ. Новый экономический словарь Пэлгрейва, 2-е изд.. С. 438–439. Дои:10.1057/9780230226203.1513. ISBN 978-0-333-78676-5.

[3] Вайгль, Ханс Гюнтер (2013). Абрахам Вальд: статистика как ключевая фигура современной эконометрики (PDF) (Докторская диссертация). Гамбургский университет.

[4] Кеннет Дж. Эрроу, Дэвид Блэквелл и М.А.Гиршик (1949). «Байесовские и минимаксные решения задач последовательного решения». Econometrica. 17 (3/4): 213–244. Дои:10.2307/1905525. JSTOR 1905525.

[5] Рэнделл, Брайан (1980), «Колосс», История вычислений в двадцатом веке, п. 30

[6] У., Тернбулл, Брюс (2000). Группируйте последовательные методы с приложениями к клиническим испытаниям. Чепмен и Холл. ISBN 9780849303166. OCLC 900071609.

[7] О'Брайен, Питер С.; Флеминг, Томас Р. (1979-01-01). «Процедура множественного тестирования для клинических испытаний». Биометрия. 35 (3): 549–556. Дои:10.2307/2530245. JSTOR 2530245. PMID 497341.

[8] Wang, Samuel K .; Циатис, Анастасиос А. (1987-01-01). «Приблизительно оптимальные однопараметрические границы для групповых последовательных испытаний». Биометрия. 43 (1): 193–199. Дои:10.2307/2531959. JSTOR 2531959.

[9] Демец, Дэвид Л .; Лан, К. К. Гордон (1994-07-15). «Промежуточный анализ: подход альфа-функции расходов». Статистика в медицине. 13 (13–14): 1341–1352. Дои:10.1002 / sim.4780131308. ISSN 1097-0258. PMID 7973215.

[10] Коростелева Ольга (2008). Клиническая статистика: введение в клинические испытания, анализ выживаемости и лонгитюдный анализ данных (Первое изд.). Джонс и Бартлетт Издательство. ISBN 978-0-7637-5850-9.

[11] Ghosh, B.K .; Сен, П. К. (1991). Справочник по последовательному анализу. Нью-Йорк: Марсель Деккер. ISBN 9780824784089.^{[страница нужна ]}

[12] Proschan, Michael A .; Лан, К. К. Гордан; Виттес, Джанет Терк (2006). Статистический мониторинг клинических исследований: единый подход. Springer. ISBN 9780387300597. OCLC 553888945.

[13] Лю, А .; Холл, У. Дж. (1999-03-01). «Объективная оценка после группового последовательного теста». Биометрика. 86 (1): 71–78. Дои:10.1093 / biomet / 86.1.71. ISSN 0006-3444.

[14] Schou, I. Manjula; Маршнер, Ян К. (10 декабря 2013 г.). «Метаанализ клинических испытаний с досрочным прекращением: исследование потенциальной систематической ошибки». Статистика в медицине. 32 (28): 4859–4874. Дои:10.1002 / sim.5893. ISSN 1097-0258. PMID 23824994.

[15] Gordan., Lan, K. K .; Turk., Виттес, Джанет (01.01.2007). Статистический мониторинг клинических исследований: единый подход. Springer. ISBN 9780387300597. OCLC 553888945.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

Дизайн экспериментов
Научный метод	Научный эксперимент Статистический дизайн Контроль Внутренний и внешний срок действия Экспериментальная установка Ослепление Оптимальный дизайн: Байесовский Случайное назначение Рандомизация Ограниченная рандомизация Репликация против субдискретизации Размер образца
Уход и блокировка	Уход Размер эффекта Контраст Взаимодействие Сбивает с толку Ортогональность Блокировка Ковариантный Мешающая переменная
Модели и вывод	Линейная регрессия Обычный метод наименьших квадратов Байесовский Случайный эффект Смешанная модель Иерархическая модель: Байесовский Дисперсионный анализ (Anova) Теорема Кохрана Манова (многомерный) Анкова (ковариация) Сравнить средства Множественное сравнение
Дизайн Полностью рандомизированный	Факториал Дробный факториал Плакетт-Берман Тагучи Методология поверхности отклика Полиномиальное и рациональное моделирование Бокс-Бенкен Центральный композит Блокировать Обобщенный рандомизированный блочный дизайн (GRBD) Латинский квадрат Греко-латинский квадрат Ортогональный массив Латинский гиперкуб Дизайн повторных мероприятий Кроссовер исследование Рандомизированное контролируемое исследование Последовательный анализ Тест последовательного отношения вероятностей
Глоссарий Категория Математический портал Статистический обзор Статистические темы