Стратифицированная рандомизация - Stratified randomization

Графическая разбивка стратифицированной случайной выборки

В статистика, стратифицированная рандомизация это метод отбор проб который сначала расслаивает все исследование численность населения в подгруппы с таким же атрибуты или характеристики, известные как страты, за которыми следует простая случайная выборка из стратифицированных групп, где каждый элемент в той же подгруппе выбирается беспристрастно на любом этапе процесса отбора проб случайным образом и совершенно случайно.[1][2] Стратифицированная рандомизация считается подразделением стратифицированная выборка, и должны быть приняты, когда общие атрибуты существуют частично и сильно различаются между подгруппами исследуемой совокупности, так что они требуют особых соображений или четких различий во время выборки.[3] Этот метод отбора проб следует отличать от выборочное обследование, где для представления всей генеральной совокупности выбирается простая случайная выборка из нескольких целых кластеров или стратифицированная систематическая выборка, где систематический отбор проб осуществляется после процесса стратификации. Стратифицированная случайная выборка иногда также называется "стратифицированная случайная выборка" или же "случайная выборка по квоте".[1]

Этапы стратифицированной рандомизации

Стратифицированная рандомизация чрезвычайно полезна, когда целевая группа неоднородный и эффективно показывает, как исследуемые тенденции или характеристики различаются между стратами.[1] При проведении стратифицированной рандомизации необходимо выполнить следующие 8 шагов:[4][5]

  1. Определите целевую группу.
  2. Определить стратификацию переменные и определите количество создаваемых слоев. Критерии определения переменных для стратификации включают: возраст, социоэкономический статус, Национальность, раса, Уровень образования и другие, и должны соответствовать цели исследования. В идеале следует использовать 4–6 слоев, поскольку любое увеличение переменных стратификации повысит вероятность того, что некоторые из них нейтрализуют влияние других переменных.[5]
  3. Использовать основа выборки для оценки всех элементов целевой группы. Внесите изменения впоследствии на основе покрытие и группировка.
  4. Перечислите все элементы и рассмотрите результат выборки. Каждый слой должен быть взаимоисключающий и суммировать, чтобы охватить всех членов населения, в то время как каждый член населения должен попадать в уникальный stratum вместе с другими членами с минимальными различиями.[4]
  5. Принимайте решения по критериям случайной выборки. Это можно сделать вручную или с помощью специальной компьютерной программы.
  6. Присвойте случайный и уникальный номер всем элементам, а затем отсортируйте эти элементы в соответствии с их номером.
  7. Проверьте размер каждой страты и числовое распределение всех элементов в каждой страте. Определите тип выборки: пропорциональная или непропорциональная стратифицированная выборка.
  8. Выполните выбранную случайную выборку, как определено в шаге 5. Как минимум, один элемент должен быть выбран из каждой страты, чтобы окончательная выборка включала представителей от каждой страты. Если выбраны два или более элемента из каждой страты, погрешность собранных данных можно рассчитать.[5]

Методы

Простая случайная выборка после этапа стратификации

Стратифицированная рандомизация определяет один или несколько прогностических факторов, чтобы в среднем подгруппы имели схожие характеристики входа. Фактор пациента можно точно определить, изучив результаты предыдущих исследований.[6]

Количество подгрупп можно рассчитать, умножив количество слоев для каждого фактора. Факторы измеряются до или во время рандомизации, и испытуемые делятся на несколько подгрупп или слоев в соответствии с результатами измерений.[7]

Внутри каждой страты можно применять несколько стратегий рандомизации, которые включают: простая рандомизация, заблокированная рандомизация, и минимизация.

Простая рандомизация внутри слоев

Простая рандомизация считается самым простым методом распределения субъектов в каждую страту. Субъекты распределяются по каждой группе чисто случайным образом для каждого задания. Несмотря на то, что это легко провести, простая рандомизация обычно применяется в стратах, содержащих более 100 выборок, поскольку небольшой размер выборки сделает распределение неравным.[7]

Блокировать рандомизацию внутри слоев

Блокировать рандомизацию, иногда называемая случайной перестановкой блоков, применяет блоки (для распределения субъектов из одних и тех же слоев одинаково для каждой группы в исследовании. При рандомизации блоков указываются коэффициент распределения (соотношение количества одной конкретной группы по сравнению с другими группами) и размеры групп. Размер блока должен быть кратным количеству обработок, чтобы образцы в каждой страте можно было отнести к группам обработки с заданным соотношением.[7] Например, в клиническом исследовании рака груди должно быть 4 или 8 уровней, в которых возраст и статус узлов являются двумя прогностическими факторами, и каждый фактор разделен на два уровня. Различные блоки могут быть назначены семплам разными способами, включая случайный список и компьютерное программирование.[8][9]

Блочная рандомизация обычно используется в экспериментах с относительно большим размером выборки, чтобы избежать несбалансированного распределения выборок с важными характеристиками. В определенных областях со строгими требованиями рандомизации, например клинические испытания, распределение будет предсказуемым, когда нет процесса блокировки для проводников и размер блока ограничен. Блоки с перестановкой рандомизации в стратах могут вызвать дисбаланс выборок между стратами, поскольку количество страт увеличивается, а размер выборки ограничен. Например, существует вероятность того, что не будет найдена выборка, отвечающая характеристикам определенных страт.[10]

Метод минимизации

Чтобы гарантировать сходство каждой группы лечения, делаются попытки метода «минимизации», который является более прямым, чем случайный переставленный блок в пределах страт. В методе минимизации образцы в каждой страте распределяются по группам лечения на основе суммы образцов в каждой группе лечения, что позволяет поддерживать баланс между количеством субъектов в группе.[7] Если суммы для нескольких групп лечения одинаковы, будет проведена простая рандомизация для назначения лечения. На практике метод минимизации должен следовать ежедневной записи назначений лечения по прогностическим факторам, что может быть эффективно выполнено с помощью набора учетных карточек для записи. Метод минимизации эффективно предотвращает дисбаланс между группами, но включает в себя менее случайный процесс, чем блочная рандомизация, поскольку случайный процесс проводится только тогда, когда суммы лечения одинаковы. Возможное решение состоит в применении дополнительного случайного списка, в котором группы лечения с меньшей суммой предельных итогов имеют более высокий шанс (например,), в то время как другие виды лечения имеют более низкий шанс (например,).[11]

Заявление

Смешивающие факторы важно учитывать в клинических испытаниях.

Стратифицированная случайная выборка полезна и продуктивна в ситуациях, требующих различных веса на определенных пластах. Таким образом, исследователи могут манипулировать механизмами отбора из каждой страты, чтобы усилить или минимизировать желаемые характеристики в результате исследования.[12]

Стратифицированная рандомизация полезна, когда исследователи намереваются искать ассоциации между двумя или более слоями, поскольку простая случайная выборка увеличивает вероятность неравного представительства целевых групп. Это также полезно, когда исследователи хотят устранить смущающие в наблюдательные исследования поскольку стратифицированная случайная выборка допускает корректировку ковариации и п-значения для более точных результатов.[13]

Также существует более высокий уровень статистическая точность для стратифицированной случайной выборки по сравнению с простой случайной выборкой из-за высокой актуальность элементов, выбранных для представления населения.[5] Различия внутри слоев намного меньше, чем между слоями. Следовательно, поскольку различия между выборками сведены к минимуму, стандартное отклонение будут, следовательно, ужесточены, что приведет к более высокой степени точности и небольшой погрешности в окончательных результатах. Это эффективно снижает размер образца необходимо и увеличивается рентабельность выборки при ограниченном финансировании исследований.

В реальной жизни стратифицированная случайная выборка может применяться к результатам голосования на выборах, исследованиям неравенства доходов между социальными группами или измерениям возможностей получения образования в разных странах.[1]

Стратифицированная рандомизация в клинических испытаниях

В клинические испытания, пациенты стратифицируются в соответствии с их социальным и индивидуальным происхождением или любым фактором, имеющим отношение к исследованию, чтобы соответствовать каждой из этих групп внутри всей популяции пациентов. Целью этого является создание баланса между клиническими и прогностическими факторами, поскольку испытания не дадут достоверных результатов, если дизайн исследования не будет сбалансированным.[14] Этап стратифицированной рандомизации чрезвычайно важен как попытка гарантировать, что никакая систематическая ошибка, преднамеренная или случайная не повлияет на репрезентативный характер исследуемой выборки пациентов.[15] Это увеличивает мощность исследования, особенно в небольших клинических испытаниях (n <400), поскольку считается, что эти известные клинические признаки, стратифицированные, влияют на результаты вмешательства.[16] Это помогает предотвратить возникновение ошибка типа I, который высоко ценится в клинических исследованиях.[17] Это также оказывает важное влияние на размер выборки для активных контрольных испытаний эквивалентности и теоретически облегчает подгрупповой анализ и промежуточный анализ.[17]

Преимущество

Преимущества стратифицированной рандомизации:

  1. Стратифицированная рандомизация может точно отражать результаты для общей популяции, поскольку для стратификации всей выборки и баланса жизненно важных характеристик выборок между группами лечения применяются влияющие факторы. Например, применение стратифицированной рандомизации для создания выборки из 100 человек может гарантировать баланс мужчин и женщин в каждой группе лечения, в то время как использование простой рандомизации может привести только к 20 мужчинам в одной группе и 80 мужчинам в другой группе.[7]
  2. Стратифицированная рандомизация дает меньшую ошибку, чем другие методы выборки, такие как выборочное обследование, простая случайная выборка и систематический отбор проб или же маловероятные методы поскольку измерения внутри слоев могут быть выполнены для получения более низкого стандартное отклонение. Рандомизация разделенных слоев более управляема и в некоторых случаях дешевле, чем простая рандомизация общих выборок.[11]
  3. Группу легче обучить стратификации выборки из-за точности характера стратифицированной рандомизации.[7]
  4. Исследователи могут получить очень полезные результаты, анализируя меньшие размеры выборки из-за статистической точности этого метода.
  5. Этот метод выборки охватывает широкий круг населения, поскольку был произведен полный заряд по страте.
  6. Иногда стратифицированная рандомизация желательна, чтобы иметь оценки популяционных параметров для групп внутри популяции.[11]

Недостаток

Пределы стратифицированной рандомизации включают:

  1. Стратифицированная рандомизация сначала делит выборки на несколько слоев с учетом прогностических факторов, но возможно, что выборки не могут быть разделены. В некоторых случаях значимость прогностических факторов не получает строгого одобрения, что может в дальнейшем привести к смещению. Вот почему необходимо проверить потенциал факторов, влияющих на результат, до включения факторов в стратификацию. В некоторых случаях, когда влияние факторов на результат не может быть подтверждено, предлагается нестратифицированная рандомизация.[18]
  2. Размер подгруппы считается столь же важным, если доступные данные не могут представить общую популяцию подгруппы. В некоторых приложениях размер подгруппы определяется со ссылкой на объем доступных данных вместо масштабирования размеров выборки по размеру подгруппы, что может внести систематическую ошибку во влияние факторов. В некоторых случаях, когда данные должны быть стратифицированы по дисперсии, дисперсия подгруппы значительно различается, что делает размер выборки каждой подгруппы пропорциональным общей совокупности подгруппы.[19]
  3. Стратифицированная выборка не может применяться, если совокупность не может быть полностью разделена на страты, в результате чего размеры выборки будут пропорциональны имеющейся выборке, а не совокупности всей подгруппы.[7]
  4. Процесс распределения выборок по подгруппам может включать дублирование, если субъекты соответствуют стандарту включения нескольких слоев, что может привести к искажению данных о совокупности.[19]

Смотрите также

Рекомендации

  1. ^ а б c d Николас, Стивен (14 июля 2019 г.). «Как работает стратифицированная случайная выборка». Инвестопедия. Получено 2020-04-07.
  2. ^ «Простая случайная выборка», Википедия, 2020-03-18, получено 2020-04-07
  3. ^ «Стратифицированная выборка», Википедия, 2020-02-09, получено 2020-04-07
  4. ^ а б Стефани (11 декабря, 2013). «Стратифицированная случайная выборка: определение, примеры». Статистика Как сделать. Получено 2020-04-07.
  5. ^ а б c d «Стратифицированная случайная выборка: определение, метод и примеры». ВопросPro. 2018-03-13. Получено 2020-04-07.
  6. ^ Сильвестр, Ричард (декабрь 1982). «Основы клинических исследований». Контролируемые клинические испытания. 3 (4): 385–386. Дои:10.1016/0197-2456(82)90029-0. ISSN  0197-2456.
  7. ^ а б c d е ж грамм Покок, Стюарт Дж. (1 июля 2013 г.). Клинические испытания: практический подход. Чичестер: John Wiley & Sons Ltd. ISBN  978-1-118-79391-6. OCLC  894581169.
  8. ^ «Запечатанный конверт | Случайно переставленные блоки». www.sealedenvelope.com. 25 февраля 2020 г.. Получено 2020-04-07.
  9. ^ Фридман, Лоуренс М .; Furberg, Curt D .; Деметс, Дэвид Л. (2010), «Введение в клинические испытания», Основы клинических испытаний, Springer New York, стр. 1–18, Дои:10.1007/978-1-4419-1586-3_1, ISBN  978-1-4419-1585-6
  10. ^ Основы клинических исследований. Фридман, Лоуренс М., 1942-, Фурберг, Курт, ДеМетс, Дэвид Л., 1944-, Ребуссен, Дэвид, Грейнджер, Кристофер Б. (Пятое изд.). Нью-Йорк. 27 августа 2015. ISBN  978-3-319-18539-2. OCLC  919463985.CS1 maint: другие (связь)
  11. ^ а б c Покок, С. Дж. (Март 1979 г.). «Распределение пациентов на лечение в клинических исследованиях». Биометрия. 35 (1): 183–197. Дои:10.2307/2529944. ISSN  0006-341X. JSTOR  2529944. PMID  497334.
  12. ^ Кроссман, Эшли (27 января 2020 г.). «Понимание стратифицированных выборок и их создания». ThoughtCo. Получено 2020-04-07.
  13. ^ Хеннекенс, Чарльз Х. (1987). Эпидемиология в медицине. Беринг, Джули Э., Мэйрент, Шерри Л. (1-е изд.). Бостон, Массачусетс: Литтл, Браун. ISBN  0-316-35636-0. OCLC  16890223.
  14. ^ Полит, ДФ; Бек, CT (2012). Медсестринское исследование: создание и оценка доказательств для сестринской практики, 9-е изд.. Филадельфия, США: Wolters Klower Health: Lippincott Williams & Wilkins.
  15. ^ «Стратификация пациентов в клинических испытаниях». Омиксон | NGS для HLA. 2014-12-01. Получено 2020-04-26.
  16. ^ Стефани (2016-05-20). «Стратифицированная рандомизация в клинических испытаниях». Статистика Как сделать. Получено 2020-04-26.
  17. ^ а б Кернан, Вт (январь 1999 г.). «Стратифицированная рандомизация для клинических испытаний». Журнал клинической эпидемиологии. 52 (1): 19–26. Дои:10.1016 / S0895-4356 (98) 00138-3. PMID  9973070.
  18. ^ Мерфи, Крис Б. (13 апреля 2019 г.). «Плюсы и минусы стратифицированной случайной выборки». Инвестопедия. Получено 2020-04-07.
  19. ^ а б Гласс, Энн; Кундт, Гюнтер (2014), «Возможные преимущества и недостатки стратификации в методах рандомизации», Springer Proceedings по математике и статистике, Springer New York, стр. 239–246, Дои:10.1007/978-1-4939-2104-1_23, ISBN  978-1-4939-2103-4