Дизайн разрывов регрессии - Википедия - Regression discontinuity design
В статистика, эконометрика, политическая наука, эпидемиология, и смежных дисциплин, a дизайн с разрывом регрессии (RDD) представляет собой квазиэкспериментальный план предварительного тестирования и последующего тестирования, который выявляет причинные эффекты вмешательств путем определения порогового значения или порога, выше или ниже которого назначается вмешательство. Сравнивая наблюдения, расположенные близко по обе стороны от порога, можно оценить средний лечебный эффект в средах, в которых рандомизация неосуществимо. Впервые применен Дональдом Тистлтуэйтом и Дональд Кэмпбелл к оценке стипендиальных программ,[1] RDD становится все более популярным в последние годы.[2] Недавние сравнения рандомизированных контролируемых исследований (РКИ) и RDD эмпирически продемонстрировали внутреннюю валидность дизайна.[3]
Пример
Интуиция, стоящая за RDD, хорошо иллюстрируется оценкой стипендий на основе заслуг. Основная проблема с оценкой причинно-следственного эффекта такого вмешательства - это однородность выполнения назначенных лечение (например, стипендия). Поскольку наиболее успешные студенты с большей вероятностью получат стипендию за заслуги и продолжат в то же время хорошо успевать, сравнение результатов награжденных и непоследователей приведет к увеличению предвзятость оценок. Даже если бы стипендия вообще не улучшала оценки, стипендиаты работали бы лучше, чем не получатели, просто потому, что стипендии предоставлялись студентам, которые хорошо успевали. ex-ante.
Несмотря на отсутствие экспериментальная конструкция, RDD может использовать экзогенный характеристики вмешательства, чтобы выявить причинные эффекты. Если все учащиеся получают стипендию с оценками выше заданной - например, 80%, то можно выявить местный лечебный эффект, сравнив учащихся с пороговым значением 80%. Здесь интуиция подсказывает, что ученик, набравший 79%, скорее всего, будет очень похож на ученика, набравшего 81% - с учетом заранее определенного порога в 80%. Однако один студент получит стипендию, а другой - нет. Сравнение результатов лауреата (группы лечения) с результатами контрфактический Результат нереципиента (контрольная группа), следовательно, обеспечит местный лечебный эффект.
Методология
Два наиболее распространенных подхода к оценке с использованием СДР: непараметрический и параметрический (обычно полиномиальная регрессия ).
Непараметрическая оценка
Наиболее распространенный непараметрический метод, используемый в контексте СДР, - это локальная линейная регрессия. Это имеет вид:
куда это время окончания лечения и является двоичной переменной, равной единице, если . Сдача - пропускная способность используемых данных, мы имеем . Различные уклоны и пересечения соответствуют данным по обе стороны от границы. Обычно либо прямоугольный ядро (без взвешивания) или треугольное ядро. Исследования в пользу треугольного ядра[4], но у прямоугольного ядра есть более прямая интерпретация.[5]
Основное преимущество использования непараметрических методов в СДР заключается в том, что они предоставляют оценки на основе данных, близких к пороговому значению, что интуитивно привлекательно. Это снижает некоторую систематическую ошибку, которая может возникнуть в результате использования данных, находящихся дальше от границы отсечки, для оценки неоднородности на границе отсечки.[5] Более формально предпочтительны локальные линейные регрессии, поскольку они обладают лучшими свойствами смещения.[4] и лучше сходимость.[6] Однако использование обоих типов оценки, если это возможно, является полезным способом доказать, что оценочные результаты не слишком сильно зависят от конкретного принятого подхода.
Параметрическая оценка
Пример параметрической оценки:
куда