Разница в различиях - Difference in differences
Разница в различиях (СДЕЛАЛ[1] или же DD[2]) это статистический метод используется в эконометрика и количественные исследования в социальных науках, который пытается имитировать план экспериментального исследования с помощью данные наблюдательного исследования, изучая дифференциальный эффект лечения на «лечебную группу» по сравнению с «контрольная группа ' в естественный эксперимент.[3] Он рассчитывает эффект лечения (т. Е. Объясняющую переменную или независимая переменная ) на результат (т. е. переменная ответа или зависимая переменная ) путем сравнения среднего изменения во времени переменной результата для экспериментальной группы со средним изменением во времени для контрольной группы. Хотя он предназначен для смягчения воздействия посторонних факторов и критерий отбора, в зависимости от того, как выбрана группа лечения, этот метод все же может быть предметом определенных предубеждений (например, средняя регрессия, обратная причинность и смещение пропущенной переменной ).
В отличие от оценка временного ряда воздействия лечения на субъектов (который анализирует различия во времени) или перекрестной оценки эффекта лечения (который измеряет разницу между лечебной и контрольной группами), разница в использовании различий данные панели для измерения различий между экспериментальной и контрольной группой изменений переменной результата, происходящих с течением времени.
Общее определение
Разница в различиях требует данных, измеренных для экспериментальной группы и контрольной группы в два или более разных периода времени, в частности, по меньшей мере, один период времени до «лечения» и по меньшей мере один период времени после «лечения». В изображенном примере результат в экспериментальной группе представлен линией P, а результат в контрольной группе представлен линией S. Исходная (зависимая) переменная в обеих группах измеряется в момент времени 1, до того, как любая группа получили лечение (т.е. независимую или объясняющую переменную), представленное точками п1 и S1. Затем группа лечения получает или подвергается лечению, и обе группы снова измеряются во время 2. Не вся разница между экспериментальной и контрольной группами во время 2 (то есть разница между п2 и S2) можно объяснить как эффект лечения, потому что экспериментальная группа и контрольная группа не начинали в один и тот же момент времени 1. Таким образом, DID вычисляет «нормальную» разницу в переменной результата между двумя группами (разница которые все еще существовали бы, если бы ни одна из групп не проходила лечение), представленный пунктирной линией Q. (Обратите внимание, что наклон от п1 к Q такой же, как уклон от S1 к S2.) Эффект лечения - это разница между наблюдаемым и «нормальным» исходом (разница между P2 и Q).
Формальное определение
Рассмотрим модель
куда является зависимой переменной для индивидуальный и , группа, к которой принадлежит (т.е. к группе лечения или контрольной группе), и это сокращение для фиктивная переменная равно 1, когда событие, описанное в верно, и 0 в противном случае. В сюжете времени против по группе, является вертикальным пересечением графика для , и временной тренд, разделяемый обеими группами в соответствии с предположением о параллельном тренде (см. Предположения ниже). это лечебный эффект, и это остаточный срок.
Рассмотрим среднее значение зависимой переменной и фиктивных показателей по группам и времени:
и предположим для простоты, что и . Обратите внимание, что не случайно; он просто кодирует то, как маркируются группы и периоды. потом
В строгое предположение экзогенности тогда следует, что
Не теряя общий смысл, предположить, что группа лечения, и это период после, то и , давая оценку DID
что можно интерпретировать как лечебный эффект лечения, обозначенный . Ниже показано, как эта оценка может быть прочитана как коэффициент в обычной регрессии наименьших квадратов. Модель, описанная в этом разделе, является чрезмерно параметризованной; чтобы исправить это, один из коэффициентов для фиктивных переменных может быть установлен на 0, например, мы можем установить .
Предположения
Все предположения Модель OLS в равной степени относятся к DID. Кроме того, для DID требуется предположение о параллельном тренде. Предположение о параллельном тренде говорит, что одинаковы в обоих и . Учитывая, что формальное определение выше точно отражает реальность, это предположение автоматически выполняется. Однако модель с вполне может быть более реалистичным. Чтобы повысить вероятность сохранения предположения о параллельном тренде, подход разницы в различиях часто сочетается с соответствие.[4] Это включает в себя «сопоставление» известных «лечебных» единиц с смоделированными контрфактическими «контрольными» единицами: характерно эквивалентными единицами, которые не получали лечения. Определив переменную результата как временную разницу (изменение наблюдаемого результата между периодами до и после лечения) и сопоставив несколько единиц в большой выборке на основе аналогичных историй до лечения, в результате СЪЕЛ (т. е. ATT: средний эффект лечения для пролеченных) обеспечивает надежную оценку разницы в разнице эффектов лечения. Это служит двум статистическим целям: во-первых, при условии наличия ковариат до обработки предположение о параллельных тенденциях, вероятно, будет верным; и, во-вторых, этот подход снижает зависимость от связанных допущений игнорирования, необходимых для правильного вывода.
Как показано справа, лечебный эффект представляет собой разницу между наблюдаемым значением у и какова ценность у было бы с параллельными тенденциями, если бы не было лечения. Ахиллесова пята DID - это когда что-то другое, кроме лечения, изменяется в одной группе, но не в другой одновременно с лечением, что подразумевает нарушение предположения о параллельном тренде.
Чтобы гарантировать точность оценки DID, предполагается, что состав лиц двух групп со временем не изменится. При использовании модели DID возникают различные проблемы, которые могут повлиять на результаты, например: автокорреляция[5] и Дипы Ashenfelter, должны быть рассмотрены и решены.
Выполнение
Метод DID может быть реализован в соответствии с таблицей ниже, где правая нижняя ячейка - это средство оценки DID.
Разница | |||
---|---|---|---|
+ Изменить |
Тот же результат дает проведение регрессионного анализа. Рассмотрим модель OLS
куда фиктивная переменная для периода, равная когда , и фиктивная переменная для членства в группе, равная когда . Составная переменная фиктивная переменная, указывающая, когда . Хотя здесь это не показано строго, это правильная параметризация модели. формальное определение кроме того, оказывается, что средние по группе и периоду в этом разделе относятся к оценкам параметров модели следующим образом
куда обозначает условные средние, вычисленные по выборке, например, - показатель последующего периода, - показатель для контрольной группы. Чтобы увидеть связь между этим обозначением и предыдущим разделом, рассмотрите, как указано выше, только одно наблюдение за период времени для каждой группы, затем
и так далее для других значений и , что эквивалентно
Но это выражение для лечебного эффекта, которое было дано в формальное определение и в приведенной выше таблице.
Кард и Крюгер (1994) пример
Рассмотрим одно из самых известных исследований DID - Карта и Крюгер статья о минимальная заработная плата в Нью-Джерси, опубликовано в 1994 году.[6] Кард и Крюгер сравнили занятость в быстрое питание сектор в Нью-Джерси и в Пенсильвания в феврале 1992 г. и в ноябре 1992 г., после того как минимальная заработная плата в Нью-Джерси выросла с 4,25 долл. до 5,05 долл. в апреле 1992 г. Наблюдение за изменением занятости только в Нью-Джерси до и после лечения не позволило бы контролировать пропущенные переменные такие как погодные и макроэкономические условия региона. Путем включения Пенсильвании в качестве элемента управления в модель разницы в различиях любое смещение, вызванное переменными, общими для Нью-Джерси и Пенсильвании, неявно контролируется, даже если эти переменные не наблюдаются. Если предположить, что в Нью-Джерси и Пенсильвании наблюдаются параллельные тенденции во времени, изменение занятости в Пенсильвании можно интерпретировать как изменение, которое произошло бы в Нью-Джерси, если бы они не повысили минимальную заработную плату, и наоборот. Факты свидетельствуют о том, что повышение минимальной заработной платы не привело к сокращению занятости в Нью-Джерси, вопреки предположениям упрощенной экономической теории. В таблице ниже приведены оценки Card & Krueger воздействия лечения на занятость, измеренные как FTE (или эквиваленты полной занятости). Кард и Крюгер подсчитали, что повышение минимальной заработной платы на $ 0,80 в Нью-Джерси привело к увеличению занятости на 2,75 евро.
Нью-Джерси | Пенсильвания | Разница | |
---|---|---|---|
Февраль | 20.44 | 23.33 | −2.89 |
Ноябрь | 21.03 | 21.17 | −0.14 |
+ Изменить | 0.59 | −2.16 | 2.75 |
Смотрите также
Рекомендации
- ^ Абади, А. (2005). «Полупараметрические оценщики разности разностей». Обзор экономических исследований. 72 (1): 1–19. CiteSeerX 10.1.1.470.1475. Дои:10.1111/0034-6527.00321.
- ^ Бертран, М .; Дюфло, Э.; Муллайнатан, С. (2004). "Насколько мы должны доверять оценкам разницы в различиях?" (PDF). Ежеквартальный журнал экономики. 119 (1): 249–275. Дои:10.1162/003355304772839588. S2CID 470667.
- ^ Angrist, J.D .; Пишке, Дж. С. (2008). В основном безвредная эконометрика: соратник эмпирика. Издательство Принстонского университета. С. 227–243. ISBN 978-0-691-12034-8.
- ^ Басу, Паллави; Маленький, Дилан (2020). «Создание более согласованной контрольной группы в анализе различий в различиях: его влияние на историю, взаимодействующее с групповым предубеждением» (PDF). Наблюдательные исследования. 6: 103–130.
- ^ Бертран, Марианна; Дюфло, Эстер; Муллайнатан, Сендхил (2004). «Насколько мы должны доверять оценкам разницы в различиях?» (PDF). Ежеквартальный журнал экономики. 119 (1): 249–275. Дои:10.1162/003355304772839588. S2CID 470667.
- ^ Карточка, Дэвид; Крюгер, Алан Б. (1994). «Минимальная заработная плата и занятость: пример индустрии быстрого питания в Нью-Джерси и Пенсильвании». Американский экономический обзор. 84 (4): 772–793. JSTOR 2118030.
дальнейшее чтение
- Angrist, J.D .; Пишке, Дж. С. (2008). В основном безвредная эконометрика: соратник эмпирика. Издательство Принстонского университета. С. 227–243. ISBN 978-0-691-12034-8.
- Кэмерон, Артур С .; Триведи, Правин К. (2005). Микроэконометрика: методы и приложения. Пресса Кембриджского университета. С. 768–772. Дои:10.1017 / CBO9780511811241. ISBN 9780521848053.
- Imbens, Guido W .; Вулдридж, Джеффри М. (2009). «Последние изменения в эконометрике оценки программ». Журнал экономической литературы. 47 (1): 5–86. Дои:10.1257 / jel.47.1.5.
- Бакиджа, Джон; Хайм, Брэдли (август 2008 г.). «Как благотворительные пожертвования соответствуют стимулам и доходам? Динамическая панель оценивает с учетом прогнозируемых изменений в налогообложении». Рабочий документ NBER № 14237. Дои:10.3386 / w14237.
- Conley, T .; Табер, К. (июль 2005 г.). «Заключение о« различиях в различиях »при небольшом количестве изменений политики». Технический рабочий документ NBER № 312. Дои:10,3386 / t0312.
внешняя ссылка
- Разница в оценке разницы, Сайт экономиста здравоохранения