Разница в различиях - Difference in differences

Разница в различиях (СДЕЛАЛ[1] или же DD[2]) это статистический метод используется в эконометрика и количественные исследования в социальных науках, который пытается имитировать план экспериментального исследования с помощью данные наблюдательного исследования, изучая дифференциальный эффект лечения на «лечебную группу» по сравнению с «контрольная группа ' в естественный эксперимент.[3] Он рассчитывает эффект лечения (т. Е. Объясняющую переменную или независимая переменная ) на результат (т. е. переменная ответа или зависимая переменная ) путем сравнения среднего изменения во времени переменной результата для экспериментальной группы со средним изменением во времени для контрольной группы. Хотя он предназначен для смягчения воздействия посторонних факторов и критерий отбора, в зависимости от того, как выбрана группа лечения, этот метод все же может быть предметом определенных предубеждений (например, средняя регрессия, обратная причинность и смещение пропущенной переменной ).

В отличие от оценка временного ряда воздействия лечения на субъектов (который анализирует различия во времени) или перекрестной оценки эффекта лечения (который измеряет разницу между лечебной и контрольной группами), разница в использовании различий данные панели для измерения различий между экспериментальной и контрольной группой изменений переменной результата, происходящих с течением времени.

Общее определение

Иллюстрация разницы в различиях.png

Разница в различиях требует данных, измеренных для экспериментальной группы и контрольной группы в два или более разных периода времени, в частности, по меньшей мере, один период времени до «лечения» и по меньшей мере один период времени после «лечения». В изображенном примере результат в экспериментальной группе представлен линией P, а результат в контрольной группе представлен линией S. Исходная (зависимая) переменная в обеих группах измеряется в момент времени 1, до того, как любая группа получили лечение (т.е. независимую или объясняющую переменную), представленное точками п1 и S1. Затем группа лечения получает или подвергается лечению, и обе группы снова измеряются во время 2. Не вся разница между экспериментальной и контрольной группами во время 2 (то есть разница между п2 и S2) можно объяснить как эффект лечения, потому что экспериментальная группа и контрольная группа не начинали в один и тот же момент времени 1. Таким образом, DID вычисляет «нормальную» разницу в переменной результата между двумя группами (разница которые все еще существовали бы, если бы ни одна из групп не проходила лечение), представленный пунктирной линией Q. (Обратите внимание, что наклон от п1 к Q такой же, как уклон от S1 к S2.) Эффект лечения - это разница между наблюдаемым и «нормальным» исходом (разница между P2 и Q).

Формальное определение

Рассмотрим модель

куда является зависимой переменной для индивидуальный и , группа, к которой принадлежит (т.е. к группе лечения или контрольной группе), и это сокращение для фиктивная переменная равно 1, когда событие, описанное в верно, и 0 в противном случае. В сюжете времени против по группе, является вертикальным пересечением графика для , и временной тренд, разделяемый обеими группами в соответствии с предположением о параллельном тренде (см. Предположения ниже). это лечебный эффект, и это остаточный срок.

Рассмотрим среднее значение зависимой переменной и фиктивных показателей по группам и времени:

и предположим для простоты, что и . Обратите внимание, что не случайно; он просто кодирует то, как маркируются группы и периоды. потом

В строгое предположение экзогенности тогда следует, что

Не теряя общий смысл, предположить, что группа лечения, и это период после, то и , давая оценку DID

что можно интерпретировать как лечебный эффект лечения, обозначенный . Ниже показано, как эта оценка может быть прочитана как коэффициент в обычной регрессии наименьших квадратов. Модель, описанная в этом разделе, является чрезмерно параметризованной; чтобы исправить это, один из коэффициентов для фиктивных переменных может быть установлен на 0, например, мы можем установить .

Предположения

Иллюстрация предположения о параллельном тренде

Все предположения Модель OLS в равной степени относятся к DID. Кроме того, для DID требуется предположение о параллельном тренде. Предположение о параллельном тренде говорит, что одинаковы в обоих и . Учитывая, что формальное определение выше точно отражает реальность, это предположение автоматически выполняется. Однако модель с вполне может быть более реалистичным. Чтобы повысить вероятность сохранения предположения о параллельном тренде, подход разницы в различиях часто сочетается с соответствие.[4] Это включает в себя «сопоставление» известных «лечебных» единиц с смоделированными контрфактическими «контрольными» единицами: характерно эквивалентными единицами, которые не получали лечения. Определив переменную результата как временную разницу (изменение наблюдаемого результата между периодами до и после лечения) и сопоставив несколько единиц в большой выборке на основе аналогичных историй до лечения, в результате СЪЕЛ (т. е. ATT: средний эффект лечения для пролеченных) обеспечивает надежную оценку разницы в разнице эффектов лечения. Это служит двум статистическим целям: во-первых, при условии наличия ковариат до обработки предположение о параллельных тенденциях, вероятно, будет верным; и, во-вторых, этот подход снижает зависимость от связанных допущений игнорирования, необходимых для правильного вывода.

Как показано справа, лечебный эффект представляет собой разницу между наблюдаемым значением у и какова ценность у было бы с параллельными тенденциями, если бы не было лечения. Ахиллесова пята DID - это когда что-то другое, кроме лечения, изменяется в одной группе, но не в другой одновременно с лечением, что подразумевает нарушение предположения о параллельном тренде.

Чтобы гарантировать точность оценки DID, предполагается, что состав лиц двух групп со временем не изменится. При использовании модели DID возникают различные проблемы, которые могут повлиять на результаты, например: автокорреляция[5] и Дипы Ashenfelter, должны быть рассмотрены и решены.

Выполнение

Метод DID может быть реализован в соответствии с таблицей ниже, где правая нижняя ячейка - это средство оценки DID.

Разница
+ Изменить

Тот же результат дает проведение регрессионного анализа. Рассмотрим модель OLS

куда фиктивная переменная для периода, равная когда , и фиктивная переменная для членства в группе, равная когда . Составная переменная фиктивная переменная, указывающая, когда . Хотя здесь это не показано строго, это правильная параметризация модели. формальное определение кроме того, оказывается, что средние по группе и периоду в этом разделе относятся к оценкам параметров модели следующим образом

куда обозначает условные средние, вычисленные по выборке, например, - показатель последующего периода, - показатель для контрольной группы. Чтобы увидеть связь между этим обозначением и предыдущим разделом, рассмотрите, как указано выше, только одно наблюдение за период времени для каждой группы, затем

и так далее для других значений и , что эквивалентно

Но это выражение для лечебного эффекта, которое было дано в формальное определение и в приведенной выше таблице.

Кард и Крюгер (1994) пример

Рассмотрим одно из самых известных исследований DID - Карта и Крюгер статья о минимальная заработная плата в Нью-Джерси, опубликовано в 1994 году.[6] Кард и Крюгер сравнили занятость в быстрое питание сектор в Нью-Джерси и в Пенсильвания в феврале 1992 г. и в ноябре 1992 г., после того как минимальная заработная плата в Нью-Джерси выросла с 4,25 долл. до 5,05 долл. в апреле 1992 г. Наблюдение за изменением занятости только в Нью-Джерси до и после лечения не позволило бы контролировать пропущенные переменные такие как погодные и макроэкономические условия региона. Путем включения Пенсильвании в качестве элемента управления в модель разницы в различиях любое смещение, вызванное переменными, общими для Нью-Джерси и Пенсильвании, неявно контролируется, даже если эти переменные не наблюдаются. Если предположить, что в Нью-Джерси и Пенсильвании наблюдаются параллельные тенденции во времени, изменение занятости в Пенсильвании можно интерпретировать как изменение, которое произошло бы в Нью-Джерси, если бы они не повысили минимальную заработную плату, и наоборот. Факты свидетельствуют о том, что повышение минимальной заработной платы не привело к сокращению занятости в Нью-Джерси, вопреки предположениям упрощенной экономической теории. В таблице ниже приведены оценки Card & Krueger воздействия лечения на занятость, измеренные как FTE (или эквиваленты полной занятости). Кард и Крюгер подсчитали, что повышение минимальной заработной платы на $ 0,80 в Нью-Джерси привело к увеличению занятости на 2,75 евро.

Нью-ДжерсиПенсильванияРазница
Февраль20.4423.33−2.89
Ноябрь21.0321.17−0.14
+ Изменить0.59−2.162.75

Смотрите также

Рекомендации

  1. ^ Абади, А. (2005). «Полупараметрические оценщики разности разностей». Обзор экономических исследований. 72 (1): 1–19. CiteSeerX  10.1.1.470.1475. Дои:10.1111/0034-6527.00321.
  2. ^ Бертран, М .; Дюфло, Э.; Муллайнатан, С. (2004). "Насколько мы должны доверять оценкам разницы в различиях?" (PDF). Ежеквартальный журнал экономики. 119 (1): 249–275. Дои:10.1162/003355304772839588. S2CID  470667.
  3. ^ Angrist, J.D .; Пишке, Дж. С. (2008). В основном безвредная эконометрика: соратник эмпирика. Издательство Принстонского университета. С. 227–243. ISBN  978-0-691-12034-8.
  4. ^ Басу, Паллави; Маленький, Дилан (2020). «Создание более согласованной контрольной группы в анализе различий в различиях: его влияние на историю, взаимодействующее с групповым предубеждением» (PDF). Наблюдательные исследования. 6: 103–130.
  5. ^ Бертран, Марианна; Дюфло, Эстер; Муллайнатан, Сендхил (2004). «Насколько мы должны доверять оценкам разницы в различиях?» (PDF). Ежеквартальный журнал экономики. 119 (1): 249–275. Дои:10.1162/003355304772839588. S2CID  470667.
  6. ^ Карточка, Дэвид; Крюгер, Алан Б. (1994). «Минимальная заработная плата и занятость: пример индустрии быстрого питания в Нью-Джерси и Пенсильвании». Американский экономический обзор. 84 (4): 772–793. JSTOR  2118030.

дальнейшее чтение

внешняя ссылка