Разница в различиях - Difference in differences

Разница в различиях (СДЕЛАЛ^[1] или же DD^[2]) это статистический метод используется в эконометрика и количественные исследования в социальных науках, который пытается имитировать план экспериментального исследования с помощью данные наблюдательного исследования, изучая дифференциальный эффект лечения на «лечебную группу» по сравнению с «контрольная группа ' в естественный эксперимент.^[3] Он рассчитывает эффект лечения (т. Е. Объясняющую переменную или независимая переменная ) на результат (т. е. переменная ответа или зависимая переменная ) путем сравнения среднего изменения во времени переменной результата для экспериментальной группы со средним изменением во времени для контрольной группы. Хотя он предназначен для смягчения воздействия посторонних факторов и критерий отбора, в зависимости от того, как выбрана группа лечения, этот метод все же может быть предметом определенных предубеждений (например, средняя регрессия, обратная причинность и смещение пропущенной переменной ).

В отличие от оценка временного ряда воздействия лечения на субъектов (который анализирует различия во времени) или перекрестной оценки эффекта лечения (который измеряет разницу между лечебной и контрольной группами), разница в использовании различий данные панели для измерения различий между экспериментальной и контрольной группой изменений переменной результата, происходящих с течением времени.

Общее определение

Разница в различиях требует данных, измеренных для экспериментальной группы и контрольной группы в два или более разных периода времени, в частности, по меньшей мере, один период времени до «лечения» и по меньшей мере один период времени после «лечения». В изображенном примере результат в экспериментальной группе представлен линией P, а результат в контрольной группе представлен линией S. Исходная (зависимая) переменная в обеих группах измеряется в момент времени 1, до того, как любая группа получили лечение (т.е. независимую или объясняющую переменную), представленное точками п₁ и S₁. Затем группа лечения получает или подвергается лечению, и обе группы снова измеряются во время 2. Не вся разница между экспериментальной и контрольной группами во время 2 (то есть разница между п₂ и S₂) можно объяснить как эффект лечения, потому что экспериментальная группа и контрольная группа не начинали в один и тот же момент времени 1. Таким образом, DID вычисляет «нормальную» разницу в переменной результата между двумя группами (разница которые все еще существовали бы, если бы ни одна из групп не проходила лечение), представленный пунктирной линией Q. (Обратите внимание, что наклон от п₁ к Q такой же, как уклон от S₁ к S₂.) Эффект лечения - это разница между наблюдаемым и «нормальным» исходом (разница между P₂ и Q).

Формальное определение

Рассмотрим модель

{ displaystyle y_ {it} ~ = ~ gamma _ {s (i)} + lambda _ {t} + delta I + varepsilon _ {it}}

куда ${ displaystyle y_ {it}}$ является зависимой переменной для индивидуальный ${ displaystyle i}$ и ${ displaystyle t}$ , ${ Displaystyle s (я)}$ группа, к которой ${ displaystyle i}$ принадлежит (т.е. к группе лечения или контрольной группе), и ${ Displaystyle I ( точки)}$ это сокращение для фиктивная переменная равно 1, когда событие, описанное в ${ Displaystyle ( точки)}$ верно, и 0 в противном случае. В сюжете времени против ${ displaystyle Y}$ по группе, ${ displaystyle gamma _ {s}}$ является вертикальным пересечением графика для ${ displaystyle s}$ , и ${ displaystyle lambda _ {t}}$ временной тренд, разделяемый обеими группами в соответствии с предположением о параллельном тренде (см. Предположения ниже). ${ displaystyle delta}$ это лечебный эффект, и ${ displaystyle varepsilon _ {it}}$ это остаточный срок.

Рассмотрим среднее значение зависимой переменной и фиктивных показателей по группам и времени:

{ displaystyle { begin {align} n_ {s} & = { text {количество человек в группе}} s { overline {y}} _ {st} & = { frac {1} {n_ {s}}} sum _ {i = 1} ^ {n} y_ {it} I (s (i) ~ = ~ s), { overline { gamma}} _ {s} & = { frac {1} {n_ {s}}} sum _ {i = 1} ^ {n} gamma _ {s} (i) I (s (i) ~ = ~ s) ~ = ~ гамма _ {s}, { overline { lambda}} _ {st} & = { frac {1} {n_ {s}}} sum _ {i = 1} ^ {n} lambda _ {t} I (s (i) ~ = ~ s) ~ = ~ lambda _ {t}, D_ {st} & = { frac {1} {n_ {s}}} sum _ { i = 1} ^ {n} I (s (i) ~ = ~ { text {обращение,}} t { text {in после периода}}) I (s (i) ~ = ~ s) ~ = ~ I (s ~ = ~ { text {treatment,}} t { text {in after period}}), { overline { varepsilon}} _ {st} & = { frac {1} { n_ {s}}} sum _ {i = 1} ^ {n} varepsilon _ {it} I (s (i) ~ = ~ s), end {align}}}

и предположим для простоты, что ${ displaystyle s = 1,2}$ и ${ displaystyle t = 1,2}$ . Обратите внимание, что ${ displaystyle D_ {st}}$ не случайно; он просто кодирует то, как маркируются группы и периоды. потом

{ displaystyle { begin {align} & ({ overline {y}} _ {11} - { overline {y}} _ {12}) - ({ overline {y}} _ {21} - { overline {y}} _ {22}) [6pt] = {} & { big [} ( gamma _ {1} + lambda _ {1} + delta D_ {11} + { overline { varepsilon}} _ {11}) - ( gamma _ {1} + lambda _ {2} + delta D_ {12} + { overline { varepsilon}} _ {12}) { big] } & qquad {} - { big [} ( gamma _ {2} + lambda _ {1} + delta D_ {21} + { overline { varepsilon}} _ {21}) - ( gamma _ {2} + lambda _ {2} + delta D_ {22} + { overline { varepsilon}} _ {22}) { big]} [6pt] = {} & дельта (D_ {11} -D_ {12}) + delta (D_ {22} -D_ {21}) + { overline { varepsilon}} _ {11} - { overline { varepsilon}} _ { 12} + { overline { varepsilon}} _ {22} - { overline { varepsilon}} _ {21}. End {выравнивается}}}

В строгое предположение экзогенности тогда следует, что

{ displaystyle operatorname {E} left [({ overline {y}} _ {11} - { overline {y}} _ {12}) - ({ overline {y}} _ {21} - { overline {y}} _ {22}) right] ~ = ~ delta (D_ {11} -D_ {12}) + delta (D_ {22} -D_ {21}).}

Не теряя общий смысл, предположить, что ${ displaystyle s = 2}$ группа лечения, и ${ displaystyle t = 2}$ это период после, то ${ displaystyle D_ {22} = 1}$ и ${ displaystyle D_ {11} = D_ {12} = D_ {21} = 0}$ , давая оценку DID

{ displaystyle { hat { delta}} ~ = ~ ({ overline {y}} _ {11} - { overline {y}} _ {12}) - ({ overline {y}} _ { 21} - { overline {y}} _ {22}),}

что можно интерпретировать как лечебный эффект лечения, обозначенный ${ displaystyle D_ {st}}$ . Ниже показано, как эта оценка может быть прочитана как коэффициент в обычной регрессии наименьших квадратов. Модель, описанная в этом разделе, является чрезмерно параметризованной; чтобы исправить это, один из коэффициентов для фиктивных переменных может быть установлен на 0, например, мы можем установить ${ displaystyle gamma _ {1} = 0}$ .

Предположения

Иллюстрация предположения о параллельном тренде

Все предположения Модель OLS в равной степени относятся к DID. Кроме того, для DID требуется предположение о параллельном тренде. Предположение о параллельном тренде говорит, что ${ displaystyle lambda _ {2} - lambda _ {1}}$ одинаковы в обоих ${ displaystyle s = 1}$ и ${ displaystyle s = 2}$ . Учитывая, что формальное определение выше точно отражает реальность, это предположение автоматически выполняется. Однако модель с ${ displaystyle lambda _ {st} ~: ~ lambda _ {22} - lambda _ {21} neq lambda _ {12} - lambda _ {11}}$ вполне может быть более реалистичным. Чтобы повысить вероятность сохранения предположения о параллельном тренде, подход разницы в различиях часто сочетается с соответствие.^[4] Это включает в себя «сопоставление» известных «лечебных» единиц с смоделированными контрфактическими «контрольными» единицами: характерно эквивалентными единицами, которые не получали лечения. Определив переменную результата как временную разницу (изменение наблюдаемого результата между периодами до и после лечения) и сопоставив несколько единиц в большой выборке на основе аналогичных историй до лечения, в результате СЪЕЛ (т. е. ATT: средний эффект лечения для пролеченных) обеспечивает надежную оценку разницы в разнице эффектов лечения. Это служит двум статистическим целям: во-первых, при условии наличия ковариат до обработки предположение о параллельных тенденциях, вероятно, будет верным; и, во-вторых, этот подход снижает зависимость от связанных допущений игнорирования, необходимых для правильного вывода.

Как показано справа, лечебный эффект представляет собой разницу между наблюдаемым значением у и какова ценность у было бы с параллельными тенденциями, если бы не было лечения. Ахиллесова пята DID - это когда что-то другое, кроме лечения, изменяется в одной группе, но не в другой одновременно с лечением, что подразумевает нарушение предположения о параллельном тренде.

Чтобы гарантировать точность оценки DID, предполагается, что состав лиц двух групп со временем не изменится. При использовании модели DID возникают различные проблемы, которые могут повлиять на результаты, например: автокорреляция^[5] и Дипы Ashenfelter, должны быть рассмотрены и решены.

Выполнение

Метод DID может быть реализован в соответствии с таблицей ниже, где правая нижняя ячейка - это средство оценки DID.

${ displaystyle y_ {st}}$	${ displaystyle s = 2}$	${ displaystyle s = 1}$	Разница
${ displaystyle t = 2}$	${ displaystyle y_ {22}}$	${ displaystyle y_ {12}}$	${ displaystyle y_ {12} -y_ {22}}$
${ displaystyle t = 1}$	${ displaystyle y_ {21}}$	${ displaystyle y_ {11}}$	${ displaystyle y_ {11} -y_ {21}}$
+ Изменить	${ displaystyle y_ {21} -y_ {22}}$	${ displaystyle y_ {11} -y_ {12}}$	${ displaystyle (y_ {11} -y_ {21}) - (y_ {12} -y_ {22})}$

Тот же результат дает проведение регрессионного анализа. Рассмотрим модель OLS

{ displaystyle y ~ = ~ beta _ {0} + beta _ {1} T + beta _ {2} S + beta _ {3} (T cdot S) + varepsilon}

куда ${ displaystyle T}$ фиктивная переменная для периода, равная ${ displaystyle 1}$ когда ${ displaystyle t = 2}$ , и ${ displaystyle S}$ фиктивная переменная для членства в группе, равная ${ displaystyle 1}$ когда ${ displaystyle s = 2}$ . Составная переменная ${ Displaystyle (Т cdot S)}$ фиктивная переменная, указывающая, когда ${ Displaystyle S = T = 1}$ . Хотя здесь это не показано строго, это правильная параметризация модели. формальное определение кроме того, оказывается, что средние по группе и периоду в этом разделе относятся к оценкам параметров модели следующим образом

{ displaystyle { begin {align} { hat { beta}} _ {0} & = { widehat {E}} (y ​​ mid T = 0, ~ S = 0) [8pt] { hat { beta}} _ {1} & = { widehat {E}} (y ​​ mid T = 1, ~ S = 0) - { widehat {E}} (y ​​ mid T = 0, ~ S = 0) [8pt] { hat { beta}} _ {2} & = { widehat {E}} (y ​​ mid T = 0, ~ S = 1) - { widehat {E}} (y mid T = 0, ~ S = 0) [8pt] { hat { beta}} _ {3} & = { big [} { widehat {E}} (y ​​ mid T = 1, ~ S = 1) - { widehat {E}} (y ​​ mid T = 0, ~ S = 1) { big]} & qquad {} - { big [} { widehat { E}} (y ​​ mid T = 1, ~ S = 0) - { widehat {E}} (y ​​ mid T = 0, ~ S = 0) { big]}, end {align}}}

куда ${ Displaystyle { widehat {E}} ( точки середины точки)}$ обозначает условные средние, вычисленные по выборке, например, ${ displaystyle T = 1}$ - показатель последующего периода, ${ displaystyle S = 0}$ - показатель для контрольной группы. Чтобы увидеть связь между этим обозначением и предыдущим разделом, рассмотрите, как указано выше, только одно наблюдение за период времени для каждой группы, затем

{ displaystyle { begin {align} { widehat {E}} (y ​​ mid T = 1, ~ S = 0) & = { widehat {E}} (y ​​ mid { text {после точки, контроль }}) [3pt] & = { frac {{ widehat {E}} (y ​​ I ({ text {после точки, control}}))} {{ widehat {P}} ( { text {после точки, контроль}})}} [3pt] & = { frac { sum _ {i = 1} ^ {n} y_ {i, { text {after}}} I (i { text {in control}})} {n _ { text {control}}}} = { overline {y}} _ { text {control, after}} [3pt] & = { overline {y}} _ { text {12}} end {align}}}

и так далее для других значений ${ displaystyle T}$ и ${ displaystyle S}$ , что эквивалентно

{ displaystyle { hat { beta}} _ {3} ~ = ~ (y_ {11} -y_ {21}) - (y_ {12} -y_ {22}).}

Но это выражение для лечебного эффекта, которое было дано в формальное определение и в приведенной выше таблице.

Кард и Крюгер (1994) пример

Рассмотрим одно из самых известных исследований DID - Карта и Крюгер статья о минимальная заработная плата в Нью-Джерси, опубликовано в 1994 году.^[6] Кард и Крюгер сравнили занятость в быстрое питание сектор в Нью-Джерси и в Пенсильвания в феврале 1992 г. и в ноябре 1992 г., после того как минимальная заработная плата в Нью-Джерси выросла с 4,25 долл. до 5,05 долл. в апреле 1992 г. Наблюдение за изменением занятости только в Нью-Джерси до и после лечения не позволило бы контролировать пропущенные переменные такие как погодные и макроэкономические условия региона. Путем включения Пенсильвании в качестве элемента управления в модель разницы в различиях любое смещение, вызванное переменными, общими для Нью-Джерси и Пенсильвании, неявно контролируется, даже если эти переменные не наблюдаются. Если предположить, что в Нью-Джерси и Пенсильвании наблюдаются параллельные тенденции во времени, изменение занятости в Пенсильвании можно интерпретировать как изменение, которое произошло бы в Нью-Джерси, если бы они не повысили минимальную заработную плату, и наоборот. Факты свидетельствуют о том, что повышение минимальной заработной платы не привело к сокращению занятости в Нью-Джерси, вопреки предположениям упрощенной экономической теории. В таблице ниже приведены оценки Card & Krueger воздействия лечения на занятость, измеренные как FTE (или эквиваленты полной занятости). Кард и Крюгер подсчитали, что повышение минимальной заработной платы на $ 0,80 в Нью-Джерси привело к увеличению занятости на 2,75 евро.

	Нью-Джерси	Пенсильвания	Разница
Февраль	20.44	23.33	−2.89
Ноябрь	21.03	21.17	−0.14
+ Изменить	0.59	−2.16	2.75

Смотрите также

дальнейшее чтение

Angrist, J.D .; Пишке, Дж. С. (2008). В основном безвредная эконометрика: соратник эмпирика. Издательство Принстонского университета. С. 227–243. ISBN 978-0-691-12034-8.
Кэмерон, Артур С .; Триведи, Правин К. (2005). Микроэконометрика: методы и приложения. Пресса Кембриджского университета. С. 768–772. Дои:10.1017 / CBO9780511811241. ISBN 9780521848053.
Imbens, Guido W .; Вулдридж, Джеффри М. (2009). «Последние изменения в эконометрике оценки программ». Журнал экономической литературы. 47 (1): 5–86. Дои:10.1257 / jel.47.1.5.
Бакиджа, Джон; Хайм, Брэдли (август 2008 г.). «Как благотворительные пожертвования соответствуют стимулам и доходам? Динамическая панель оценивает с учетом прогнозируемых изменений в налогообложении». Рабочий документ NBER № 14237. Дои:10.3386 / w14237.
Conley, T .; Табер, К. (июль 2005 г.). «Заключение о« различиях в различиях »при небольшом количестве изменений политики». Технический рабочий документ NBER № 312. Дои:10,3386 / t0312.

внешняя ссылка

Разница в оценке разницы, Сайт экономиста здравоохранения

[1] Абади, А. (2005). «Полупараметрические оценщики разности разностей». Обзор экономических исследований. 72 (1): 1–19. CiteSeerX 10.1.1.470.1475. Дои:10.1111/0034-6527.00321.

[Bertrand-2] Бертран, М .; Дюфло, Э.; Муллайнатан, С. (2004). "Насколько мы должны доверять оценкам разницы в различиях?" (PDF). Ежеквартальный журнал экономики. 119 (1): 249–275. Дои:10.1162/003355304772839588. S2CID 470667.

[3] Angrist, J.D .; Пишке, Дж. С. (2008). В основном безвредная эконометрика: соратник эмпирика. Издательство Принстонского университета. С. 227–243. ISBN 978-0-691-12034-8.

[4] Басу, Паллави; Маленький, Дилан (2020). «Создание более согласованной контрольной группы в анализе различий в различиях: его влияние на историю, взаимодействующее с групповым предубеждением» (PDF). Наблюдательные исследования. 6: 103–130.

[5] Бертран, Марианна; Дюфло, Эстер; Муллайнатан, Сендхил (2004). «Насколько мы должны доверять оценкам разницы в различиях?» (PDF). Ежеквартальный журнал экономики. 119 (1): 249–275. Дои:10.1162/003355304772839588. S2CID 470667.

[6] Карточка, Дэвид; Крюгер, Алан Б. (1994). «Минимальная заработная плата и занятость: пример индустрии быстрого питания в Нью-Джерси и Пенсильвании». Американский экономический обзор. 84 (4): 772–793. JSTOR 2118030.

[1]

[2]

[3]

[4]

[5]

[6]