Местный средний лечебный эффект - Local average treatment effect

В местный средний лечебный эффект (ПОЗДНО), также известный как усредненный причинно-следственный эффект (CACE), был впервые введен в эконометрическую литературу Гвидо В. Имбенс и Джошуа Д. Ангрист в 1994 г.[1] Это эффект лечения для подмножества выборки, которая подвергается лечению тогда и только тогда, когда они были назначены лечению, иначе называемым исполнителями. Не следует путать с средний лечебный эффект (ATE), который представляет собой средний эффект лечения на уровне субъекта; ПОЗДНИЙ - это только ATE среди исполнителей. ПОЗДНЕЕ может быть оценено как отношение предполагаемого эффекта «намерение к лечению» и расчетной доли исполнителей, или, альтернативно, через инструментальная переменная оценщик.

Общее определение

Следуя терминологии из структура потенциальных результатов, ATE - это разница между ожидаемым значением для экспериментальной группы и ожидаемым значением для контрольной группы. В экспериментальных условиях случайное распределение позволяет нам предположить, что группа лечения и контрольная группа имеют одинаковые ожидаемые потенциальные результаты при лечении (или отсутствии лечения). Это можно выразить как:

В идеальном эксперименте все субъекты, назначенные для лечения, получают лечение, в то время как те, которые назначены для контроля, остаются без лечения. В действительности, однако, уровень соответствия часто бывает несовершенным, что не позволяет исследователям идентифицировать ATE. В таких случаях оценка ПОЗДНЕГО становится более возможным вариантом. ПОЗДНЕЕ - это средний эффект лечения среди определенной подгруппы субъектов, которые в этом случае будут соблюдать требования.

Схема и обозначение потенциальных результатов

Позволять обозначает потенциальный результат субъекта i, где d - бинарный показатель субъекта Статус лечения. обозначает потенциальный результат лечения для субъекта i, а обозначает необработанный потенциальный результат. Причинный эффект лечения на субъект является . Однако мы никогда не сможем наблюдать оба и по той же теме. В любой момент времени мы можем наблюдать за объектом только в его обработанном или необработанный государственный.

Посредством случайного распределения ожидаемый потенциальный исход без лечения для контрольной группы такой же, как и для группы лечения, а ожидаемый потенциальный результат лечения для группы лечения такой же, как и у контрольной группы. Таким образом, допущение случайного распределения позволяет нам принять разницу между средним результатом в экспериментальной группе и средним результатом в контрольной группе как общий средний эффект лечения, так что:

Структура несоблюдения

Довольно часто исследователи сталкиваются с проблемами несоблюдения в своих экспериментах, когда субъекты не выполняют свои экспериментальные задания. Некоторые субъекты не будут принимать лечение, когда они будут включены в группу лечения, поэтому их потенциальный результат не будут раскрыты, в то время как некоторые субъекты, отнесенные к контрольной группе, будут проходить лечение, поэтому они не будут раскрывать свои .

Учитывая несоблюдение, популяцию в эксперименте можно разделить на четыре подгруппы: соблюдающие, всегда берущие, никогда не берущие и бросающие вызов. Затем мы представляем как бинарный индикатор экспериментального назначения, такой, что когда , предмет назначается лечение, а когда , предмет возложена на контроль. Таким образом, представляет, является ли предмет лечится или нет, когда назначено лечение .

Комплайеры - это субъекты, которые будут принимать лечение тогда и только тогда, когда они были отнесены к группе лечения, то есть субпопуляции с и .

Несоответствующие состоят из трех оставшихся подгрупп:

  • Всегда принимающие - это субъекты, которые всегда будут принимать лечение, даже если они были отнесены к контрольной группе, то есть субпопуляции с
  • Никогда не принимающие - это субъекты, которые никогда не будут принимать лечение, даже если они были отнесены к группе лечения, то есть субпопуляции с
  • Бросающие вызов - это субъекты, которые будут делать противоположное их статусу назначения лечения, то есть субпопуляция с и

Несоблюдение может иметь две формы. В случае одностороннего несоблюдения режима некоторые субъекты, которые были отнесены к группе лечения, остаются без лечения. Таким образом, испытуемые делятся на соблюдающих и не принимающих, так что для всех , пока 0 или 1. В случае двустороннего несоблюдения режима лечения ряд субъектов, отнесенных к группе лечения, не получают лечение, в то время как ряд субъектов, отнесенных к контрольной группе, получают лечение. В этом случае испытуемые делятся на четыре подгруппы, так что обе и может быть 0 или 1.

Учитывая несоответствие, нам необходимы определенные предположения для оценки ПОЗДНЕГО. Под односторонним несоблюдением мы подразумеваем невмешательство и исключаемость. Под двусторонним несоблюдением мы подразумеваем невмешательство, исключимость и монотонность.

Предположения при одностороннем несоблюдении

  • Предположение о невмешательстве, также известное как допущение о стабильной единице лечебной стоимости (SUTVA), состоит из двух частей.[2]
    • Первая часть этого предположения предусматривает, что фактический статус лечения, , предмета зависит только от статуса назначения лечения субъектом, . Статус назначения лечения других субъектов не повлияет на статус лечения субъекта. . Формально, если , тогда , куда обозначает вектор статуса назначения лечения для всех людей.[3]
    • Вторая часть этого предположения предусматривает, что субъект на потенциальные результаты влияет его собственное назначение лечения и лечение, которое он получает в результате этого назначения. Назначение лечения и статус лечения других субъектов не повлияют на субъекта. результаты. Формально, если и , тогда .
    • Правдоподобность предположения о невмешательстве должна оцениваться в каждом конкретном случае.
  • Предположение об исключительности требует, чтобы потенциальные результаты зависели от самого лечения. , а не назначение лечения, . Формально . Таким образом, при этом предположении только имеет значение.[4] Правдоподобность допущения об исключительности также необходимо оценивать в каждом конкретном случае.

Предположения при двустороннем несоблюдении

  • Все вышеперечисленное и
  • Предположение о монотонности, т.е. для всего предмета , . Это означает, что всякий раз, когда субъект переходит из контрольной группы в лечебную либо остается без изменений, либо увеличивается. Предположение о монотонности исключает опровергающих, поскольку их потенциальные результаты характеризуются: .[1] Монотонность не может быть проверена, поэтому, как и предположения о невмешательстве и исключительности, ее достоверность должна определяться в каждом конкретном случае.

Идентификация

В , Посредством чего

В измеряет средний эффект экспериментального назначения на исходы без учета доли группы, которая фактически подвергалась лечению (то есть среднее значение группы, назначенной на лечение, минус среднее значение группы, назначенной для контроля). В экспериментах с полным соблюдением .

В измеряет долю субъектов, которых лечили, когда они были отнесены к лечебной группе, за вычетом доли, которую лечили бы, даже если бы они были отнесены к контрольной группе, т.е. = доля исполнителей.

Доказательство

При одностороннем несоблюдении режима все субъекты, отнесенные к контрольной группе, не будут принимать лечение, поэтому:[3] ,

так что

Если бы все пациенты были назначены на лечение, ожидаемые потенциальные результаты были бы средневзвешенными из обработанных потенциальных результатов среди собеседников и необработанных потенциальных результатов среди тех, кто его не принимал, так что

Однако, если бы все субъекты были отнесены к контролю, ожидаемые потенциальные результаты были бы средневзвешенными для необработанных потенциальных результатов среди соблюдающих и никогда не принимавших участие, так что

Посредством замены мы можем выразить ITT как средневзвешенное ITT среди двух субпопуляций (соблюдающих и никогда не берущих), так что

Принимая во внимание исключение и предположение о монотонности, вторая половина этого уравнения должна быть равна нулю.

В качестве таких,

Применение: гипотетический график возможных результатов при двустороннем несоблюдении.

В таблице ниже представлен гипотетический график возможных результатов при двустороннем несоблюдении.

ATE рассчитывается как среднее значение

Гипотетический график возможных результатов при двустороннем несоблюдении
НаблюдениеТип
147301Complier
235200Никогда не берущий
315401Complier
458311Всегда готовый
5410601Complier
628600Никогда не берущий
7610401Complier
859401Complier
925311Всегда готовый

ПОЗДНЕЕ рассчитывается ATE среди поставщиков, поэтому

ITT рассчитывается как среднее значение ,

так

доля исполнителей

Другое: ПОЗДНО в структуре инструментальных переменных

Мы также можем думать о LATE через структуру IV.[5] Назначение лечения это инструмент, который влияет на результат через интересующую переменную , так что только влияет через эндогенную переменную , и никаким другим путем. Это дало бы лечебный эффект для исполнителей.

В дополнение к схеме потенциальных результатов, упомянутой выше, ПОЗДНЕЕ также можно оценить с помощью Структурное моделирование (SEM) framework, изначально разработанный для эконометрических приложений.

SEM выводится с помощью следующих уравнений:

Первое уравнение отражает эффект первого этапа на , с поправкой на дисперсию, где

Второе уравнение захватывает эффект уменьшенной формы на ,

Оценщик IV с поправкой на ковариацию представляет собой отношение

Как и в предположении ненулевого соответствия, коэффициент на первом этапе регрессия должна быть значительной, чтобы действующий инструмент.

Однако из-за строгого допущения SEM о постоянном воздействии на каждого человека структура потенциальных результатов сегодня используется более широко.

Обобщение ПОЗДНЕГО

Основная цель проведения эксперимента - получить причинно-следственные связи, и это достигается путем случайного распределения субъектов в экспериментальные условия, что отличает его от наблюдательных исследований. В эксперименте с идеальным соблюдением режима можно легко получить средний лечебный эффект. Однако во многих экспериментах может наблюдаться как одностороннее, так и двустороннее несоблюдение. При наличии несоответствия восстановление ATE невозможно. Вместо этого восстанавливается средний эффект лечения для определенной субпопуляции, известной как «соблюдающие требования», то есть ПОЗДНЕГО.

Когда могут существовать неоднородные эффекты лечения в разных группах, LATE вряд ли будет эквивалентно ATE. В одном примере, Angrist (1989)[6] пытается оценить причинное влияние службы в армии на заработок, используя призывную лотерею в качестве инструмент. Собеседники - это те, кого призывная лотерея побудила служить в армии. Если исследовательский интерес заключается в том, как компенсировать вынужденно облагаемым налогом призывником, LATE было бы полезно, поскольку исследование нацелено на составителей. Однако, если исследователи озабочены более универсальным проектом для будущей интерпретации, то ATE будет более важным (Imbens 2009).[1]

Таким образом, обобщение от ПОЗДНЕГО к ATE становится важным вопросом, когда исследовательский интерес заключается в причинно-следственном эффекте лечения на более широкую популяцию, а не только на исполнителей. В этих случаях ПОЗДНЕЕ может не быть интересующим параметром, и исследователи сомневаются в его полезности.[7][8] Другие исследователи, однако, противостояли этой критике, предложив новые методы обобщения от ПОЗДНЕГО к АТЕ.[9][10][11] Большинство из них включают некоторую форму повторного взвешивания ПОЗДНЕГО с определенными ключевыми допущениями, которые позволяют экстраполировать данные от разработчиков.

Повторный взвешивание

Интуиция, лежащая в основе повторного взвешивания, исходит из представления о том, что с учетом определенных слоев распределение между составителями может не отражать распределение более широкой совокупности. Таким образом, чтобы получить ATE, необходимо изменить вес на основе информации, полученной от поставщиков. Есть несколько способов, которыми можно использовать повторное взвешивание, чтобы попытаться получить ATE с ПОЗДНЕГО.

Повторный взвешивание на основании предположения о незнании

Используя инструментальная переменная, Ароноу и Карнеги (2013)[9] предложить новый метод повторного взвешивания под названием Inverse Compliance Score Weighting (ICSW), опираясь на аналогичную интуицию IPW. Этот метод предполагает, что склонность к комплаенсу является ковариантой до начала лечения, и соблюдающие требования будут иметь одинаковый средний эффект лечения в пределах своей страты. ICSW сначала оценивает условную вероятность соблюдения требований (оценка соответствия) для каждого предмета по Оценка максимального правдоподобия учитывая управление ковариатами, затем повторно взвешивает каждую единицу по ее обратной оценке соответствия, так чтобы составители имели ковариатное распределение, соответствующее всей совокупности. ICSW применим как на односторонний и двустороннее несоблюдение ситуация.

Хотя чью-то оценку соответствия нельзя непосредственно наблюдать, вероятность соответствия можно оценить, наблюдая за условием соответствия для одних и тех же слоев, другими словами, тех, которые имеют один и тот же ковариативный профиль. Оценка комплаентности рассматривается как латентная ковариата до лечения, которая не зависит от назначения лечения. . Для каждой единицы , оценка соответствия обозначается как , куда ковариантный вектор для единицы .

В одностороннее несоблюдение В этом случае население состоит только из тех, кто соблюдает правила, и ничего не делает. Все единицы, отнесенные к группе лечения, которая принимает лечение, будут соблюдать. Таким образом, простая двумерная регрессия D по X может предсказать вероятность соответствия.

В двустороннее несоблюдение случае оценка соответствия оценивается с использованием оценка максимального правдоподобия.

Предполагая пробит распространение на соответствие и распределения Бернулли D,

куда .

и - вектор ковариант для оценки, - кумулятивная функция распределения для пробит модель

  • Оценщик ICSW

По поздней теореме[1]  средний лечебный эффект для исполнителей можно оценить с помощью уравнения:

Определять оценка ICSW просто взвешивается по:

Эта оценка эквивалентна использованию 2SLS оценщик с весом.

  • Основные допущения при изменении веса

Существенное допущение ICSW, основанное на однородности обработки внутри слоев, что означает, что эффект обработки должен быть в среднем одинаковым для всех в стратах, а не только для исполнителей. Если это предположение верно, LATE равно ATE в некотором ковариатном профиле. Обозначим как:

Обратите внимание, что это менее ограничительное предположение, чем традиционное невежество предположение, поскольку это касается только наборов ковариат, которые имеют отношение к оценке соответствия, что в дальнейшем приводит к неоднородности, без учета всех наборов ковариат.

Второе предположение - непротиворечивость за и третье предположение - ненулевое соответствие для каждой страты, которое является расширением предположения IV о ненулевом соответствии по совокупности. Это разумное предположение, так как если для определенных слоев оценка соответствия равна нулю, то обратная оценка будет бесконечной.

Оценщик ICSW более разумен, чем оценщик IV, поскольку он включает больше ковариантной информации, так что оценщик может иметь более высокие дисперсии. Это общая проблема для оценки в стиле IPW. Проблема усугубляется, когда в определенных слоях имеется лишь небольшая популяция, а уровень соблюдения требований низкий. Один из способов скомпрометировать это, чтобы выиграть оценки, в этой статье они устанавливают порог = 0,275. Если оценка соответствия ниже 0,275, она заменяется этим значением. Bootstrap также рекомендуется во всем процессе, чтобы уменьшить неопределенность (Abadie 2002).[12]

Перевзвешивание в предположении монотонности

При другом подходе можно предположить, что лежащая в основе полезная модель связывает тех, кто никогда не берут, соблюдает и всегда принимает. ATE можно оценить путем повторного взвешивания, основанного на экстраполяции потенциальных результатов лечения и необработанного поставщика на тех, кто не принимает и всегда принимает. Следующий метод был предложен Амандой Ковальски.[11]

Во-первых, предполагается, что у всех субъектов есть функция полезности, определяемая их индивидуальными выгодами от лечения и затратами на лечение. Исходя из основного предположения о монотонности, никогда не берущие, соблюдающие и всегда берущие могут быть расположены в одном континууме на основе их функции полезности. Это предполагает, что постоянные пациенты получают такую ​​большую пользу от лечения, что будут принимать его даже без поддержки. С другой стороны, у тех, кто не берут, функция полезности настолько низкая, что они не будут принимать лечение, несмотря на поощрение. Таким образом, никогда не берущие могут быть согласованы с поставщиками с наименьшей полезностью, а неизменно берущие - с поставщиками с наибольшими функциями полезности.

В экспериментальной популяции можно наблюдать несколько аспектов: потенциальные результаты лечения для тех, кто всегда принимает (тех, кто проходит лечение в контрольной группе); необработанные потенциальные результаты тех, кто не принимал лекарство (тех, кто остается без лечения в группе лечения); потенциальные результаты лечения для тех, кто всегда принимает и соблюдает (тех, кто проходит лечение в группе лечения); и необработанные потенциальные результаты для тех, кто соблюдает и не берут (тех, кто не лечится в контрольной группе). Тем не менее, леченные и необработанные потенциальные результаты исполнителей должны быть извлечены из последних двух наблюдений. Для этого необходимо извлечь ПОЗДНЕЕ из популяции, подвергшейся лечению.

Предполагая, что противников нет, можно предположить, что группа лечения в условиях лечения состоит как из тех, кто всегда принимает, так и из тех, кто соблюдает. Из наблюдений за обработанными исходами в контрольной группе можно извлечь средний результат лечения для всегда принимающих, а также их долю в общей популяции. Таким образом, средневзвешенное значение может быть отменено, и может быть получен обработанный потенциальный результат для исполнителей; затем вычитается ПОЗДНЕЕ, чтобы получить необработанные потенциальные результаты для исполнителей. Этот шаг затем позволит выполнить экстраполяцию от поставщиков для получения ATE.

Возвращаясь к предположению о слабой монотонности, которое предполагает, что функция полезности всегда работает в одном направлении, полезность предельного комплиатора была бы аналогична полезности того, кто не берут, с одной стороны, и полезности всегда берущего с другой. конец. У всегда берущих будут те же необработанные потенциальные результаты, что и у исполнителей, что является их максимальным необработанным потенциальным результатом. Опять же, это основано на базовой модели полезности, связывающей подгруппы, которая предполагает, что функция полезности всегда берущего не будет ниже, чем функция полезности исполнителя. Та же самая логика применима к тем, кто никогда не берут, у которых, как предполагается, функция полезности всегда будет ниже, чем у сборщика.

Учитывая это, возможна экстраполяция путем проецирования необработанных потенциальных результатов исполнителей на тех, кто всегда принимает, а обработанных потенциальных результатов исполнителей - на тех, кто не принимает. Другими словами, если предполагается, что необработанные собеседники информативны о всегда берущих, а обработанные комплиенты информативны о тех, кто никогда не берут, то теперь возможно сравнение среди обработанных всегда берущих с их необработанными всегда «как если бы» -потребителей, а необработанных, никогда не принимавших, можно сравнить с их аналогами, которых лечили «как если бы». Это позволит рассчитать общий эффект лечения. Экстраполяция в предположении слабой монотонности даст оценку, а не точечную оценку.

Ограничения

Оценка экстраполяции к ATE из LATE требует определенных ключевых предположений, которые могут варьироваться от одного подхода к другому. Хотя некоторые могут предполагать однородность ковариат и, таким образом, экстраполировать их на основе слоев,[9] другие могут вместо этого предположить монотонность.[11] Все будут исходить из того, что среди экспериментальной популяции нет противников. Некоторые из этих предположений могут быть слабее других - например, предположение о монотонности слабее, чем предположение невежество предположение. Однако есть и другие компромиссы, которые следует учитывать, например, являются ли полученные оценки точечными или граничными. В конечном счете, литература по обобщению ПОЗДНЕГО периода полностью полагается на ключевые предположения. Это не подход, основанный на дизайне как таковой, и область экспериментов обычно не имеет привычки сравнивать группы, если они не распределены случайным образом. Даже в случае, когда предположения трудно проверить, исследователь может включить их через основу дизайна эксперимента. Например, в типичном полевом эксперименте, где инструментом является «поощрение к лечению», неоднородность лечения может быть обнаружена по различной интенсивности поощрения. Если уровень комплаентности остается стабильным при различной интенсивности, это может быть признаком однородности между группами. Таким образом, важно быть умным потребителем этой линии литературы и проверять, будут ли ключевые предположения верными в каждом экспериментальном случае.

Рекомендации

  1. ^ а б c d Imbens, Guido W .; Ангрист, Джошуа Д. (март 1994). «Выявление и оценка местных средних лечебных эффектов» (PDF). Econometrica. 62 (2): 467. Дои:10.2307/2951620. ISSN  0012-9682. JSTOR  2951620.
  2. ^ Рубин, Дональд Б. (январь 1978 г.). «Байесовский вывод причинных эффектов: роль рандомизации». Анналы статистики. 6 (1): 34–58. Дои:10.1214 / aos / 1176344064. ISSN  0090-5364.
  3. ^ а б Angrist, Джошуа Д.; Imbens, Guido W .; Рубин, Дональд Б. (июнь 1996 г.). «Идентификация причинных эффектов с использованием инструментальных переменных» (PDF). Журнал Американской статистической ассоциации. 91 (434): 444–455. Дои:10.1080/01621459.1996.10476902. ISSN  0162-1459.
  4. ^ Imbens, G.W .; Рубин, Д. Б. (01.10.1997). «Оценка распределений результатов для комплайеров в моделях инструментальных переменных». Обзор экономических исследований. 64 (4): 555–574. Дои:10.2307/2971731. ISSN  0034-6527. JSTOR  2971731.
  5. ^ Хэнк, Кристоф (2009-10-24). «Джошуа Д. Ангрист и Йорн-Штеффен Пишке (2009): В основном безвредная эконометрика: товарищ эмпирика». Статистические статьи. 52 (2): 503–504. Дои:10.1007 / s00362-009-0284-y. ISSN  0932-5026.
  6. ^ Ангрист, Джошуа (сентябрь 1990 г.). «Призывная лотерея и добровольная вербовка в эпоху Вьетнама». Кембридж, Массачусетс. Дои:10.3386 / w3514. Цитировать журнал требует | журнал = (помощь)
  7. ^ Дитон, Ангус (январь 2009 г.). «Инструменты развития: рандомизация в тропиках и поиск неуловимых ключей к экономическому развитию». Кембридж, Массачусетс. Дои:10.3386 / w14690. Цитировать журнал требует | журнал = (помощь)
  8. ^ Хекман, Джеймс Дж .; Урзуа, Серхио (май 2010 г.). «Сравнение IV со структурными моделями: что простая IV может и не может определить». Журнал эконометрики. 156 (1): 27–37. Дои:10.1016 / j.jeconom.2009.09.006. ISSN  0304-4076. ЧВК  2861784. PMID  20440375.
  9. ^ а б c Aronow, Питер М .; Карнеги, Эллисон (2013). «За пределами ПОЗДНЕГО: оценка среднего эффекта лечения с помощью инструментальной переменной». Политический анализ. 21 (4): 492–506. Дои:10.1093 / pan / mpt013. ISSN  1047-1987.
  10. ^ Имбенс, Гвидо В. (июнь 2010 г.). "Лучше ПОЗДНО, чем ничего: некоторые комментарии к Дитону (2009) и Хекману и Урзуа (2009)" (PDF). Журнал экономической литературы. 48 (2): 399–423. Дои:10.1257 / jel.48.2.399. ISSN  0022-0515.
  11. ^ а б c Ковальски, Аманда (2016). «Делать больше, когда вы бежите ПОЗЖЕ: применение методов маргинального эффекта лечения для изучения неоднородности эффекта лечения в экспериментах». Рабочий документ NBER № 22363. Дои:10.3386 / w22363.
  12. ^ Абади, Альберто (март 2002 г.). «Тесты начальной загрузки для эффектов распределения в моделях инструментальных переменных». Журнал Американской статистической ассоциации. 97 (457): 284–292. CiteSeerX  10.1.1.337.3129. Дои:10.1198/016214502753479419. ISSN  0162-1459.

дальнейшее чтение

  • Angrist, Джошуа Д.; Фернандес-Вал, Иван (2013). Достижения в области экономики и эконометрики. Издательство Кембриджского университета. С. 401–434. Дои:10.1017 / cbo9781139060035.012. ISBN  9781139060035.