Взаимодействие (статистика) - Википедия - Interaction (statistics)

Взаимодействие образования и идеологии на озабоченность по поводу повышения уровня моря

В статистика, взаимодействие может возникнуть при рассмотрении взаимосвязи между тремя или более переменными, и описывает ситуацию, в которой влияние одной причинной переменной на результат зависит от состояния второй причинной переменной (то есть, когда эффекты двух причин не добавка ).[1][2] Хотя обычно понятие взаимодействия рассматривается в терминах причинно-следственных связей, оно также может описывать некаузальные ассоциации. Взаимодействия часто рассматриваются в контексте регрессионный анализ или же факторные эксперименты.

Наличие взаимодействий может иметь важные последствия для интерпретации статистических моделей. Если две представляющие интерес переменные взаимодействуют, связь между каждой из взаимодействующих переменных и третьей «зависимой переменной» зависит от значения другой взаимодействующей переменной. На практике это затрудняет прогнозирование последствий изменения значения переменной, особенно если переменные, с которыми она взаимодействует, трудно измерить или трудно контролировать.

Понятие «взаимодействие» тесно связано с понятием «взаимодействие». На модерации это распространено в социальных исследованиях и исследованиях в области здравоохранения: взаимодействие между объясняющей переменной и переменной окружающей среды предполагает, что влияние объясняющей переменной было смягчено или изменено переменной окружающей среды.[1]

Вступление

An переменная взаимодействия или же функция взаимодействия представляет собой переменную, созданную из исходного набора переменных, чтобы попытаться представить либо все присутствующее взаимодействие, либо его часть. В исследовательском статистическом анализе обычно используют продукты исходных переменных в качестве основы для проверки наличия взаимодействия с возможностью замены других, более реалистичных переменных взаимодействия на более позднем этапе. Когда существует более двух независимых переменных, конструируется несколько переменных взаимодействия, где попарные продукты представляют попарные взаимодействия, а продукты более высокого порядка представляют взаимодействия более высокого порядка.

Бинарный фактор А и количественная переменная Икс взаимодействуют (не аддитивны) при анализе по переменной результата Y.

Таким образом, для ответа Y и две переменные Икс1 и Икс2 ан добавка модель будет:

В отличие от этого,

это пример модели с взаимодействие между переменными Икс1 и Икс2 ("ошибка" относится к случайная переменная чья ценность - это то, на что Y отличается от ожидаемое значение из Y; видеть ошибки и остатки в статистике ). Часто модели представлены без условия взаимодействия. , но это смешивает основной эффект и эффект взаимодействия (то есть, без указания члена взаимодействия, возможно, что любой обнаруженный основной эффект на самом деле обусловлен взаимодействием).

В моделировании

В ANOVA

Простая обстановка, в которой могут возникать взаимодействия, - это двухфакторный эксперимент проанализированы с использованием Анализ отклонений (ANOVA). Предположим, у нас есть два двоичных фактора А и B. Например, эти факторы могут указывать на то, было ли пациенту назначено какое-либо из двух курсов лечения, применяемое отдельно или в комбинации. Затем мы можем рассмотреть средний ответ на лечение (например, уровни симптомов после лечения) для каждого пациента в зависимости от введенной комбинации лечения. В следующей таблице показана одна возможная ситуация:

B = 0B = 1
А = 067
А = 145

В этом примере нет взаимодействия между двумя методами лечения - их эффекты складываются. Причина этого в том, что разница в среднем ответе между субъектами, получающими лечение А и те, кто не лечится А равно −2 независимо от того, B вводится (−2 = 4-6) или нет (−2 = 5-7). Обратите внимание, что автоматически следует, что разница в среднем ответе между субъектами, получающими лечение B и те, кто не лечится B одинаково независимо от того, проводится ли лечение А управляется (7 - 6 = 5 - 4).

Напротив, если наблюдаются следующие средние ответы

B = 0B = 1
А = 014
А = 176

тогда существует взаимодействие между процедурами - их эффекты не складываются. Предполагая, что большее число соответствует лучшему ответу, в этой ситуации лечение B в среднем помогает, если субъект также не получает лечения А, но в среднем вреден, если давать в сочетании с лечением А. Уход А в среднем полезно независимо от того, проводится ли лечение B также вводится, но это более полезно как в абсолютном, так и в относительном выражении, если вводится отдельно, а не в сочетании с лечением B. Подобные наблюдения сделаны для этого конкретного примера в следующем разделе.

Качественные и количественные взаимодействия

Во многих приложениях полезно различать качественные и количественные взаимодействия.[3] Количественное взаимодействие между А и B это ситуация, когда величина эффекта B зависит от стоимости А, но направление действия B постоянно для всех А. Качественное взаимодействие между А и B относится к ситуации, когда и величина, и направление эффекта каждой переменной могут зависеть от значения другой переменной.

В таблице средних слева внизу показано количественное взаимодействие - лечение А полезно и когда B дается, и когда B не дается, но польза больше, когда B не дается (т.е. когда А дается отдельно). Таблица средств справа показывает качественное взаимодействие. А вредно, когда B дается, но это полезно, когда B не дано. Обратите внимание, что такая же интерпретация будет верна, если мы рассмотрим преимущества B на основе того, А дано.

B = 0B = 1B = 0B = 1
А = 021А = 026
А = 153А = 153

Различие между качественным и количественным взаимодействиями зависит от порядка, в котором рассматриваются переменные (напротив, свойство аддитивности инвариантно для порядка переменных). В следующей таблице, если мы сосредоточимся на эффекте лечения А, существует количественное взаимодействие - лечение А улучшит результат в среднем независимо от того, B назначается или не проводится (хотя польза будет больше, если лечение А дается отдельно). Однако если сосредоточить внимание на эффекте лечения B, есть качественное взаимодействие - лечение B субъекту, который уже получает лечение А будет (в среднем) ухудшить положение, в то время как лечение B субъекту, который не получает лечения А улучшит результат в среднем.

B = 0B = 1
А = 014
А = 176

Аддитивность блока лечения

В своей простейшей форме предположение об аддитивности лечебного блока утверждает, что наблюдаемая реакция уij из экспериментальной установки я при лечении j можно записать как сумму уij = уя + тj.[4][5][6] Предположение об аддитивности единичной обработки подразумевает, что каждая обработка имеет одинаковый аддитивный эффект на каждую экспериментальную единицу. Поскольку любая данная экспериментальная единица может пройти только одну из обработок, предположение об аддитивности единичной обработки является гипотезой, которая, по мнению Кокса, не может быть напрямую опровергнута.[нужна цитата ] и Кемпторн.[нужна цитата ]

Однако многие последствия аддитивности лечебного блока можно фальсифицировать.[нужна цитата ] Для рандомизированного эксперимента предположение об аддитивности лечения подразумевает, что дисперсия постоянна для всех видов лечения. Поэтому, напротив, необходимым условием аддитивности единичного лечения является постоянство дисперсии.[нужна цитата ]

Свойство аддитивности единичной обработки не инвариантно при изменении масштаба,[нужна цитата ] поэтому статистики часто используют преобразования для достижения аддитивности единичной обработки. Если ожидается, что переменная отклика будет следовать параметрическому семейству распределений вероятностей, то статистик может указать (в протоколе эксперимента или наблюдательного исследования), что отклики будут преобразованы для стабилизации дисперсии.[7] Во многих случаях статистик может указать, что к ответам будут применяться логарифмические преобразования, которые, как считается, соответствуют мультипликативной модели.[5][8]

Предположение об аддитивности единичного лечения было сформулировано Кемпторном в эксперименте.[нужна цитата ] и Кокс[нужна цитата ]. Использование Кемпторном аддитивности единичного лечения и рандомизации аналогично основанному на дизайне анализу выборки конечного населения.

В последние годы стало обычным явлением[нужна цитата ] использовать терминологию Дональда Рубина, который использует контрфакты. Предположим, мы сравниваем две группы людей по некоторому признаку. у. Например, первая группа может состоять из людей, которым проводится стандартное лечение какого-либо заболевания, а вторая группа состоит из людей, которые получают новое лечение с неизвестным эффектом. Взяв «контрфактическую» точку зрения, мы можем рассмотреть человека, атрибут которого имеет значение у если этот человек принадлежит к первой группе, и чей атрибут имеет значение τ(у), если человек принадлежит ко второй группе. Предположение об «аддитивности единичного лечения» состоит в том, что τ(у) = τ, то есть «лечебный эффект» не зависит от у. Поскольку мы не можем наблюдать оба у и τ (у) для данного человека это не поддается проверке на индивидуальном уровне. Однако аддитивность единичной обработки означает, что кумулятивные функции распределения F1 и F2 для двух групп удовлетворяют F2(у)  = F1(у - т), если отнесение людей к группам 1 и 2 не зависит от всех других факторов, влияющих на у (т.е. нет смущающие ). Отсутствие аддитивности единичного лечения можно рассматривать как форму взаимодействия между назначением лечения (например, для групп 1 или 2) и исходным уровнем или необработанным значением у.

Категориальные переменные

Иногда взаимодействующие переменные являются категориальными переменными, а не действительными числами, и тогда исследование может рассматриваться как дисперсионный анализ проблема. Например, члены населения могут быть классифицированы по религии и роду занятий. Если кто-то хочет предсказать рост человека, основываясь только на его религии и профессии, простой добавка Модель, то есть модель без взаимодействия, добавит к общему среднему росту поправку на определенную религию и другую поправку на конкретную профессию. Модель с взаимодействием, в отличие от аддитивной модели, может добавить дополнительную настройку для «взаимодействия» между этой религией и этим занятием. Этот пример может вызвать подозрение, что слово взаимодействие это что-то вроде неправильного употребления.

Статистически наличие взаимодействия между категориальными переменными обычно проверяется с использованием формы дисперсионный анализ (ANOVA). Однако, если одна или несколько переменных являются непрерывными по своей природе, ее обычно проверяют с помощью множественной регрессии с умеренной скоростью.[9] Это так называется, потому что модератор - это переменная, которая влияет на силу взаимосвязи между двумя другими переменными.

Спланированные эксперименты

Геничи Тагучи утверждал[10] что взаимодействия можно исключить из система путем соответствующего выбора переменной отклика и преобразования. тем не мение Джордж Бокс и другие утверждали, что в целом это не так.[11]

Размер модели

Данный п предикторов, количество членов в линейной модели, которая включает константу, каждый предиктор и все возможные взаимодействия, равно . Поскольку эта величина растет экспоненциально, она легко становится непрактично большой. Один из способов ограничить размер модели - ограничить порядок взаимодействий. Например, если разрешено только двустороннее взаимодействие, количество терминов станет . В таблице ниже показано количество терминов для каждого количества предикторов и максимальный порядок взаимодействия.

Количество терминов
ПредсказателиВключая до м-ходовые взаимодействия
2345
122222
244444
378888
41115161616
51626313232
62242576364
7296499120128
83793163219256
946130256382512
10561763866381,024
11672325621,0242,048
12792997941,5864,096
13923781,0932,3808,192
141064701,4713,47316,384
151215761,9414,94432,768
202111,3516,19621,7001,048,576
253262,62615,27668,40633,554,432
501,27620,876251,1762,369,9361015
1005,051166,7514,087,97679,375,4961030
1,000500,501166,667,5011010101210300

В регрессе

Самый общий подход к моделированию эффектов взаимодействия включает регрессию, начиная с приведенной выше элементарной версии:

где термин взаимодействия могут быть сформированы явно путем умножения двух (или более) переменных или неявно с использованием факторной записи в современных статистических пакетах, таких как Stata. Компоненты Икс1 и Икс2 это могут быть измерения или {0,1} фиктивные переменные в любом сочетании. Взаимодействия с участием фиктивной переменной, умноженной на переменную измерения, называются фиктивные переменные наклона,[12] потому что они оценивают и проверяют разницу в наклонах между группами 0 и 1.

Когда переменные измерения используются во взаимодействиях, часто желательно работать с центрированными версиями, где среднее значение переменной (или какое-либо другое разумно центральное значение) установлено равным нулю. Центрирование делает основные эффекты в моделях взаимодействия более понятными. Коэффициент а в приведенном выше уравнении, например, представляет собой эффект Икс1 когда Икс2 равно нулю.

Взаимодействие образования и политической партии, влияющее на убеждения об изменении климата

Регрессионные подходы к моделированию взаимодействия являются очень общими, поскольку они могут включать дополнительные предикторы и множество альтернативных спецификаций или стратегий оценки, выходящих за рамки обыкновенный метод наименьших квадратов. Крепкий, квантиль, и смешанные эффекты (многоуровневый ) моделей среди возможностей, как и обобщенное линейное моделирование охватывающий широкий спектр категориальных, упорядоченных, подсчитываемых или иным образом ограниченных зависимых переменных. На графике изображено взаимодействие образования и политики на основе взвешенного по вероятности логит-регрессия анализ данных опроса.[13]

Графики взаимодействия

Графики взаимодействия показывают возможные взаимодействия между переменными.

Пример: взаимодействие видов и температуры воздуха и их влияние на температуру тела.

Рассмотрим исследование температуры тела различных видов животных при разных температурах воздуха в градусах Фаренгейта. Данные представлены в таблице ниже.

Данные о температуре тела по видам

График взаимодействия может использовать либо температуру воздуха, либо виды в качестве оси x. Второй фактор представлен линиями на графике взаимодействия.

график взаимодействия температура тела

график взаимодействия температура тела 2

Существует взаимодействие между двумя факторами (температурой воздуха и биологическими видами) в их влиянии на реакцию (температуру тела), потому что влияние температуры воздуха зависит от вида. Взаимодействие указано на графике, потому что линии не параллельны.

Пример: влияние тяжести инсульта и лечения на выздоровление

В качестве второго примера рассмотрим клиническое исследование взаимосвязи между тяжестью инсульта и эффективностью лекарственного средства для выживаемости пациентов. Данные представлены в таблице ниже.

данные о выживаемости после инсульта

выживание после инсульта

На графике взаимодействия линии для групп легкой и средней степени инсульта параллельны, что указывает на то, что препарат оказывает одинаковое действие в обеих группах, поэтому взаимодействия нет. Линия для группы тяжелого инсульта не параллельна другим линиям, что указывает на взаимосвязь между тяжестью инсульта и влиянием препарата на выживаемость. Линия для группы тяжелого инсульта плоская, что указывает на то, что среди этих пациентов нет разницы в выживаемости при лечении препаратом и плацебо. Напротив, линии для групп легкой и средней степени инсульта спускаются вправо, указывая на то, что среди этих пациентов группа плацебо имеет более низкую выживаемость, чем группа, принимавшая лекарственные препараты.

Проверка гипотез для взаимодействий

Дисперсионный анализ и регрессионный анализ используются для проверки значимых взаимодействий.

Пример: взаимодействие температуры и времени при выпечке печенья

Влияет ли на выход хорошего печенья температура и время выпечки в духовке? В таблице приведены данные для 8 пакетов файлов cookie.

данные о выходе файлов cookie взаимодействия

сюжет взаимодействия выпечка печенья

Данные показывают, что выход хорошего печенья лучше всего, когда (i) температура высокая и время в духовке короткое, или (ii) температура низкая и время в духовке длительное. Если печенье оставить в духовке на долгое время при высокой температуре, печенье подгорело и выход низкий.

Из графика и данных видно, что линии не параллельны, что указывает на взаимодействие. Это можно проверить с помощью дисперсионного анализа (ANOVA). Первая модель ANOVA не будет включать член взаимодействия. То есть первая модель ANOVA игнорирует возможное взаимодействие. Вторая модель ANOVA будет включать член взаимодействия. То есть вторая модель ANOVA явно выполняет проверку гипотезы для взаимодействия.

Модель ANOVA 1: без взаимодействия; выход ~ температура + время

печенье anova модель 1

В модели ANOVA, которая игнорирует взаимодействие, ни температура, ни время не оказывают существенного влияния на выход (p = 0,91), что, очевидно, является неверным выводом. Более подходящая модель ANOVA должна проверять возможное взаимодействие.

Модель 2 ANOVA: включить термин взаимодействия; выход ~ температура * время

Cookie anova модель 2

Член взаимодействия температура: время является значимым (p = 0,000180). На основании теста взаимодействия и графика взаимодействия выясняется, что влияние времени на урожайность зависит от температуры и наоборот.

Примеры

Примеры реального взаимодействия:

  • Взаимодействие между добавлением сахара в кофе и перемешиванием кофе. Ни одна из двух отдельных переменных не оказывает большого влияния на сладость, но их комбинация оказывает.
  • Взаимодействие между добавлением углерод к стали и закалка. Ни один из двух по отдельности не оказывает большого влияния на сила но сочетание того и другого имеет драматический эффект.
  • Взаимодействие между курением и вдыханием асбест волокна: оба повышают риск карциномы легких, но воздействие асбеста умножается риск рака у курильщиков и некурящих. Здесь совместный эффект вдыхания асбеста и курения выше, чем сумма обоих эффектов.[14]
  • Взаимодействие между генетическими факторами риска диабет 2 типа и диета (в частности, «западная» диета). Было показано, что западная диета увеличивает риск диабета для субъектов с высоким «показателем генетического риска», но не для других субъектов.[15]
  • Взаимодействие между образованием и политической ориентацией, влияя на восприятие общественностью изменения климата. Например, опросы в США часто обнаруживают, что признание реальности антропогенное изменение климата возрастает с образованием среди умеренных или либеральных респондентов опроса, но снижается с образованием среди наиболее консервативных.[16][17] Наблюдалось, что аналогичные взаимодействия влияют на некоторые представления, не связанные с климатом или окружающей средой,[18] и работать с показателями научной грамотности или других знаний вместо образования.[19][20]

Смотрите также

Рекомендации

  1. ^ а б Додж, Ю. (2003). Оксфордский словарь статистических терминов. Издательство Оксфордского университета. ISBN  978-0-19-920613-1.
  2. ^ Кокс, Д. (1984). "Взаимодействие". Международный статистический обзор. 52 (1): 1–25. Дои:10.2307/1403235. JSTOR  1403235.
  3. ^ Пето, Д. П. (1982). «Статистические аспекты исследований рака». Лечение рака (Первое изд.). Лондон: Чепмен и Холл. ISBN  0-412-21850-X.
  4. ^ Кемпторн, Оскар (1979). План и анализ экспериментов (Исправленная перепечатка (1952) изд. Wiley). Роберт Э. Кригер. ISBN  978-0-88275-105-4.
  5. ^ а б Кокс, Дэвид Р. (1958). Планирование экспериментов. Глава 2. ISBN  0-471-57429-5.
  6. ^ Хинкельманн, Клаус и Кемпторн, Оскар (2008). Планирование и анализ экспериментов, Том I: Введение в план экспериментов (Второе изд.). Вайли. Главы 5-6. ISBN  978-0-471-72756-9.CS1 maint: несколько имен: список авторов (связь)
  7. ^ Хинкельманн, Клаус и Кемпторн, Оскар (2008). Планирование и анализ экспериментов, Том I: Введение в план экспериментов (Второе изд.). Вайли. Главы 7-8. ISBN  978-0-471-72756-9.CS1 maint: несколько имен: список авторов (связь)
  8. ^ Бейли, Р. А. (2008). Дизайн сравнительных экспериментов. Издательство Кембриджского университета. ISBN  978-0-521-68357-9. Главы перед публикацией доступны в режиме онлайн.
  9. ^ Овертон, Р. К. (2001). «Умеренная множественная регрессия для взаимодействий, включающих категориальные переменные: статистический контроль неоднородной дисперсии между двумя группами». Психологические методы. 6 (3): 218–33. Дои:10.1037 / 1082-989X.6.3.218. PMID  11570229.
  10. ^ «Дизайн экспериментов - эксперименты Тагучи». www.qualitytrainingportal.com. Получено 2015-11-27.
  11. ^ Джордж Э. П. Бокс (1990). "Имеет ли значение взаимодействие?" (PDF). Качественная инженерия. 2: 365–369. Дои:10.1080/08982119008962728. Архивировано из оригинал (PDF) на 2010-06-10. Получено 2009-07-28.
  12. ^ Гамильтон, Л. 1992 г. Регрессия с графикой: второй курс прикладной статистики. Пасифик Гроув, Калифорния: Брукс / Коул. ISBN  978-0534159009
  13. ^ Гамильтон, L.C .; Сайто, К. (2015). «Четырехсторонний взгляд на экологические проблемы США». Экологическая политика. 24 (2): 212–227. Дои:10.1080/09644016.2014.976485. S2CID  154762226.
  14. ^ Ли, П. Н. (2001). «Связь между совместным воздействием асбеста и курением и риском рака легких». Медицина труда и окружающей среды. 58 (3): 145–53. Дои:10.1136 / oem.58.3.145. ЧВК  1740104. PMID  11171926.
  15. ^ Lu, Q .; и другие. (2009). «Генетическая предрасположенность, западная диета и риск диабета 2 типа у мужчин». Am J Clin Nutr. 89 (5): 1453–1458. Дои:10.3945 / ajcn.2008.27249. ЧВК  2676999. PMID  19279076.
  16. ^ Гамильтон, Л. (2011). «Образование, политика и мнения об изменении климата: свидетельства эффектов взаимодействия». Изменение климата. 104 (2): 231–242. Дои:10.1007 / s10584-010-9957-8. S2CID  16481640.
  17. ^ МакКрайт, А. М. (2011). «Политическая ориентация смягчает убеждения и озабоченность американцев изменением климата». Изменение климата. 104 (2): 243–253. Дои:10.1007 / s10584-010-9946-y. S2CID  152795205.
  18. ^ Гамильтон, Лоуренс С .; Сайто, Кей (2015). «Четырехсторонний взгляд на экологическую озабоченность США». Экологическая политика. 24 (2): 212–227. Дои:10.1080/09644016.2014.976485. S2CID  154762226.
  19. ^ Kahan, D.M .; Jenkins-Smith, H .; Браман, Д. (2011). «Культурное познание научного консенсуса». Журнал исследований рисков. 14 (2): 147–174. Дои:10.1080/13669877.2010.511246. HDL:10.1080/13669877.2010.511246. S2CID  216092368.
  20. ^ Гамильтон, L.C .; Катлер, М.Дж .; Шефер, А. (2012). «Общественные знания и озабоченность по поводу потепления полярных регионов». Полярная география. 35 (2): 155–168. Дои:10.1080 / 1088937X.2012.684155. S2CID  12437794.

дальнейшее чтение

внешняя ссылка