В статистика, ожидаемые средние квадраты (EMS) являются ожидаемыми значениями некоторых статистических данных, возникающих при разбиении сумм квадратов в дисперсионный анализ (ANOVA). Их можно использовать для определения, какая статистика должна быть в знаменателе F-тест для тестирования нулевая гипотеза что особого эффекта нет.
Определение
Когда общая скорректированная сумма квадратов в ANOVA делится на несколько компонентов, каждый из которых отнесен к влиянию определенной переменной-предиктора, каждая из сумм квадратов в этом разделе является случайной величиной, которая имеет ожидаемое значение. Это ожидаемое значение, деленное на соответствующее количество степеней свободы, и есть ожидаемое средний квадрат для этой переменной-предиктора.
пример
Следующий пример взят из Продольный анализ данных Дональда Хедекера и Роберта Д. Гиббонса.[1]
Каждый из s лечение (одно из которых может быть плацебо) назначается выборке (столица) N случайно выбранные пациенты, у которых определенные измерения наблюдаются на каждом из (строчных) п указанное время, для (таким образом, количество пациентов, получающих разное лечение, может отличаться), и Мы предполагаем, что группы пациентов, получающих разное лечение, не пересекаются, поэтому пациенты вложенный в рамках лечения и не пересекались с лечением. У нас есть
где
Общая скорректированная сумма квадратов равна
Таблица ANOVA ниже разбивает сумму квадратов (где ):
Использование в F-тестах
Нулевая гипотеза, представляющая интерес, заключается в том, что нет никакой разницы между эффектами разных методов лечения - следовательно, нет разницы между методами лечения. Это можно выразить словами (с обозначениями, используемыми в таблице выше). При этой нулевой гипотезе ожидаемый средний квадрат эффектов лечения равен
Числитель в F-статистике для проверки этой гипотезы представляет собой средний квадрат из-за различий между видами лечения, т.е. Однако знаменатель не Причина в том, что приведенная ниже случайная величина, хотя при нулевой гипотезе имеет F-распределение, не наблюдается - это не статистика - потому что его значение зависит от ненаблюдаемых параметров и
Вместо этого в качестве тестовой статистики используется следующая случайная величина, которая не определена в терминах :
Примечания и ссылки
- ^ Дональд Хедекер, Роберт Д. Гиббонс. Продольный анализ данных. Wiley Interscience. 2006. С. 21–24.