F-тест - F-test
An F-тест есть ли статистический тест в которой статистика теста имеет F-распределение под нулевая гипотеза. Чаще всего используется при сравнение статистических моделей которые были приспособлены к данные набор, чтобы определить модель, которая лучше всего подходит численность населения из которого были взяты данные. Точный "F-тесты »в основном возникают, когда модели подогнаны к данным с использованием наименьших квадратов. Название было придумано Джордж В. Снедекор, в честь сэра Рональд А. Фишер. Фишер первоначально разработал статистику как коэффициент дисперсии в 1920-х годах.[1]
Общие примеры
Общие примеры использования F-тесты включают изучение следующих случаев:
- Гипотеза о том, что средства данного набора нормально распределенный популяции, у всех одинаковые стандартное отклонение, равны. Это, пожалуй, самый известный F-тест и играет важную роль в дисперсионный анализ (ANOVA).
- Гипотеза о соответствии предложенной регрессионной модели данные Что ж. Видеть Неподходящая сумма квадратов.
- Гипотеза о том, что набор данных в регрессивный анализ следует более простой из двух предложенных линейных моделей, которые вложенный друг в друге.
Кроме того, некоторые статистические процедуры, такие как Метод Шеффе для настройки множественных сравнений в линейных моделях также используйте F-тесты.
F-тест на равенство двух дисперсий
В F-тест чувствительный к ненормальность.[2][3] в дисперсионный анализ (ANOVA), альтернативные тесты включают Тест Левена, Тест Бартлетта, а Тест Брауна – Форсайта. Однако, когда любой из этих тестов проводится для проверки основного предположения гомоскедастичность (т.е. однородность дисперсии), в качестве предварительного шага к проверке средних эффектов наблюдается увеличение экспериментального Ошибка типа I ставка.[4]
Формула и расчет
Наиболее F-тесты возникают при рассмотрении разложения изменчивость в сборе данных с точки зрения суммы квадратов. В статистика теста в F-test - это соотношение двух масштабных сумм квадратов, отражающих различные источники изменчивости. Эти суммы квадратов построены так, что статистика имеет тенденцию быть больше, когда нулевая гипотеза неверна. Для того, чтобы статистика соответствовала F-распределение при нулевой гипотезе суммы квадратов должны быть статистически независимый, и каждый должен следовать χ²-распределение. Последнее условие гарантируется, если значения данных независимы и нормально распределенный с общим отклонение.
Задачи ANOVA с множественным сравнением
В F-тест с односторонним дисперсионным анализом используется для оценки того, ожидаемые значения количественной переменной в пределах нескольких заранее определенных групп отличаются друг от друга. Например, предположим, что медицинское испытание сравнивает четыре лечения. ANOVA F-тест можно использовать для оценки того, является ли какой-либо из методов лечения в среднем лучше или хуже других по сравнению с нулевой гипотезой о том, что все четыре лечения дают одинаковый средний ответ. Это пример «комплексного» теста, означающего, что один тест выполняется для обнаружения любого из нескольких возможных различий. В качестве альтернативы, мы могли бы провести попарные тесты для лечения (например, в примере медицинского испытания с четырьмя курсами лечения мы могли бы провести шесть тестов для пар курсов лечения). Преимущество ANOVA F-тест заключается в том, что нам не нужно заранее указывать, какие виды лечения следует сравнивать, и нам не нужно настраивать множественные сравнения. Недостаток ANOVA F-test заключается в том, что если мы отклоним нулевая гипотеза, мы не знаем, какие методы лечения могут значительно отличаться от других, и, если F-тест проводится на уровне α, можем ли мы констатировать, что пара лечения с наибольшей разницей в среднем значительно отличается на уровне α.
Формула одностороннего ANOVA F-тест статистика является
или же
«Объясненная дисперсия» или «межгрупповая изменчивость» - это
куда обозначает выборочное среднее в я-я группа, количество наблюдений в я-я группа, обозначает общее среднее значение данных, а обозначает количество групп.
«Необъяснимая дисперсия» или «внутригрупповая изменчивость» - это
куда это jth наблюдение в яth снаружи группы и - общий размер выборки. Этот F-статистика следует за F-распределение со степенями свободы и при нулевой гипотезе. Статистика будет большой, если вариабельность между группами велика по сравнению с вариабельностью внутри группы, что маловероятно, если население означает все группы имеют одинаковое значение.
Обратите внимание, что когда есть только две группы для одностороннего дисперсионного анализа F-тест, куда т это Студенты статистика.
Проблемы регрессии
Рассмотрим две модели, 1 и 2, где модель 1 «вложена» в модель 2. Модель 1 - это ограниченная модель, а модель 2 - неограниченная. То есть модель 1 имеет п1 параметры, а модель 2 имеет п2 параметры, где п1 < п2, и при любом выборе параметров в модели 1 такая же кривая регрессии может быть получена путем некоторого выбора параметров модели 2.
Одним из общих контекстов в этом отношении является решение о том, соответствует ли модель данным значительно лучше, чем наивная модель, в которой единственным поясняющим термином является термин перехвата, так что все прогнозируемые значения для зависимой переменной устанавливаются равными значениям этой переменной. выборочное среднее. Наивная модель - это ограниченная модель, поскольку коэффициенты всех потенциальных независимых переменных ограничены равными нулю.
Другой общий контекст - это решение, есть ли структурный разрыв в данных: здесь ограниченная модель использует все данные в одной регрессии, а неограниченная модель использует отдельные регрессии для двух разных подмножеств данных. Такое использование F-теста известно как Чау-тест.
Модель с большим количеством параметров всегда сможет соответствовать данным, по крайней мере, так же хорошо, как модель с меньшим количеством параметров. Таким образом, обычно модель 2 дает лучшее (то есть меньшую ошибку) соответствие данным, чем модель 1. Но часто хочется определить, дает ли модель 2 оценку существенно лучше подходят к данным. Один из подходов к этой проблеме - использовать F-тест.
Если есть п точки данных для оценки параметров обеих моделей, затем можно рассчитать F статистика, предоставленная
где RSSя это остаточная сумма квадратов модели я. Если регрессионная модель была рассчитана с весами, замените RSSя с χ2, взвешенная сумма квадратов остатков. При нулевой гипотезе о том, что модель 2 не обеспечивает значительно лучшего соответствия, чем модель 1, F будет F распределение, с (п2−п1, п−п2) степени свободы. Нулевая гипотеза отклоняется, если F рассчитанное по данным, больше критического значения F-распределение для некоторой желаемой вероятности ложного отклонения (например, 0,05). В F-тест - это Тест Вальда.
Рекомендации
- ^ Ломакс, Ричард Г. (2007). Статистические концепции: второй курс. п.10. ISBN 0-8058-5850-4.
- ^ Бокс, Г. Э. П. (1953). «Ненормальность и тесты на отклонения». Биометрика. 40 (3/4): 318–335. Дои:10.1093 / biomet / 40.3-4.318. JSTOR 2333350.
- ^ Марковски, Кэрол А; Марковский, Эдвард П. (1990). «Условия эффективности предварительного дисперсионного теста». Американский статистик. 44 (4): 322–326. Дои:10.2307/2684360. JSTOR 2684360.
- ^ Савиловский, С. (2002). "Ферма, Шуберт, Эйнштейн и Беренс – Фишер: вероятная разница между двумя средними при σ12 ≠ σ22". Журнал современных прикладных статистических методов. 1 (2): 461–472. В архиве из оригинала от 03.04.2015. Получено 2015-03-30.
дальнейшее чтение
- Фокс, Карл А. (1980). Промежуточная экономическая статистика (Второе изд.). Нью-Йорк: Джон Вили и сыновья. С. 290–310. ISBN 0-88275-521-8.
- Джонстон, Джон (1972). Эконометрические методы (Второе изд.). Нью-Йорк: Макгроу-Хилл. С. 35–38.
- Кмента Ян (1986). Элементы эконометрики (Второе изд.). Нью-Йорк: Макмиллан. С. 147–148. ISBN 0-02-365070-2.
- Маддала, Г.С.; Лахири, Каджал (2009). Введение в эконометрику (Четвертое изд.). Чичестер: Вайли. С. 155–160. ISBN 978-0-470-01512-4.