В линейная регрессия, средний ответ и предсказанный ответ - значения зависимой переменной, рассчитанные на основе параметров регрессии и заданного значения независимой переменной. Значения этих двух ответов одинаковы, но их расчетные отклонения различаются.
Задний план
При прямой подгонке модель
где это переменная ответа, это объясняющая переменная, εя - случайная ошибка, а и параметры. Среднее и прогнозируемое значение отклика для данного объяснительного значения, Иксd, дан кем-то
в то время как фактический ответ будет
Выражения для значений и дисперсий и даны в линейная регрессия.
Средний ответ
Поскольку данные в этом контексте определены как (Икс, y) пар для каждого наблюдения средний ответ при заданной стоимости Икс, сказать Иксd, является оценкой среднего значения y значения в популяции на Икс ценность Иксd, это . Дисперсия среднего отклика определяется выражением
Это выражение можно упростить до
где м - количество точек данных.
Чтобы продемонстрировать это упрощение, можно использовать тождество
Прогнозируемый ответ
В предсказанный ответ распределение - это прогнозируемое распределение остатков в данной точке Иксd. Таким образом, дисперсия определяется выражением
Вторая строка следует из того, что равен нулю, потому что новая точка прогноза не зависит от данных, используемых для соответствия модели. Кроме того, термин был рассчитан ранее для среднего ответа.
поскольку (фиксированный, но неизвестный параметр, который можно оценить), дисперсия прогнозируемого отклика определяется выражением
Доверительные интервалы
В доверительные интервалы вычисляются как . Таким образом, доверительный интервал для предсказанного ответа шире, чем интервал для среднего ответа. Это ожидается интуитивно - дисперсия популяции значения не сжимаются при выборке из него, потому что случайная величина εя не уменьшается, но дисперсия среднего значения сокращается при увеличении выборки, потому что дисперсия в и уменьшаются, поэтому средний отклик (прогнозируемое значение отклика) становится ближе к .
Это аналогично разнице между дисперсией генеральной совокупности и дисперсией выборочного среднего для генеральной совокупности: дисперсия генеральной совокупности является параметром и не изменяется, но дисперсия выборочного среднего уменьшается с увеличением выборки.
Общая линейная регрессия
Общая линейная модель может быть записана как
Следовательно, поскольку общее выражение для дисперсии среднего отклика:
где S это ковариационная матрица параметров, задаваемых
использованная литература
- Draper, N.R .; Смит, Х. (1998). Прикладной регрессионный анализ (3-е изд.). Джон Вили. ISBN 0-471-17082-8.