Метод Бокса – Дженкинса - Box–Jenkins method

В анализ временных рядов, то Метод Бокса – Дженкинса,[1] названный в честь статистики Джордж Бокс и Гвилим Дженкинс, применяется авторегрессионная скользящая средняя (ARMA) или авторегрессионная интегрированная скользящая средняя (ARIMA), чтобы найти наилучшее соответствие модели временных рядов прошлым значениям Временные ряды.

Подход к моделированию

Исходная модель использует итеративный трехэтапный подход к моделированию:

  1. Идентификация модели и выбор модели: убедитесь, что переменные стационарный, определяя сезонность в зависимом ряду (при необходимости с сезонной дифференциацией), а также с использованием графиков автокорреляция (АКФ) и частичная автокорреляция (PACF) функции зависимого временного ряда, чтобы решить, какой (если есть) компонент авторегрессии или скользящего среднего следует использовать в модели.
  2. Оценка параметров использование алгоритмов вычислений для получения коэффициентов, которые наилучшим образом соответствуют выбранной модели ARIMA. Наиболее распространенные методы использования оценка максимального правдоподобия или же нелинейная оценка методом наименьших квадратов.
  3. Статистическая проверка модели проверяя, соответствует ли оценочная модель спецификациям стационарного одномерного процесса. В частности, остатки должны быть независимыми друг от друга и постоянными по среднему значению и изменению во времени. (Построение среднего значения и дисперсии остатков во времени и выполнение Тест Юнга – Бокса или построение автокорреляции и частичной автокорреляции остатков полезны для выявления ошибки в спецификации.) Если оценка неадекватна, мы должны вернуться к шагу 1 и попытаться построить лучшую модель.

Данные, которые они использовали, были получены из газовой печи. Эти данные хорошо известны как данные газовых печей Бокса и Дженкинса для сравнительного анализа прогнозных моделей.

Командор и Купман (2007, §10.4)[2] утверждают, что подход Бокса – Дженкинса принципиально проблематичен. Проблема возникает из-за того, что «в экономической и социальной областях реальные ряды никогда не бывают стационарными, сколько бы различий ни проводилось». Таким образом, исследователь должен столкнуться с вопросом: насколько близко к стационарному достаточно близко? Как отмечают авторы, «это сложный вопрос». Авторы далее утверждают, что вместо использования Бокса – Дженкинса лучше использовать методы пространства состояний, поскольку в этом случае не требуется стационарность временных рядов.

Идентификация модели Бокса – Дженкинса

Стационарность и сезонность

Первым шагом в разработке модели Бокса – Дженкинса является определение того, Временные ряды является стационарный и есть ли какие-нибудь существенные сезонность это нужно смоделировать.

Обнаружение стационарности

Стационарность можно оценить по график последовательности выполнения. График последовательности выполнения должен показывать постоянное местоположение и шкала. Его также можно обнаружить из график автокорреляции. В частности, нестационарность часто указывается графиком автокорреляции с очень медленным затуханием.

Определение сезонности

Сезонность (или периодичность) обычно можно оценить по графику автокорреляции, участок сезонной подсерии, или спектральный сюжет.

Разница для достижения стационарности

Бокс и Дженкинс рекомендуют использовать дифференцированный подход для достижения стационарности. Тем не мение, подгонка кривой и вычитание подобранных значений из исходных данных также можно использовать в контексте моделей Бокса – Дженкинса.

Сезонная разница

На этапе идентификации модели цель состоит в том, чтобы обнаружить сезонность, если она существует, и определить порядок сезонной авторегрессии и сезонного скользящего среднего. Для многих рядов период известен, и достаточно одного срока сезонности. Например, для ежемесячных данных обычно включается либо сезонный член AR 12, либо сезонный член MA 12. Для моделей Бокса – Дженкинса сезонность не удаляется явно перед подгонкой модели. Вместо этого один включает порядок сезонных членов в спецификации модели к ARIMA программное обеспечение для оценки. Однако может быть полезно применить сезонную разницу к данным и восстановить графики автокорреляции и частичной автокорреляции. Это может помочь в идентификации несезонной составляющей модели. В некоторых случаях сезонная разница может устранить большую часть или весь эффект сезонности.

Идентифицировать п и q

После рассмотрения стационарности и сезонности следующим шагом будет определение порядка (т. Е. п и q) членов авторегрессии и скользящего среднего. У разных авторов разные подходы к определению п и q. Броквелл и Дэвис (1991)[3] заявляют, что «нашим основным критерием выбора модели [среди моделей ARMA (p, q)] будет AICc», т. е. Информационный критерий Акаике с исправлением. Другие авторы используют график автокорреляции и график частичной автокорреляции, описанные ниже.

Графики автокорреляции и частичной автокорреляции

График автокорреляции выборки и график частичной автокорреляции выборки сравниваются с теоретическим поведением этих графиков, когда порядок известен.

В частности, для AR (1) процесса, функция автокорреляции выборки должна иметь экспоненциально убывающий вид. Однако процессы AR более высокого порядка часто представляют собой смесь экспоненциально убывающих и затухающих синусоидальных компонентов.

Для процессов авторегрессии более высокого порядка автокорреляцию выборки необходимо дополнить графиком частичной автокорреляции. Частичная автокорреляция AR (п) процесс обращается в ноль при задержке п + 1 и выше, поэтому мы исследуем частичную автокорреляционную функцию выборки, чтобы увидеть, есть ли свидетельства отклонения от нуля. Обычно это определяется путем размещения 95% доверительный интервал на выборочном графике частичной автокорреляции (большинство программ, которые генерируют выборочные графики автокорреляции, также строят этот доверительный интервал). Если программа не генерирует доверительный интервал, это приблизительно , с N обозначающий размер выборки.

Автокорреляционная функция MA (q) процесс становится нулевым с задержкой q + 1 и выше, поэтому мы исследуем выборочную автокорреляционную функцию, чтобы увидеть, где она по существу становится нулевой. Мы делаем это, помещая 95% доверительный интервал для функции автокорреляции выборки на график автокорреляции выборки. Большинство программ, которые могут генерировать график автокорреляции, также могут генерировать этот доверительный интервал.

Функция частичной автокорреляции выборки обычно не помогает определить порядок процесса скользящего среднего.

В следующей таблице показано, как можно использовать образец автокорреляционная функция для идентификации модели.

ФормаУказанная модель
Экспоненциальный, убывающий до нуляАвторегрессионная модель. Используйте график частичной автокорреляции, чтобы определить порядок модели авторегрессии.
Чередование положительного и отрицательного, убывающее до нуляМодель авторегрессии. Используйте график частичной автокорреляции, чтобы помочь определить порядок.
Один или несколько шипов, отдых практически равен нулюМодель скользящего среднего, порядок определяется тем, где график становится нулевым.
Распад, начинающийся после нескольких задержекСмешанная авторегрессия и скользящее среднее (ARMA ) модель.
Все ноль или близко к нулюДанные по сути случайны.
Высокие значения с фиксированными интерваламиВключите сезонный авторегрессионный термин.
Нет распада до нуляСерия не стационарная.

Гайндман и Афанасопулос предлагают следующее:[4]

Данные могут соответствовать ARIMA (п,d, 0) модели, если графики ACF и PACF разностных данных показывают следующие закономерности:
  • ACF является экспоненциально затухающей или синусоидальной;
  • наблюдается значительный всплеск лага п в PACF, но без задержки п.
Данные могут следовать за ARIMA (0,d,q) модели, если графики ACF и PACF разностных данных показывают следующие закономерности:
  • PACF является экспоненциально затухающим или синусоидальным;
  • наблюдается значительный всплеск лага q в ACF, но без задержки q.

На практике функции автокорреляции выборки и частичной автокорреляции случайные переменные и не дают такой картины, как теоретические функции. Это затрудняет идентификацию модели. В частности, смешанные модели бывает особенно сложно идентифицировать. Несмотря на то, что опыт полезен, разработка хороших моделей с использованием этих типовых графиков может включать много проб и ошибок.

Оценка модели Бокса – Дженкинса

Оценка параметров для моделей Бокса – Дженкинса включает численную аппроксимацию решений нелинейных уравнений. По этой причине обычно используется статистическое программное обеспечение, предназначенное для реализации этого подхода - практически все современные статистические пакеты имеют эту возможность. Основные подходы к подгонке моделей Бокса – Дженкинса - это нелинейный метод наименьших квадратов и оценка максимального правдоподобия. Оценка максимального правдоподобия обычно является предпочтительным методом. Уравнения правдоподобия для полной модели Бокса – Дженкинса сложны и здесь не рассматриваются. См. Математические подробности в (Brockwell and Davis, 1991).

Диагностика модели Бокса – Дженкинса

Допущения для стабильного одномерного процесса

Диагностика моделей для моделей Бокса – Дженкинса аналогична проверке моделей для нелинейной аппроксимации методом наименьших квадратов.

То есть термин ошибки Ат предполагается, что следуют предположениям для стационарного одномерного процесса. Остатки должны быть белый шум (или независимые, если их распределения нормальные) извлекаются из фиксированного распределения с постоянным средним и дисперсией. Если модель Бокса – Дженкинса является хорошей моделью для данных, остатки должны удовлетворять этим предположениям.

Если эти предположения не выполняются, необходимо подобрать более подходящую модель. То есть вернитесь к этапу идентификации модели и попытайтесь разработать лучшую модель. Надеюсь, анализ остатков может дать некоторые подсказки относительно более подходящей модели.

Один из способов оценить, соответствуют ли остатки модели Бокса – Дженкинса предположениям, - это сгенерировать статистическая графика (включая график автокорреляции) остатков. Можно также посмотреть на ценность Статистика Box – Ljung.

Рекомендации

  1. ^ Коробка, Джордж; Дженкинс, Гвилим (1970). Анализ временных рядов: прогнозирование и контроль. Сан-Франциско: Холден-Дэй.
  2. ^ Commandeur, J. J. F .; Купман, С. Дж. (2007). Введение в анализ временных рядов пространства состояний. Oxford University Press.
  3. ^ Броквелл, Питер Дж .; Дэвис, Ричард А. (1991). Временные ряды: теория и методы. Springer-Verlag. п. 273.
  4. ^ Гайндман, Роб Дж; Афанасопулос, Джордж. «Прогнозирование: принципы и практика». Получено 18 мая 2015.

дальнейшее чтение

внешняя ссылка

Эта статья включаетматериалы общественного достояния от Национальный институт стандартов и технологий интернет сайт https://www.nist.gov.