Средняя абсолютная масштабированная ошибка - Википедия - Mean absolute scaled error

В статистика, то средняя абсолютная масштабированная ошибка (MASE) является мерой точность из прогнозы. Это средняя абсолютная ошибка значений прогноза, деленная на среднюю абсолютную ошибку одношагового наивного прогноза внутри выборки. Он был предложен в 2005 году статистиком Роб Дж. Хайндман и профессор Decision Sciences Энн Б. Келер, которая описала его как «общеприменимое измерение точности прогнозов без проблем, наблюдаемых в других измерениях».[1] Средняя абсолютная масштабированная ошибка имеет благоприятные свойства по сравнению с другими методами расчета. ошибки прогноза, Такие как среднеквадратичное отклонение, поэтому рекомендуется для определения сравнительной точности прогнозов.[2]

Обоснование

Средняя абсолютная масштабированная ошибка имеет следующие желательные свойства:[3]

  1. Масштабная инвариантность: Средняя абсолютная масштабированная ошибка не зависит от масштаба данных, поэтому может использоваться для сравнения прогнозов по наборам данных с разными масштабами.
  2. Предсказуемое поведение как  : Показатели точности прогнозов в процентах, такие как Средняя абсолютная ошибка в процентах (MAPE) полагаются на разделение , искажая распределение MAPE для значений близко или равным 0. Это особенно проблематично для наборов данных, шкала которых не имеет значимого 0, например, температура в градусах Цельсия или Фаренгейта, а также для наборов данных периодического спроса, где встречается часто.
  3. Симметрия: Средняя абсолютная масштабированная ошибка одинаково наказывает как положительные, так и отрицательные ошибки прогнозов, а также наказывает ошибки как в больших, так и в малых прогнозах. Напротив, MAPE и средняя абсолютная процентная ошибка (MdAPE) не соответствуют обоим этим критериям, в то время как «симметричные» sMAPE и sMdAPE[4] не соответствует второму критерию.
  4. Интерпретируемость: Среднюю абсолютную масштабированную ошибку можно легко интерпретировать, поскольку значения больше единицы указывают на то, что одношаговые прогнозы по выборке, полученные наивным методом, работают лучше, чем рассматриваемые значения прогноза.
  5. Асимптотическая нормальность MASE: Тест Дибольда-Мариано для одношаговых прогнозов используется для проверки статистической значимости разницы между двумя наборами прогнозов.[5][6][7] Для проверки гипотез с использованием статистики критерия Дибольда-Мариано желательно, чтобы , куда - значение тестовой статистики. Эмпирически показано, что статистика DM для MASE аппроксимирует это распределение, в то время как средняя относительная абсолютная ошибка (MRAE), MAPE и sMAPE нет.[2]


Несезонный временной ряд

Для несезонного временного ряда[8] средняя абсолютная масштабированная ошибка оценивается как

[3]

где числитель еj это ошибка прогноза за данный период (с J, количество прогнозов), определяемое как фактическое значение (Yj) минус прогнозное значение (Fj) за этот период: еj = Yj − Fj, а знаменателем является средняя абсолютная ошибка одного шага "наивный метод прогноза "на обучающем наборе (здесь определяется как t = 1..n),[8] который использует в качестве прогноза фактическое значение за предыдущий период: Fт = Yт−1[9]

Сезонный временной ряд

Для сезонных временных рядов средняя абсолютная масштабированная ошибка оценивается аналогично методу для несезонных временных рядов:

[8]

Основное отличие метода для несезонных временных рядов состоит в том, что знаменателем является средняя абсолютная ошибка одного шага "сезонный наивный метод прогноза "на тренировочном наборе,[8] который использует в качестве прогноза фактическое значение предыдущего сезона: Fт = Yт−m,[9] где m - сезонный период.

Этот безмасштабный "показатель ошибок" можно использовать для сравнения методов прогноза для одного ряда, а также для сравнения точности прогнозов между рядами. Этот показатель хорошо подходит для рядов с прерывистым спросом.[требуется разъяснение ] потому что он никогда не дает бесконечных или неопределенных значений[1] кроме несущественного случая, когда все исторические данные равны.[3]

При сравнении методов прогнозирования предпочтительным методом является метод с наименьшим MASE.

Смотрите также

Рекомендации

  1. ^ а б Гайндман, Р. Дж. (2006). «Другой взгляд на меры точности прогнозов», FORESIGHT, выпуск 4 июня 2006 г., стр. 46 [1]
  2. ^ а б Франсес, Филип Ганс (01.01.2016). «Примечание о средней абсолютной погрешности шкалы». Международный журнал прогнозирования. 32 (1): 20–22. Дои:10.1016 / j.ijforecast.2015.03.008. HDL:1765/78815.
  3. ^ а б c Гайндман Р. Дж. И Келер А. Б. (2006). «Еще один взгляд на меры точности прогнозов». Международный журнал прогнозирования том 22 выпуск 4, страницы 679-688. Дои:10.1016 / j.ijforecast.2006.03.001
  4. ^ Макридакис, Спирос (1993-12-01). «Меры точности: теоретические и практические аспекты». Международный журнал прогнозирования. 9 (4): 527–529. Дои:10.1016/0169-2070(93)90079-3.
  5. ^ Diebold, Francis X .; Мариано, Роберто С. (1995). «Сравнение точности прогнозов». Журнал деловой и экономической статистики. 13 (3): 253–263. Дои:10.1080/07350015.1995.10524599.
  6. ^ Diebold, Francis X .; Мариано, Роберто С. (2002). «Сравнение точности прогнозов». Журнал деловой и экономической статистики. 20 (1): 134–144. Дои:10.1198/073500102753410444.
  7. ^ Диболд, Фрэнсис X. (2015). «Сравнение точности прогнозов, двадцать лет спустя: личный взгляд на использование тестов Дибольда – Мариано и злоупотребления ими» (PDF). Журнал деловой и экономической статистики. 33 (1): 1. Дои:10.1080/07350015.2014.983236.
  8. ^ а б c d «2.5 Оценка точности прогнозов | OTexts». www.otexts.org. Получено 2016-05-15.
  9. ^ а б Гайндман, Роб и др., Прогнозирование с экспоненциальным сглаживанием: подход пространства состояний, Берлин: Springer-Verlag, 2008. ISBN  978-3-540-71916-8.