Средняя абсолютная ошибка в процентах - Mean absolute percentage error

В средняя абсолютная ошибка в процентах (MAPE), также известный как среднее абсолютное процентное отклонение (MAPD), является мерой точности прогноза метода прогнозирования в статистика, например в оценка тенденции, также используется как функция потерь для проблем регрессии в машинное обучение. Обычно точность выражается в виде отношения, определяемого формулой:

куда Ат фактическое значение и Fт - прогнозируемое значение. MAPE также иногда указывается в процентах, что представляет собой приведенное выше уравнение, умноженное на 100. Разница между Ат и Fт делится на фактическое значение Ат опять таки. Абсолютное значение в этом расчете суммируется для каждого прогнозируемого момента времени и делится на количество подобранных точек.п. Умножение на 100% дает процентную ошибку.

MAPE в задачах регрессии

Средняя абсолютная процентная ошибка обычно используется как функция потерь для проблемы регрессии а также при оценке модели из-за ее очень интуитивной интерпретации с точки зрения относительной ошибки.

Определение

Рассмотрим стандартную настройку регрессии, в которой данные полностью описываются случайной парой. со значениями в , и п i.i.d. копии из . Целью регрессионных моделей является поиск хорошей модели для пары, т. Е. измеримая функция грамм из к такой, что близко к Y.

В условиях классической регрессии близость к Y измеряется через L2 риск, также называемый среднеквадратичная ошибка (MSE). В контексте регрессии MAPE,[1] близость к Y измеряется с помощью MAPE, и цель регрессии MAPE - найти модель такой, что:

куда - рассматриваемый класс моделей (например, линейные модели).

На практике

На практике можно оценить по минимизация эмпирического риска стратегия, ведущая к

С практической точки зрения использование MAPE в качестве функции качества для регрессионной модели эквивалентно выполнению взвешенных средняя абсолютная ошибка (MAE) регрессия, также известная как квантильная регрессия. Это свойство тривиально, поскольку

Как следствие, использование MAPE очень просто на практике, например, с использованием существующих библиотек для квантильной регрессии, позволяющей использовать веса.

Последовательность

Использование MAPE в качестве функции потерь для регрессионного анализа возможно как с практической, так и с теоретической точки зрения, поскольку наличие оптимальной модели и последовательность минимизации эмпирического риска.[1]

Альтернативные определения MAPE

Проблемы могут возникнуть при вычислении значения MAPE с серией малых знаменателей. Может возникнуть проблема сингулярности в форме «единица, деленная на ноль» и / или создание очень больших изменений абсолютной процентной ошибки, вызванных небольшим отклонением в ошибке.

В качестве альтернативы каждое фактическое значение (Ат) ряда в исходной формуле можно заменить средним всех фактических значений (Āт) этой серии. Эта альтернатива до сих пор используется для измерения эффективности моделей, прогнозирующих спотовые цены на электроэнергию.[2]

Обратите внимание, что это эквивалентно делению суммы абсолютных различий на сумму фактических значений и иногда называется WAPE (взвешенная абсолютная процентная ошибка).

вопросы

Хотя концепция MAPE звучит очень просто и убедительно, она имеет серьезные недостатки в практическом применении.[3] и есть много исследований недостатков и вводящих в заблуждение результатов MAPE.[4][5]

  • Его нельзя использовать, если есть нулевые значения (что иногда случается, например, в данных спроса), потому что будет деление на ноль.
  • Для слишком низких прогнозов процентная ошибка не может превышать 100%, но для слишком высоких прогнозов нет верхнего предела процентной ошибки.
  • MAPE накладывает более серьезные штрафы на отрицательные ошибки, чем на положительных ошибках.[6] Как следствие, когда MAPE используется для сравнения точности методов прогнозирования, он предвзято относится к систематическому выбору метода, прогнозы которого слишком занижены. Эту малоизвестную, но серьезную проблему можно преодолеть, используя показатель точности, основанный на логарифме отношения точности (отношение прогнозируемого к фактическому значению), определяемого выражением . Такой подход приводит к превосходным статистическим свойствам и предсказаниям, которые можно интерпретировать с точки зрения среднего геометрического.[3]

Чтобы решить эти проблемы с помощью MAPE, в литературе предлагаются некоторые другие меры:

Смотрите также

внешняя ссылка

Рекомендации

  1. ^ а б де Myttenaere, B Golden, B Le Grand, F Rossi (2015). «Средняя абсолютная процентная ошибка для регрессионных моделей», Neurocomputing 2016 arXiv:1605.02541
  2. ^ Йоррит Вандер Минсбрюгге (2010). «Стратегии торгов с использованием обязательств на основе цены на единицу продукции на дерегулируемом рынке электроэнергии», К.У. Лёвен
  3. ^ а б Тофаллис (2015). «Лучшая мера относительной точности прогнозов для выбора модели и оценки модели», Журнал Общества оперативных исследований, 66(8):1352-1362. архивный препринт
  4. ^ Гайндман, Роб Дж. И Энн Б. Келер (2006). «Еще один взгляд на меры точности прогнозов». Международный журнал прогнозирования, 22(4):679-688 DOI: 10.1016 / j.ijforecast.2006.03.001.
  5. ^ а б Ким, Сунгил и Хеён Ким (2016). «Новый показатель абсолютной процентной ошибки для прогнозов прерывистого спроса». Международный журнал прогнозирования, 32(3):669-679 DOI: 10.1016 / j.ijforecast.2015.12.003.
  6. ^ Макридакис, Спирос (1993) "Меры точности: теоретические и практические аспекты". Международный журнал прогнозирования, 9(4):527-529 DOI: 10.1016 / 0169-2070 (93) 90079-3