Преобразование мощности - Power transform

В статистика, а преобразование власти семейство функций, которые применяются для создания монотонное преобразование данных с использованием степенные функции. Это полезный преобразование данных метод, используемый для стабилизации дисперсии, чтобы сделать данные более нормальное распределение -как, повысить действенность мер ассоциации, таких как Корреляции Пирсона между переменными и для других процедур стабилизации данных.

Силовые преобразования повсеместно используются в различных областях. Например, мультиразрешение и вейвлет-анализ[1], статистический анализ данных, медицинские исследования, моделирование физических процессов[2], анализ геохимических данных[3], эпидемиология[4] и многие другие области клинических, экологических и социальных исследований.

Определение

Преобразование мощности определяется как непрерывно изменяющаяся функция по отношению к параметру мощности λ, в кусочно-функциональной форме, что делает ее непрерывной в точке особенности (λ = 0). Для векторов данных (у1,..., уп), в котором каждый уя > 0 степенное преобразование

куда

это среднее геометрическое наблюдений у1, ..., уп. Дело для это предел как приближается к 0. Чтобы увидеть это, обратите внимание, что = . потом = , и все, кроме становится незначительным для достаточно маленький.

Включение (λ - 1) степень среднего геометрического в знаменателе упрощает научная интерпретация любого уравнения, включающего , потому что единицы измерения не меняются как λ изменения.

Бокс и Кокс (1964) ввели среднее геометрическое в это преобразование, сначала включив Якобиан масштабирования трансформации мощности

.

с вероятностью. Этот якобиан выглядит следующим образом:

Это позволяет нормальному логарифмическая вероятность на максимум записать следующим образом:

Отсюда поглощая в выражение для производит выражение, которое устанавливает, что минимизируя сумму квадратов остатки из эквивалентно максимизации суммы нормальных логарифмическая вероятность отклонений от и журнал якобиана преобразования.

Стоимость на Y = 1 для любого λ равно 0, а производная относительно Y есть 1 для любого λ. Иногда Y это версия некоторой другой переменной, масштабированной, чтобы дать Y = 1 при каком-то среднем значении.

Преобразование - это мощность преобразование, но сделано таким образом, чтобы непрерывный с параметром λ в λ = 0. Это оказалось популярным в регрессивный анализ, включая эконометрика.

Бокс и Кокс также предложили более общую форму преобразования, которая включает параметр сдвига.

что имеет место, если уя + α> 0 для всехя. Если τ (Y, λ, α) следует усеченное нормальное распределение, тогда Y говорят, что следует Распределение Бокса – Кокса.

Бикель и Доксум устранили необходимость использования усеченное распределение расширив диапазон преобразования на все у, следующее:

,

где sgn (.) - это функция знака. Это изменение в определении не имеет большого практического значения, пока меньше чем , что обычно и бывает.[5]

Бикель и Доксум также доказали, что оценки параметров последовательный и асимптотически нормальный при соответствующих условиях регулярности, хотя стандартные Нижняя граница Крамера – Рао может существенно недооценить дисперсию, когда значения параметров малы по сравнению с дисперсией шума.[5] Однако эта проблема недооценки дисперсии может не быть существенной проблемой для многих приложений.[6][7]

Преобразование Бокса – Кокса

Однопараметрические преобразования Бокса – Кокса определяются как

и двухпараметрические преобразования Бокса – Кокса в виде

как описано в оригинальной статье.[8][9] Более того, первые преобразования верны для , а второй для .[8]

Параметр оценивается с использованием вероятность профиля функция.[нужна цитата ]

Доверительный интервал

Доверительный интервал для преобразования Бокса – Кокса может быть асимптотически построенный с помощью Теорема Уилкса на вероятность профиля функция, чтобы найти все возможные значения которые соответствуют следующему ограничению:[10]

Пример

Набор данных BUPA о печени[11] содержит данные о ферментах печени ALT и γGT. Предположим, мы заинтересованы в использовании log (γGT) для прогнозирования ALT. График данных отображается на панели (а) рисунка. По-видимому, существует непостоянная дисперсия, и может помочь преобразование Бокса – Кокса.

BUPA BoxCox.JPG

Логарифмическая вероятность параметра мощности отображается на панели (b). Горизонтальная реперная линия находится на расстоянии χ12/ 2 от максимума и может использоваться для определения приблизительного 95% доверительного интервала для λ. Похоже, что значение, близкое к нулю, было бы хорошо, поэтому мы берем журналы.

Возможно, преобразование можно улучшить, добавив параметр сдвига к преобразованию журнала. Панель (c) рисунка показывает логарифмическую вероятность. В этом случае максимум правдоподобия близок к нулю, что говорит о том, что параметр сдвига не нужен. На последней панели показаны преобразованные данные с наложенной линией регрессии.

Обратите внимание, что хотя преобразования Бокса – Кокса могут значительно улучшить соответствие модели, есть некоторые проблемы, с которыми преобразование не может помочь. В текущем примере данные имеют довольно тяжелый хвост, так что предположение о нормальности нереалистично и надежная регрессия подход приводит к более точной модели.

Эконометрическое приложение

Экономисты часто характеризуют производственные отношения каким-либо вариантом преобразования Бокса – Кокса.[12]

Рассмотрим общее представление о производстве Q в зависимости от услуг, предоставляемых акционерным капиталом K и по часам работы N:

Решение для Q обращая преобразование Бокса – Кокса, находим

который известен как постоянная эластичность замещения (CES) производственная функция.

Производственная функция CES - это однородная функция первой степени.

Когда λ = 1, это дает линейную производственную функцию:

Когда λ → 0 это производит знаменитый Кобб – Дуглас производственная функция:

Мероприятия и демонстрации

В SOCR страницы ресурсов содержат ряд практических интерактивных действий[13] демонстрация преобразования Бокса – Кокса (мощность) с использованием Java-апплетов и диаграмм. Они напрямую иллюстрируют влияние этого преобразования на Графики Q-Q, X-Y диаграммы рассеяния, Временные ряды участки и гистограммы.

Преобразование Йео – Джонсона

Преобразование Йео – Джонсона[14]позволяет также нулевые и отрицательные значения . может быть любым действительным числом, где производит преобразование идентичности. Закон преобразования гласит:

Примечания

  1. ^ Гао, Пэйшэн; Ву, Вейлин (2006). «Классификация нарушений качества электроэнергии с использованием машин вейвлетов и опорных векторов». Труды Шестой Международной конференции по проектированию и применению интеллектуальных систем - Том 01. ISDA '06. Вашингтон, округ Колумбия, США: Компьютерное общество IEEE. 1: 201–206. Дои:10.1109 / ISDA.2006.217. ISBN  9780769525280.
  2. ^ Глузман, С .; Юкалов, В. И. (01.01.2006). «Автомодельные силовые преобразования в задачах экстраполяции». Журнал математической химии. 39 (1): 47–56. arXiv:cond-mat / 0606104. Bibcode:2006 второй мат..6104G. Дои:10.1007 / s10910-005-9003-7. ISSN  1572-8897.
  3. ^ Howarth, R.J .; Эрл, С. А. М. (1 февраля 1979 г.). «Применение обобщенного преобразования мощности к геохимическим данным». Журнал Международной ассоциации математической геологии. 11 (1): 45–62. Дои:10.1007 / BF01043245. ISSN  1573-8868.
  4. ^ Peters, J. L .; Rushton, L .; Sutton, A.J .; Джонс, Д. Р .; Abrams, K. R .; Магглстон, М. А. (2005). «Байесовские методы для кросс-дизайна синтеза эпидемиологических и токсикологических данных». Журнал Королевского статистического общества, серия C. 54: 159–172. Дои:10.1111 / j.1467-9876.2005.00476.x.
  5. ^ а б Бикель, Питер Дж.; Доксум, Челл А. (июнь 1981 г.). «Новый взгляд на анализ преобразований». Журнал Американской статистической ассоциации. 76 (374): 296–311. Дои:10.1080/01621459.1981.10477649.
  6. ^ Сакия, Р. М. (1992), "Метод преобразования Бокса – Кокса: обзор", Статистик, 41 (2): 169–178, CiteSeerX  10.1.1.469.7176, Дои:10.2307/2348250, JSTOR  2348250
  7. ^ Ли, Фэнфэй (11 апреля 2005 г.), Преобразования Бокса – Кокса: обзор (PDF) (слайд-презентация), Сан-Паулу, Бразилия: Университет Сан-Паулу, Бразилия, получено 2014-11-02
  8. ^ а б Box, Джордж Э. П.; Кокс, Д. (1964). «Анализ трансформаций». Журнал Королевского статистического общества, серия B. 26 (2): 211–252. JSTOR  2984418. МИСТЕР  0192611.
  9. ^ Джонстон, Дж. (1984). Эконометрические методы (Третье изд.). Нью-Йорк: Макгроу-Хилл. С. 61–74. ISBN  978-0-07-032685-9.
  10. ^ Абрамович, Феликс; Ритов, Яаков (2013). Статистическая теория: краткое введение. CRC Press. С. 121–122. ISBN  978-1-4398-5184-5.
  11. ^ Набор данных BUPA о заболевании печени
  12. ^ Зарембка П. (1974). «Преобразование переменных в эконометрике». Границы в эконометрике. Нью-Йорк: Academic Press. С. 81–104. ISBN  0-12-776150-0.
  13. ^ Семейные графы степенного преобразования, Веб-страницы SOCR
  14. ^ Йео, Ин-Квон; Джонсон, Ричард А. (2000). «Новое семейство преобразований мощности для улучшения нормальности или симметрии». Биометрика. 87 (4): 954–959. Дои:10.1093 / biomet / 87.4.954. JSTOR  2673623.

Рекомендации

внешняя ссылка