Приближение Веккьи - Vecchia approximation

Приближение Веккьи это Гауссовские процессы приближение метод, первоначально разработанный Альдо Веккья, статистик Геологическая служба США. Это одна из самых ранних попыток использовать гауссовские процессы в параметрах большой размерности. С тех пор он был широко обобщен, дав начало множеству современных приближений.

Интуиция

Совместное распределение вероятностей для событий , и , обозначенный , можно выразить как

Приближение Веккьи принимает вид, например,

и точен, когда события и близки к условно независимым данным знаниям . Конечно, можно было бы в качестве альтернативы выбрать приближение

и поэтому использование приближения требует некоторого знания о том, какие события близки к условно независимым при данных других. Более того, мы могли бы выбрать другой порядок, например

К счастью, во многих случаях существуют хорошие эвристики, принимающие решения о том, как построить приближение.

Технически общие версии аппроксимации приводят к разреженному Фактор холецкого матрицы точности. Использование стандартной факторизации Холецкого дает записи, которые можно интерпретировать.[1] как условные корреляции с нулями, указывающими на отсутствие независимости (так как модель гауссова). Эти отношения независимости могут быть альтернативно выражены с помощью графических моделей, и существуют теоремы, связывающие структуру графа и порядок вершин с нулями в факторе Холецкого. В частности, известно[2] что зависимости, закодированные в моральном графе, приводят к факторам Холецкого матрицы точности, которые не имеют заполните.

Формальное описание

Проблема

Позволять быть Гауссовский процесс проиндексировано со средней функцией и ковариационная функция . Предположить, что конечное подмножество и вектор значений оценивается в , т.е. за . Предположим далее, что наблюдается куда с . В этом контексте две наиболее распространенные задачи вывода включают оценку вероятности

или делать прогнозы значений за и , т.е. вычисление

Оригинальная рецептура

Первоначальный метод Веккья начинается с наблюдения, что общая плотность наблюдений можно записать как произведение условных распределений

Приближение Веккьи вместо этого предполагает, что для некоторых

Веккья также предложил применять это приближение к наблюдениям, которые лексикографически переупорядочены с использованием их пространственных координат. Хотя его простой метод имеет много недостатков, он снизил вычислительную сложность до . Многие из его недостатков были устранены с помощью последующих обобщений.

Общая формулировка

Хотя с концептуальной точки зрения допущение приближения Веккьи часто оказывается довольно ограничительным и неточным.[3] Это вдохновило на важные обобщения и улучшения, внесенные в базовую версию на протяжении многих лет: включение скрытых переменных, более сложное кондиционирование и лучший порядок. Различные частные случаи общего приближения Веккья могут быть описаны в терминах того, как выбираются эти три элемента.[4]

Скрытые переменные

Чтобы описать расширения метода Веккья в его наиболее общей форме, определите и обратите внимание, что для в нем, как и в предыдущем разделе

потому что дано все остальные переменные не зависят от .

Заказ

Широко отмечалось, что первоначальный лексикографический порядок, основанный на координатах, когда двумерный дает плохие результаты.[5] Совсем недавно были предложены другие упорядочения, некоторые из которых обеспечивают квазислучайное упорядочение точек. Было доказано, что они обладают высокой масштабируемостью и значительно повышают точность.[3]

Кондиционирование

Подобно базовой версии, описанной выше, для данного порядка общее приближение Веккьи может быть определено как

куда . С следует, что предполагая, что условия заменить на . Однако оказывается, что иногда обусловливание некоторых наблюдений увеличивает разреженность фактора Холецкого матрицы точности . Следовательно, вместо этого можно было бы рассматривать множества и такой, что и выразить в качестве

Несколько способов выбора и были предложены, в первую очередь подходы гауссова процесса ближайшего соседа (NNGP) и приближения с несколькими разрешениями (MRA) с использованием , стандартная Vecchia с использованием и Редкий Генерал Веккья, где оба и непустые.[4]

Программного обеспечения

Было разработано несколько пакетов, реализующих несколько вариантов приближения Веккья.

  • GPvecchia пакет R доступен через CRAN (язык программирования R) который реализует большинство версий приближения Веккья
  • GpGp R packagae доступен через CRAN (язык программирования R) который реализует масштабируемый метод упорядочивания для пространственных задач, который значительно повышает точность.
  • spNNGP пакет R доступен через CRAN (язык программирования R) который реализует латентное приближение Веккьи
  • pyMRA это пакет Python, доступный через pyPI реализация приближения с несколькими разрешениями, частного случая общего метода Веккья, используемого в динамических моделях пространства состояний

Примечания

  1. ^ Пурахмади, М. (2007). "Разложения Холецкого и оценка ковариационной матрицы: ортогональность параметров корреляции дисперсии". Биометрика. 94 (4): 1006–1013. Дои:10.1093 / biomet / asm073. ISSN  0006-3444.
  2. ^ Харе, Кшитидж; Раджаратнам, Бала (2011). «Распределения Уишарта для моделей разложимых ковариационных графов». Анналы статистики. 39 (1): 514–555. Дои:10.1214 / 10-AOS841. ISSN  0090-5364.
  3. ^ а б Гиннесс, Джозеф (2018). «Методы перестановки и группировки для уточнения приближений гауссовских процессов». Технометрика. 60 (4): 415–429. Дои:10.1080/00401706.2018.1437476. ISSN  0040-1706. ЧВК  6707751.
  4. ^ а б Кацфус, Матиас; Гиннесс, Джозеф. "Общая основа для приближений Веккья гауссовских процессов". arXiv:1708.06302 [stat.CO ].
  5. ^ Судипто Банерджи; Брэдли П. Карлин; Алан Э. Гельфанд (12 сентября 2014 г.). Иерархическое моделирование и анализ пространственных данных, второе издание. CRC Press. ISBN  978-1-4398-1917-3.