Приближение Веккьи - Vecchia approximation
Эта статья требует внимания эксперта по предмету. Конкретная проблема: Требуется проверка содержания и источников ..Октябрь 2020) ( |
Приближение Веккьи это Гауссовские процессы приближение метод, первоначально разработанный Альдо Веккья, статистик Геологическая служба США. Это одна из самых ранних попыток использовать гауссовские процессы в параметрах большой размерности. С тех пор он был широко обобщен, дав начало множеству современных приближений.
Интуиция
Совместное распределение вероятностей для событий , и , обозначенный , можно выразить как
Приближение Веккьи принимает вид, например,
и точен, когда события и близки к условно независимым данным знаниям . Конечно, можно было бы в качестве альтернативы выбрать приближение
и поэтому использование приближения требует некоторого знания о том, какие события близки к условно независимым при данных других. Более того, мы могли бы выбрать другой порядок, например
К счастью, во многих случаях существуют хорошие эвристики, принимающие решения о том, как построить приближение.
Технически общие версии аппроксимации приводят к разреженному Фактор холецкого матрицы точности. Использование стандартной факторизации Холецкого дает записи, которые можно интерпретировать.[1] как условные корреляции с нулями, указывающими на отсутствие независимости (так как модель гауссова). Эти отношения независимости могут быть альтернативно выражены с помощью графических моделей, и существуют теоремы, связывающие структуру графа и порядок вершин с нулями в факторе Холецкого. В частности, известно[2] что зависимости, закодированные в моральном графе, приводят к факторам Холецкого матрицы точности, которые не имеют заполните.
Формальное описание
Проблема
Позволять быть Гауссовский процесс проиндексировано со средней функцией и ковариационная функция . Предположить, что конечное подмножество и вектор значений оценивается в , т.е. за . Предположим далее, что наблюдается куда с . В этом контексте две наиболее распространенные задачи вывода включают оценку вероятности
или делать прогнозы значений за и , т.е. вычисление
Оригинальная рецептура
Первоначальный метод Веккья начинается с наблюдения, что общая плотность наблюдений можно записать как произведение условных распределений
Приближение Веккьи вместо этого предполагает, что для некоторых
Веккья также предложил применять это приближение к наблюдениям, которые лексикографически переупорядочены с использованием их пространственных координат. Хотя его простой метод имеет много недостатков, он снизил вычислительную сложность до . Многие из его недостатков были устранены с помощью последующих обобщений.
Общая формулировка
Хотя с концептуальной точки зрения допущение приближения Веккьи часто оказывается довольно ограничительным и неточным.[3] Это вдохновило на важные обобщения и улучшения, внесенные в базовую версию на протяжении многих лет: включение скрытых переменных, более сложное кондиционирование и лучший порядок. Различные частные случаи общего приближения Веккья могут быть описаны в терминах того, как выбираются эти три элемента.[4]
Скрытые переменные
Чтобы описать расширения метода Веккья в его наиболее общей форме, определите и обратите внимание, что для в нем, как и в предыдущем разделе
потому что дано все остальные переменные не зависят от .
Заказ
Широко отмечалось, что первоначальный лексикографический порядок, основанный на координатах, когда двумерный дает плохие результаты.[5] Совсем недавно были предложены другие упорядочения, некоторые из которых обеспечивают квазислучайное упорядочение точек. Было доказано, что они обладают высокой масштабируемостью и значительно повышают точность.[3]
Кондиционирование
Подобно базовой версии, описанной выше, для данного порядка общее приближение Веккьи может быть определено как
куда . С следует, что предполагая, что условия заменить на . Однако оказывается, что иногда обусловливание некоторых наблюдений увеличивает разреженность фактора Холецкого матрицы точности . Следовательно, вместо этого можно было бы рассматривать множества и такой, что и выразить в качестве
Несколько способов выбора и были предложены, в первую очередь подходы гауссова процесса ближайшего соседа (NNGP) и приближения с несколькими разрешениями (MRA) с использованием , стандартная Vecchia с использованием и Редкий Генерал Веккья, где оба и непустые.[4]
Программного обеспечения
Было разработано несколько пакетов, реализующих несколько вариантов приближения Веккья.
- GPvecchia пакет R доступен через CRAN (язык программирования R) который реализует большинство версий приближения Веккья
- GpGp R packagae доступен через CRAN (язык программирования R) который реализует масштабируемый метод упорядочивания для пространственных задач, который значительно повышает точность.
- spNNGP пакет R доступен через CRAN (язык программирования R) который реализует латентное приближение Веккьи
- pyMRA это пакет Python, доступный через pyPI реализация приближения с несколькими разрешениями, частного случая общего метода Веккья, используемого в динамических моделях пространства состояний
Примечания
- ^ Пурахмади, М. (2007). "Разложения Холецкого и оценка ковариационной матрицы: ортогональность параметров корреляции дисперсии". Биометрика. 94 (4): 1006–1013. Дои:10.1093 / biomet / asm073. ISSN 0006-3444.
- ^ Харе, Кшитидж; Раджаратнам, Бала (2011). «Распределения Уишарта для моделей разложимых ковариационных графов». Анналы статистики. 39 (1): 514–555. Дои:10.1214 / 10-AOS841. ISSN 0090-5364.
- ^ а б Гиннесс, Джозеф (2018). «Методы перестановки и группировки для уточнения приближений гауссовских процессов». Технометрика. 60 (4): 415–429. Дои:10.1080/00401706.2018.1437476. ISSN 0040-1706. ЧВК 6707751.
- ^ а б Кацфус, Матиас; Гиннесс, Джозеф. "Общая основа для приближений Веккья гауссовских процессов". arXiv:1708.06302 [stat.CO ].
- ^ Судипто Банерджи; Брэдли П. Карлин; Алан Э. Гельфанд (12 сентября 2014 г.). Иерархическое моделирование и анализ пространственных данных, второе издание. CRC Press. ISBN 978-1-4398-1917-3.