Пространственная описательная статистика - Spatial descriptive statistics
Эта статья нужны дополнительные цитаты для проверка.Октябрь 2009 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
Пространственная описательная статистика это пересечение пространственная статистика и описательная статистика; эти методы используются для различных целей в географии, особенно для количественного анализа данных, включающего Географические информационные системы (ГИС).
Типы пространственных данных
Простейшие формы пространственных данных: сеточные данные, в котором скалярная величина измеряется для каждой точки в регулярной сетке точек, и наборы точек, в котором наблюдается набор координат (например, точек на плоскости). Примером данных с координатной привязкой может быть спутниковое изображение плотности леса, которое было оцифровано на сетке. Примером набора точек могут быть координаты широты и долготы всех вязов на определенном участке земли. Более сложные формы данных включают в себя отмеченные наборы точек и пространственные временные ряды.
Меры пространственной центральной тенденции
Среднее по координатам набора точек - это центроид, который решает то же вариационная задача в плоскости (или в евклидовом пространстве более высокой размерности), которую вычисляет известное среднее значение на реальной прямой, то есть центроид имеет наименьшее возможное среднее квадратическое расстояние до всех точек в наборе.
Меры пространственной дисперсии
Дисперсия фиксирует степень, в которой точки в наборе точек отделены друг от друга. Для большинства приложений пространственная дисперсия должна определяться количественно, инвариантно по отношению к поворотам и отражениям. Несколько простых мер пространственной дисперсии для набора точек можно определить с помощью ковариационная матрица координат точек. В след, то детерминант, и самый большой собственное значение ковариационной матрицы можно использовать в качестве меры пространственной дисперсии.
Мерой пространственной дисперсии, не основанной на ковариационной матрице, является среднее расстояние между ближайшими соседями.[1]
Меры пространственной однородности
Однородный набор точек на плоскости - это набор, который распределен таким образом, что примерно одинаковое количество точек встречается в любой круговой области данной области. Набор точек, в котором отсутствует однородность, может быть пространственно сгруппированный в определенном пространственном масштабе. Простая вероятностная модель для пространственно однородных точек - это Пуассоновский процесс в плоскости с постоянной функцией интенсивности.
Рипли K и L функции
Рипли K и L функции [2] - это тесно связанные описательные статистики для обнаружения отклонений от пространственной однородности. В K функция (технически ее оценка на основе выборки) определяется как
куда dij это евклидово расстояние между яth и jth точек в наборе данных п точек, t - радиус поиска, λ - средняя плотность точек (обычно оценивается как п/А, куда А - площадь области, содержащей все точки) и я это индикаторная функция (1, если его операнд истинен, 0 в противном случае).[3] В двух измерениях, если точки приблизительно однородны, должен быть примерно равен πт2.
Для анализа данных дисперсия стабилизировалась по Рипли. K функция называется L функция обычно используется. Примерная версия L функция определяется как
Для приблизительно однородных данных L функция имеет ожидаемое значение т и его дисперсия примерно постоянна в т. Обычный сюжет - это график против т, которая будет приблизительно следовать за горизонтальной нулевой осью с постоянной дисперсией, если данные следуют однородному пуассоновскому процессу.
Используя K-функцию Рипли, вы можете определить, имеют ли точки случайный, рассредоточенный или кластерный образец распределения в определенном масштабе.[4]
Смотрите также
- Геостатистика
- Вариограмма
- Коррелограмма
- Кригинг
- Тест Кузика – Эдвардса для кластеризации субпопуляций внутри кластерных популяций
- Пространственная автокорреляция
Рекомендации
- ^ Кларк, Филип; Эванс, Фрэнсис (1954). «Расстояние до ближайшего соседа как мера пространственных отношений в популяциях». Экология. 35 (4): 445–453. Дои:10.2307/1931034. JSTOR 1931034.
- ^ Рипли, Б. (1976). «Анализ второго порядка стационарных точечных процессов». Журнал прикладной теории вероятностей. 13 (2): 255–266. Дои:10.2307/3212829. JSTOR 3212829.
- ^ Диксон, Филип М. (2002). «К-функция Рипли» (PDF). В Эль-Шаарави, Абдель Х .; Пигорш, Вальтер В. (ред.). Энциклопедия окружающей среды. Джон Вили и сыновья. С. 1796–1803. ISBN 978-0-471-89997-6. Получено 25 апреля, 2014.
- ^ Wilschut, L.I .; Laudisoit, A .; Hughes, N.K .; Addink, E.A .; de Jong, S.M .; Heesterbeek, J.A.P .; Reijniers, J .; Eagle, S .; Дубянский, В.М .; Бегон, М. (2015). «Пространственное распределение носителей чумы: анализ точечной структуры норок больших песчанок в Казахстане». Журнал биогеографии. 42 (7): 1281–1292. Дои:10.1111 / jbi.12534. ЧВК 4737218. PMID 26877580.