Геокодирование - Википедия - Geocoding

Геокодирование это процесс получения текстового описания местоположения, например адрес или имя место, и возвращаясь географические координаты, часто пара широта / долгота, для определения местоположения на поверхности Земли.[1] Обратное геокодирование, с другой стороны, конвертирует географические координаты к описанию места, обычно к названию места или адресуемому месту. Геокодирование основывается на компьютерном представлении адресных точек, улично-дорожной сети, а также почтовых и административных границ.

  • Геокодировать (глагол):[2] укажите географические координаты, соответствующие (местоположению).
  • Геокодировать (имя существительное): это код который представляет географический объект (место расположения или же объект ).
    Иногда этот термин можно использовать в более широком смысле:[3] характеристика квартала, населенного пункта и т. д. в соответствии с такими демографическими характеристиками, как этнический состав или средний доход или образовательный уровень его жителей, особенно используемые в маркетинге.
  • Геокодер (имя существительное): часть программного обеспечения или (веб) сервис, реализующий процесс геокодирования, то есть набор взаимосвязанных компонентов в форме операций, алгоритмы и источники данных, которые работают вместе для создания пространственного представления для описательных географических ссылок.

Географические координаты, представляющие местоположения, часто сильно различаются по точности позиционирования. Примеры включают строительство центроиды, земельный участок центроидов, интерполированные местоположения на основе улица диапазоны, центроиды сегментов улиц, центроиды почтовых индексов (например. Zip коды, CEDEX ), и Административное деление Центроиды.

История

Геокодирование - подмножество Географическая информационная система (ГИС) пространственный анализ - вызывает интерес с начала 1960-х годов.

1960-е

В 1960 году первая действующая ГИС - названная Географическая информационная система Канады (CGIS) - был изобретен доктором. Роджер Томлинсон, который с тех пор был признан отцом GIS. CGIS использовалась для хранения и анализа данных, собранных для Канадская земельная инвентаризация, который отображал информацию о сельское хозяйство, дикая природа, и лесное хозяйство в масштабе 1: 50 000, чтобы регулировать возможности земли для сельская Канада. Однако CGIS просуществовала до 1990-х годов и никогда не была коммерчески доступной.

1 июля 1963 года пятизначные почтовые индексы были введены по всей стране почтовым отделением США (USPOD). В 1983 году девятизначные коды ZIP + 4 стали дополнительным идентификатором для более точного определения местоположения адресов.

В 1964 г. Гарвардская лаборатория компьютерной графики и пространственного анализа разработал новаторский программный код - например, GRID и SYMAP - все они были источниками для коммерческого развития ГИС.

В 1967 году команда Бюро переписи населения, в которую вошли математик Джеймс Корбетт.[4] и Дональд Кук[5] - изобрел Двойное независимое кодирование карт (DIME) - первая современная модель векторного отображения, которая зашифровывала диапазоны адресов в файлы уличных сетей и включала алгоритм геокодирования "процент вдоль".[6] Все еще используется такими платформами, как Карты Гугл и MapQuest Алгоритм «процент вдоль» обозначает расположение совпадающего адреса вдоль ссылочного объекта в процентах от общей длины ссылочного объекта. DIME был предназначен для использования Бюро переписи населения США, и он включал точное отображение граней кварталов, оцифровку узлов, представляющих перекрестки улиц, и формирование пространственные отношения. Нью-Хейвен, штат Коннектикут, был первым городом на Земле с геокодируемой сетевой базой данных улиц.

1980-е

В конце 1970-х годов два основных всеобщее достояние платформы геокодирования находились в разработке: ТРАВА ГИС и МОСС. В начале 1980-х годов появилось гораздо больше коммерческих поставщиков программного обеспечения для геокодирования, а именно: Интерграф, ESRI, КАРИС, ERDAS, и Корпорация MapInfo. Эти платформы объединили подход 1960-х годов к разделению пространственная информация с подходом организации этой пространственной информации в структуры базы данных.

В 1986 году система отображения и анализа карт (MIDAS) стала первой настольной программой геокодирования, разработанной для Операционная система DOS. Геокодирование было продвинуто из исследовательского отдела в деловой мир с приобретением MIDAS компанией MapInfo. MapInfo с тех пор была приобретена Питни Боуз, и был пионером в объединении геокодирования с бизнес-аналитикой; позволяя анализу местоположения предоставлять решения для общественный и частный сектор.

1990-е

В конце 20 века геокодирование стало более ориентированным на пользователя, особенно с помощью программного обеспечения ГИС с открытым исходным кодом. Картографические приложения и геопространственные данные стали более доступными через Интернет.

Поскольку метод рассылки / обратной связи был настолько успешным в Перепись 1980 года, Бюро переписи населения США смогло собрать большую геопространственную базу данных, используя интерполированный геокодирование улиц.[7] Эта база данных - наряду с общенациональным охватом домашних хозяйств переписью - позволила родить ТИГР (Топологически интегрированное географическое кодирование и привязка ).

Содержащий диапазоны адресов вместо отдельных адресов, TIGER с тех пор реализован почти на всех платформах программного обеспечения геокодирования, используемых сегодня. К концу Перепись 1990 года, TIGER "содержал широта Долгота -координат для более чем 30 миллионов пересечений и конечных точек пространственных объектов и почти 145 миллионов точек «формы» пространственных объектов, определяющих более 42 миллионов сегментов пространственных объектов, очерчивающих более 12 миллионов полигонов ».[8]

TIGER стал прорывом в создании геопространственных решений для «больших данных».

2000-е

В начале 2000-х годов наблюдался рост Система поддержки точности кодирования (CASS) стандартизация адресов. Сертификация CASS предлагается для всего программного обеспечения. продавцы и рекламные рассылки, которые хотят Почтовая служба США (USPS) для оценки качества своего программного обеспечения для стандартизации адресов. Ежегодно обновляемая сертификация CASS основана на точка доставки коды, почтовые индексы и почтовые индексы + 4. Принятие программного обеспечения, сертифицированного CASS, поставщиками программного обеспечения позволяет им получать скидки в массовая рассылка и стоимость доставки. Они могут извлечь выгоду из повышенной точности и эффективности этих массовых рассылок после наличия сертифицированной базы данных. В начале 2000-х годов платформы геокодирования также могли поддерживать несколько наборов данных.

В 2003 году платформы геокодирования были способны объединять почтовые индексы с данными улиц, обновляемыми ежемесячно. Этот процесс получил название «слияние».

Начиная с 2005 года платформы геокодирования включали геокодирование на основе центроидов участков. Геокодирование на основе центроидов участков позволило обеспечить высокую точность геокодирования адреса. Например, центроид участка позволяет геокодеру определять центроид определенного здания или участка земли. Платформы теперь также могли определять высоту определенных посылки.

В 2005 году также был представлен Номер посылки эксперта (APN). Юрисдикции налоговый инспектор смогла присвоить этот номер участкам недвижимости. Это позволило правильно идентифицировать и вести учет. APN важен для геокодирования территории, на которую распространяется аренда газа или нефти, и для индексации информации о налоге на имущество, предоставляемой общественности.

В 2006 году для платформ геокодирования были введены обратное геокодирование и обратный поиск APN. Это включало геокодирование местоположения числовой точки - с долгота и широта - на текстовый, читаемый адрес.

В 2008 и 2009 годах наблюдался рост интерактивных, ориентированных на пользователя платформ геокодирования, а именно MapQuest, Google Maps, Bing Maps и Global Positioning Systems (GPS). Эти платформы стали еще более доступными для общественности с одновременным ростом мобильной индустрии, в частности смартфонов.

2010-е

В 2010-х поставщики полностью поддерживают геокодирование и обратное геокодирование во всем мире. Интерфейс прикладного программирования (API) облачного геокодирования и локальное геокодирование позволили повысить коэффициент соответствия, точность и скорость. Сейчас популярна идея о том, что геокодирование может влиять на бизнес-решения. Это интеграция между процессом геокодирования и бизнес-аналитикой.

Будущее геокодирования также включает в себя трехмерное геокодирование, внутреннее геокодирование и многоязычный возврат для платформ геокодирования.

Процесс геокодирования

Геокодирование - это задача, которая включает в себя несколько наборов данных и процессов, которые работают вместе. Геокодер состоит из двух важных компонентов: набора базовых данных и алгоритма геокодирования. Каждый из этих компонентов состоит из подопераций и подкомпонентов. Без понимания того, как работают эти процессы геокодирования, трудно принимать обоснованные бизнес-решения на основе геокодирования.

Входные данные

Входные данные - это описательная текстовая информация (адрес или название здания), которую пользователь хочет преобразовать в числовые пространственные данные (широта и долгота) - в процессе геокодирования.

Классификация исходных данных

Входные данные подразделяются на две категории: относительные входные данные и абсолютные входные данные.

Относительные входные данные

Относительные входные данные - это текстовые описания местоположения, которые сами по себе не могут вывести пространственное представление этого местоположения. Такие данные выводят относительный геокод, который зависит от других опорных местоположений и географически относительно них. Примером относительного геокода является интерполяция адреса с использованием площадных единиц или линейных векторов. «Через дорогу от Эмпайр-стейт-билдинг» - пример относительных входных данных. Искомое местоположение не может быть определено без идентификации Эмпайр-стейт-билдинг. Платформы геокодирования часто не поддерживают такие относительные местоположения, но в этом направлении есть успехи.

Абсолютные входные данные

Абсолютные входные данные - это текстовые описания местоположения, которые сами по себе могут выводить пространственное представление этого местоположения. Этот тип данных выводит абсолютное известное местоположение независимо от других местоположений. Например, почтовые индексы USPS; Почтовый индекс USPS + 4 кода; полные и частичные почтовые адреса; Почтовые ящики USPS; сельские маршруты; города; округа; перекрестки; и именованные места могут быть абсолютно указаны в источнике данных.

Когда существует большая вариативность способа представления адресов - например, слишком много входных данных или слишком мало входных данных - геокодеры используют нормализацию адресов и стандартизацию адресов для решения этой проблемы.

Адресная интерполяция

Простой метод геокодирования - это адрес интерполяция. Этот метод использует данные с улицы географическая информационная система где уличная сеть уже нанесена на карту в географическом пространстве координат. Каждому сегменту улицы присваивается диапазон адресов (например, номера домов от одного сегмента до другого). Геокодирование берет адрес, сопоставляет его с улицей и конкретным сегментом (например, блокировать, в городах, которые используют условное обозначение «блочность»). Затем геокодирование интерполирует положение адреса в пределах диапазона сегмента.

Пример

Например: 742 Evergreen Terrace

Скажем, этот сегмент (например, квартал) Evergreen Terrace проходит от 700 до 799. Четные адреса приходятся на восточную сторону Evergreen Terrace, а адреса с нечетными номерами - на западной стороне улицы. 742 Evergreen Terrace (вероятно) будет располагаться чуть менее чем на полпути вверх по кварталу, на восточной стороне улицы. В этом месте вдоль улицы будет нанесена точка, возможно, смещенная на расстояние к востоку от центральной линии улицы.

Осложняющие факторы

Однако этот процесс не всегда так прост, как в этом примере.

  • различая неоднозначные адреса, такие как 742 Evergreen Terrace и 742 W Evergreen Terrace.
  • попытка геокодирования новых адресов для улицы, которая еще не добавлена ​​в базу данных географической информационной системы.

Хотя в Спрингфилде может быть 742 Evergreen Terrace, в Шелбивилле также может быть 742 Evergreen Terrace. Эту проблему можно решить, запросив название города (а также штата, провинции, страны и т. Д.). Бостон, Массачусетс[9] имеет несколько местоположений «100 Вашингтон-стрит», потому что несколько городов были аннексированы без изменения названий улиц, что требует использования уникальных почтовые индексы или названия районов для устранения неоднозначности. Точность геокодирования можно значительно улучшить, если сначала проверка адреса практики. Проверка адреса подтвердит существование адреса и устранит двусмысленность. После определения действительного адреса очень легко геокодировать и определить координаты широты и долготы. Наконец, несколько предостережений при использовании интерполяции:

  • Типичная атрибуция участка улицы предполагает, что все участки с четными номерами находятся на одной стороне участка, а все участки с нечетными номерами - на другой. В реальной жизни это часто не так.
  • Интерполяция предполагает, что данные участки равномерно распределены по длине сегмента. В реальной жизни это почти никогда не бывает; нередко геокодированный адрес отклоняется на несколько тысяч футов.
  • Интерполяция также предполагает, что улица прямая. Если улица изогнута, геокодированное местоположение не обязательно будет соответствовать физическому местоположению адреса.
  • Информация о сегменте (особенно из таких источников, как ТИГР ) включает максимальную верхнюю границу адресов и интерполируется, как если бы использовался полный диапазон адресов. Например, для сегмента (блока) может быть указан диапазон 100–199, но последний адрес в конце блока - 110. В этом случае адрес 110 будет геокодирован на 10% расстояния вниз по сегменту, а не чем ближе к концу.
  • Большинство реализаций интерполяции создают точку в качестве их результирующего адреса. На самом деле физический адрес распределен по длине сегмента, т.е. рассмотрите возможность геокодирования адреса супермаркет - физический участок может проходить на некотором расстоянии вдоль сегмента улицы (или его можно рассматривать как двумерный многоугольник, заполняющий пространство, который может выходить на несколько разных улиц, или, что еще хуже, для городов с многоуровневыми улицами, трехмерный форма, которая встречается с разными улицами на нескольких разных уровнях), но интерполяция рассматривает это как особенность.

Очень распространенная ошибка - это вера в рейтинг точности геокодируемых атрибутов данной карты. Такая точность, указанная поставщиками, не влияет на присвоение адреса правильному сегменту или правильной стороне сегмента, а также не приводит к точному положению в этом правильном сегменте. С процессом геокодирования, используемым для Перепись США В наборах данных TIGER 5–7,5% адресов могут быть назначены другим переписной тракт, в то время как исследование австралийской системы, подобной TIGER, показало, что 50% геокодированных точек были сопоставлены с неправильным участком собственности.[10]Точность геокодированных данных также может иметь отношение к качеству исследования, в котором они используются. Одно исследование[11] Группа исследователей из Айовы обнаружила, что общий метод геокодирования с использованием наборов данных TIGER, как описано выше, может привести к потере до 40% мощности статистического анализа. Альтернативой является использование ортофото или закодированные данные изображения, такие как данные адресной точки из Обследование боеприпасов в Великобритании, но такие наборы данных обычно дороги.

По этой причине очень важно избегать использования интерполированных результатов, за исключением некритических приложений. Интерполированное геокодирование обычно не подходит для принятия авторитетных решений, например, если это решение повлияет на безопасность жизни. Например, аварийные службы не принимают авторитетных решений на основе своих интерполяций; скорая помощь или пожарная машина будут отправлены всегда, независимо от того, что написано на карте.[нужна цитата ]

Другие техники

В сельской местности или других местах, где отсутствуют качественные данные уличной сети и адресация, GPS полезно для отображения местоположения. Для дорожно-транспортных происшествий подходящим методом является геокодирование до перекрестка улиц или средней точки вдоль центральной линии улицы. Большинство автомагистралей в развитых странах имеют отметки миль для помощи в аварийном реагировании, техническом обслуживании и навигации. Также возможно использовать комбинацию этих методов геокодирования - с использованием определенного метода для определенных случаев и ситуаций и других методов для других случаев. В отличие от геокодирования записей структурированных почтовых адресов, разрешение топонима сопоставляет названия мест в коллекциях неструктурированных документов с соответствующими пространственными контурами.

Коды мест предлагают новый способ создания адресов, сгенерированных в цифровом виде, без информации, с использованием спутниковых снимков и машинного обучения, например, Робокоды

Исследование

Исследования представили новый подход к аспектам контроля и знания при геокодировании с использованием парадигмы на основе агентов.[12] В дополнение к новой парадигме геокодирования были разработаны дополнительные методы коррекции и алгоритмы управления.[13] Подход представляет географические элементы, которые обычно встречаются в адресах как отдельных агентов. Это обеспечивает общность и двойственность управления и географического представления. Помимо научных публикаций, новый подход и последующий прототип получили освещение в национальных СМИ Австралии.[14] Исследование проводилось в Университете Кертина в Перте, Западная Австралия.[15]

Использует

Геокодированные местоположения полезны во многих ГИС-анализах, картографии, рабочем процессе принятия решений, смешивании транзакций или внедрении в более крупные бизнес-процессы. В Интернете геокодирование используется в таких сервисах, как маршрутизация и местный поиск. Геокодирование вместе с GPS предоставляет данные о местоположении для геотегирование СМИ, такие как фотографии или RSS Предметы.

Проблемы конфиденциальности

Распространение и простота доступа к геокодированию (и обратное геокодирование ) вызывает проблемы с конфиденциальностью. Например, при картировании преступлений правоохранительные органы стремятся уравновесить права потерпевших и правонарушителей на неприкосновенность частной жизни с правом общественности на получение информации. Правоохранительные органы экспериментировали с альтернативными методами геокодирования, которые позволяют им замаскировать часть деталей местоположения (например, особенности адреса, которые могут привести к идентификации жертвы или преступника). Также при предоставлении онлайн картирование преступлений для общественности они также размещают заявления об отказе от ответственности в отношении точности местоположения точек на карте, признавая эти методы маскировки местоположения, и устанавливают условия использования информации.

Смотрите также

Рекомендации

  1. ^ https://pelias.io/
  2. ^ Термин «геокодирование» как глагол, как определено в Оксфордском словаре английского языка по адресу https://en.oxford dictionaries.com/definition/geocode
  3. ^ Термин "геокодирование", как существительное, определение, используемое http://www.dictionary.com/browse/geocode
  4. ^ Корбетт, Джеймс П. Топологические принципы в картографии. Vol. 48. Министерство торговли США, Бюро переписи населения, 1979 г.
  5. ^ "Краткое резюме" (PDF).
  6. ^ Оливарес, Мириам. "Географические информационные системы в Йельском университете: ресурсы геокодирования". guides.library.yale.edu. Получено 22 июн 2016.
  7. ^ «Пространственное включение данных: что такое геокодирование?». Национальная справочная служба уголовного правосудия. Получено 22 июн 2016.
  8. ^ "25 лет ТИГРУ". census.maps.arcgis.com. Получено 22 июн 2016.
  9. ^ Карты Гугл
  10. ^ Рэтклифф, Джерри Х. (2001). «О точности геокодированных адресных данных типа TIGER по отношению к кадастровым и переписным площадным единицам» (PDF). Международный журнал географической информатики. 15 (5): 473–485. Дои:10.1080/13658810110047221. S2CID  14061774. Архивировано из оригинал (PDF) 23 июня 2006 г.
  11. ^ Мазумдар С., Раштон Дж., Смит Б. и другие.. Точность геокодирования и восстановление взаимосвязей между воздействием окружающей среды и здоровьем. Международный журнал географии здоровья. 2008;7:1–13. Дои:10.1186 / 1476-072X-7-13. PMID  18387189.
  12. ^ Хатчинсон, Мэтью Дж (2010). Разработка агентно-ориентированной структуры для интеллектуального геокодирования (Кандидатская диссертация). Куртинский университет.
  13. ^ Агент-ориентированная структура для включения интеллектуальных служб геокодирования
  14. ^ Дженнифер Форешью (24 ноября 2009 г.). «Сложные адреса - без проблем для IntelliGeoLocator». Австралийский. Получено 9 мая 2011.
  15. ^ Департамент образования Западной Австралии (апрель 2011 г.). "X отмечает точку". Школьные вопросы. Получено 9 мая 2011.

внешняя ссылка