Связанные данные - Linked data
В вычисление, связанные данные (часто пишется с заглавной буквы как Связанные данные) - это структурированные данные, которые связаны с другими данными, поэтому они становятся более полезными благодаря семантические запросы. Он основан на стандарте Интернет такие технологии как HTTP, RDF и URI, но вместо того, чтобы использовать их для обслуживания веб-страниц только для людей, читающих, он расширяет их, чтобы делиться информацией таким образом, чтобы компьютеры могли ее автоматически прочитать. Часть видения связанных данных предназначена для Интернет стать глобальным база данных.[1]
Тим Бернерс-Ли, директор Консорциум World Wide Web (W3C), ввел этот термин в заметку о дизайне 2006 г. Семантическая сеть проект.[2]
Связанные данные также могут быть открытые данные, в этом случае его обычно описывают как связанные открытые данные (LOD).[3]
Принципы
В своей заметке 2006 г. "Связанные данные" Тим Бернерс-Ли изложил четыре принципа связанных данных, перефразируя их следующим образом:[2]
- Унифицированные идентификаторы ресурсов (URI) следует использовать для именования и идентификации отдельных вещей.
- HTTP Следует использовать URI, чтобы эти вещи можно было найти, интерпретировать и впоследствии «разыменовать».
- Полезная информация о том, что идентифицирует имя, должна предоставляться через открытые стандарты, такие как RDF, SPARQL, так далее.
- При публикации данных в Интернете следует ссылаться на другие объекты, используя их имена на основе HTTP URI.
Тим Бернерс-Ли позже подтвердил эти принципы на конференции 2009 г. Конференция TED, снова перефразируя следующее:[4]
- Все концептуальные вещи должны иметь имя, начинающееся с HTTP.
- Поиск имени HTTP должен вернуть полезные данные о рассматриваемом объекте в стандартном формате.
- Все остальное, с чем это связано через свои данные, также должно иметь имя, начинающееся с HTTP.
Составные части
- URI
- HTTP
- Структурированные данные с помощью контролируемый словарный запас термины и определения наборов данных, выраженные в Структура описания ресурсов сериализация форматы, такие как RDFa, RDF / XML, N3, Черепаха, или же JSON-LD
- Платформа связанных данных
Связанные открытые данные
Связанные открытые данные связаны данные, которые открытые данные.[5][6][7] Тим Бернерс-Ли дает самое четкое определение связанных открытых данных в отличие от связанных данных.
Связанные открытые данные (LOD) - это связанные данные, которые выпускаются по открытой лицензии, что не препятствует их повторному использованию бесплатно.
Большие связанные наборы открытых данных включают DBpedia и Викиданные.
История
Термин «связанные открытые данные» используется по крайней мере с февраля 2007 г., когда список рассылки «Связанные открытые данные»[9] был создан.[10] Список рассылки изначально размещался ПОДОБНЫЙ проект[11] на Массачусетский Институт Технологий.
Связывание проекта сообщества открытых данных
Цель проекта сообщества Linking Open Data группы W3C Semantic Web Education and Outreach - расширить Интернет с помощью общие данные путем публикации различных открыто наборы данных как RDF в Интернете и установив RDF связи между элементами данных из разных источников данных. В октябре 2007 г. наборы данных содержали более двух миллиардов RDF. тройки, которые были связаны между собой более чем двумя миллионами ссылок RDF.[13][14] К сентябрю 2011 года это число выросло до 31 миллиарда троек RDF, связанных между собой примерно 504 миллионами ссылок RDF. Подробная статистическая разбивка была опубликована в 2014 году.[15]
Проекты Европейского Союза
Есть ряд Евросоюз проекты со связанными данными. К ним относятся проект связанных открытых данных круглосуточно (LATC),[16] проект PlanetData,[17] проект DaPaaS (Data-and-Platform-as-a-Service),[18] и проект связанных открытых данных 2 (LOD2).[19][20][21] Связывание данных - одна из основных целей Портал открытых данных ЕС, что делает доступными тысячи наборов данных для повторного использования и связывания.
Онтологии
Онтологии являются формальными описаниями структур данных. Некоторые из наиболее известных онтологий:
- FOAF - онтология, описывающая людей, их свойства и отношения
- ЗОНТИК - легкая справочная структура из 20 000 классов предметных понятий и их взаимосвязей, полученных из OpenCyc, которые могут действовать как классы привязки к внешним данным; также имеет ссылки на 1,5 миллиона именованных сущностей из DBpedia и ЯГО
Наборы данных
- DBpedia - набор данных, содержащий извлеченные данные из Википедии; он содержит около 3,4 миллиона концепций, описанных 1 миллиардом тройки, в том числе рефераты на 11 разных языках
- GeoNames - предоставляет RDF-описания более 7 500 000 географических объектов по всему миру.
- Викиданные - совместно созданный связанный набор данных, который действует как центральное хранилище для структурированных данных своих Фонд Викимедиа родственные проекты
- Глобальная база данных идентификаторов исследований (СЕТКА) - международная база данных 89 506 учреждений, занимающихся академическими исследованиями, с 14 401 отношениями, моделирует два типа отношений: родительско-дочерние отношения, которые определяют подчиненную ассоциацию, и связанные отношения, описывающие другие ассоциации.[22][23]
Отношения экземпляра набора данных и класса
Доступны интерактивные диаграммы, которые показывают отдельные наборы данных и их отношения в созданном DBpedia облаке LOD (как показано на рисунках справа).[24][25]
Смотрите также
- Коллектив американского искусства - консорциум художественных музеев США стремится создать критическую массу связанных открытых данных об американском искусстве
- Авторитетный контроль - о контролируемые заголовки в каталогах библиотек
- Анализ цитирования - для цитирования между научными статьями
- Гиперданные
- Сетевая модель - старый тип системы управления базами данных
- Schema.org
- Пустота - Словарь взаимосвязанных наборов данных
- Язык веб-онтологий
Рекомендации
- ^ «Связанные данные как JSON». Связанные данные как JSON. Получено 2020-12-04.
- ^ а б c Тим Бернерс-Ли (2006-07-27). «Связанные данные». Проблемы дизайна. W3C. Получено 2010-12-18.
- ^ «Что такое связанные данные и связанные открытые данные?». Онтекст. Получено 2019-05-08.
- ^ "Тим Бернерс-Ли в следующей сети".
- ^ «Часто задаваемые вопросы (FAQ) - Связанные данные - Подключение распределенных данных через Интернет».
- ^ «COAR» 7 вещей, которые вы должны знать о… связанных данных ». Архивировано из оригинал на 2015-11-18. Получено 2015-12-29.
- ^ "Основы связанных данных для технических специалистов".
- ^ «5 звезд в области открытых данных».
- ^ "[email protected] Почтовые архивы".
- ^ "SweoIG / TaskForces / CommunityProjects / LinkingOpenData / NewsArchive".
- ^ «SIMILE Project - Списки рассылки».
- ^ Связывание диаграммы облака открытых данных за 2014 год, составлено Максом Шмахтенбергом, Кристианом Бизером, Аней Йенч и Ричардом Циганиак. http://lod-cloud.net/
- ^ "SweoIG / TaskForces / CommunityProjects / LinkingOpenData - W3C Wiki". esw.w3.org. Получено 22 марта 2018.
- ^ Фензель, Дитер; Факка, Федерико Микеле; Симперл, Елена; Иоан, Тома (2011). Семантические веб-службы. Springer. п. 99. ISBN 978-3642191923.
- ^ Максимум. «Состояние облака LOD». connecteddatacatalog.dws.informatik.uni-mannheim.de. Получено 22 марта 2018.
- ^ «Связанные открытые данные круглосуточно (LATC)». latc-project.eu. Архивировано из оригинал 19 сентября 2018 г.. Получено 22 марта 2018.
- ^ «Добро пожаловать в PlanetData! - PlanetData». planet-data.eu. Получено 22 марта 2018.
- ^ «DaPaaS». project.dapaas.eu. Получено 22 марта 2018.
- ^ Связывание открытых данных 2 (LOD2)
- ^ «Проекты CORDIS FP7 ICT - LOD2». Европейская комиссия. 2010-04-20.
- ^ «Информационный бюллетень по проекту LOD2 - Резюме проекта» (PDF). 2010-09-01. Архивировано из оригинал (PDF) на 2011-07-20. Получено 2010-12-18.
- ^ «Статистика GRID». grid.ac/stats. Получено 2018-10-26.
- ^ «Политики GRID». grid.ac. Получено 2018-10-26.
- ^ «Отношения экземпляров между наборами данных». fu-berlin.de. Получено 22 марта 2018.
- ^ «Классовые отношения между наборами данных». Архивировано из оригинал 28 августа 2011 г.. Получено 22 марта 2018.
дальнейшее чтение
- Ахмет Сойлу, Феликс Мёдритшер и Патрик Де Каусмеккер. 2012 г. «Повсеместная веб-навигация посредством сбора встроенных семантических данных: мобильный сценарий». Интегрированная компьютерная инженерия 19 (1): 93–109.
- Связанные данные: превращение Интернета в глобальное пространство данных (2011) Тома Хита и Кристиана Бизера, Лекции по синтезу семантической сети: теория и технология, Morgan & Claypool
- Как публиковать связанные данные в Интернете, Крис Байзер, Ричард Циганиак и Том Хит, Учебное пособие по связанным данным, Свободный университет Берлина, Германия, 27 июля 2007 г.
- Интернету исполняется 20 лет: связанные данные дают людям силу, часть 1 из 4, Марк Фишетти, Scientific American 2010 Октябрь 23
- Связанные данные - это просто больше данных - Пратик Джайн, Паскаль Хитцлер, Питер З. Йе, Кунал Верма и Амит П. Шет. В: Дэн Брикли, Виней К. Чаудри, Гарри Халпин и Дебора МакГиннесс: Связанные данные и искусственный интеллект. Технический отчет SS-10-07, AAAI Press, Менло-Парк, Калифорния, 2010 г., стр. 82–86.
- Выходя за рамки того же, что и в PLATO: обнаружение партономии для связанных данных - Пратик Джайн, Паскаль Хитцлер, Кунал Верма, Питер З. Йе, Амит Шет. В: Материалы 23-й конференции ACM по гипертексту и социальным сетям (HT 2012), Милуоки, Висконсин, США, 25–28 июня 2012 г.
- Фрейтас, Андре, Эдвард Карри, Жоао Габриэль Оливейра и Шон О’Риэн. 2012 г. «Запросы к гетерогенным наборам данных в сети связанных данных: проблемы, подходы и тенденции». IEEE Internet Computing 16 (1): 24–33.
- Связывание открытых данных в Интернете - Крис Байзер, Том Хит, Дэнни Эйерс, Ив Раймонд. In Proceedings Poster Track, ESWC2007, Инсбрук, Австрия
- Выравнивание онтологий для связанных открытых данных - Пратик Джайн, Паскаль Хитцлер, Амит Шет, Кунал Верма, Питер З. Йе. В трудах 9-й Международной конференции по семантической паутине, ISWC 2010, Шанхай, Китай
- Связанные открытые данные о лекарствах для фармацевтических исследований и разработок - J Cheminform. 2011; 3:19. Самвальд, Йенч, Бутон, Каллесо, Виллигхаген, Хаджагос, Маршалл, Прюдоммо, Хассензаде, Пихлер и Стивенс (май 2011 г.)
- Интервью с Сереном Ауэром, руководителем проекта LOD2 о продолжении LOD2 в 2011 году, Июнь 2011 г.
- Связанные открытые данные: главное - Флориан Бауэр и Мартин Кальтенбёк (январь 2012 г.)
- Взмах крыла бабочки - semanticweb.com Ричард Уоллис (февраль 2012 г.)
внешняя ссылка
Scholia имеет тема профиль для Связанные данные. |
- LinkedData в W3C Wiki
- LinkedData.org
- Официальные документы по программному обеспечению OpenLink
- [постоянная мертвая ссылка ] Данные из схемы Northwind SQL в виде связанных данных, демонстрационный пример использования
- Связанные данные по дисциплине нумизматика, демонстрационный пример использования
- Интерактивная демонстрация LOD
- OptiqueVQS - инструмент визуального формулирования запросов на основе онтологий