Семантическая аналитика - Semantic analytics

Семантическая аналитика, также называемый семантическое родство, это использование онтологии анализировать контент в веб-ресурсы. Эта область исследований объединяет текстовая аналитика и Семантическая сеть такие технологии как RDF. Семантическая аналитика измеряет взаимосвязь различных онтологических концепций.

Некоторые академические исследовательские группы, которые ведут активные проекты в этой области, включают Центр Kno.e.sis в Государственный университет Райта среди прочего.

История

Важная веха в зарождении семантической аналитики произошла в 1996 году, хотя историческое развитие этих алгоритмов в значительной степени субъективно. В своей фундаментальной публикации исследования Филип Резник установил, что компьютеры обладают способностью подражать человеческим суждениям. Охватывая публикации нескольких журналов, улучшения точности общих семантических аналитических вычислений претендовали на революцию в этой области. Однако отсутствие стандартной терминологии в конце 1990-х было причиной многих недопониманий. Это побудило Буданицкий и Херст стандартизировать предмет в 2006 году с резюме, которое также установило основу для современного анализа орфографии и грамматики.[1]

На заре семантической аналитики было сложно получить достаточно большие надежные базы знаний. В 2006 году Strube & Ponzetto продемонстрировали, что Википедия может использоваться в семантических аналитических вычислениях.[2] Использование большой базы знаний, такой как Википедия, позволяет повысить точность и применимость семантической аналитики.

Методы

Учитывая субъективный характер области, различные методы, используемые в семантической аналитике, зависят от области применения. Никакие отдельные методы не считаются правильными, однако один из наиболее эффективных и применимых методов - это явный семантический анализ (ЕКА).[3] ESA был разработан Евгением Габриловичем и Шаулем Марковичем в конце 2000-х.[4] Оно использует машинное обучение методы создания семантического интерпретатора, который извлекает фрагменты текста из статей в отсортированный список. Фрагменты отсортированы по степени их отношения к окружающему тексту.

Скрытый семантический анализ (LSA) - еще один распространенный метод, который не использует онтологии, а рассматривает только текст в пространстве ввода.

Приложения

Применение методов семантического анализа обычно упрощает организационные процессы любой системы управления знаниями. Академические библиотеки часто используют предметно-ориентированные приложения для создания более эффективной организационной системы. Классифицируя научные публикации с использованием семантики и Википедии, исследователи помогают людям быстрее находить ресурсы. Поисковые системы вроде Семантический ученый обеспечить организованный доступ к миллионам статей.

Смотрите также

Рекомендации

  1. ^ Буданицкий, Александр и Грэм Херст. «Оценка основанных на WordNet показателей лексико-семантического родства». Comput. Лингвист. 32, нет. 1 (март 2006 г.): 13–47. Дои:10.1162 / coli.2006.32.1.13
  2. ^ Штрубе, Майкл и Симоне Паоло Понцетто. "WikiRelate! Вычисление семантического родства с помощью Википедии". В Труды 21-й Национальной конференции по искусственному интеллекту, Том 2, 1419–1424. AAAI'06. Бостон, Массачусетс: AAAI Press, 2006.
  3. ^ З. Чжан, А. Л. Джентиле и Ф. Чиравенья "Последние достижения в методах лексико-семантической связанности - обзор ", Инженерия естественного языка, т. 19, нет. 04, стр. 411–479, октябрь 2013 г.
  4. ^ Евгений Габрилович и Шауль Маркович. 2007 г. «Вычисление семантической взаимосвязи с использованием явного семантического анализа на основе Википедии». В IJcAI, 1606–1611 гг. Проверено 9 октября, 2016.

Внешняя ссылка