Обобщенная модель векторного пространства - Generalized vector space model

В Обобщенная модель векторного пространства является обобщением векторная космическая модель используется в поиск информации. Вонг и другие.[1] представили анализ проблем, связанных с предположением о попарной ортогональности векторная космическая модель (VSM) создает. Отсюда они расширили VSM до модели обобщенного векторного пространства (GVSM).

Определения

GVSM вводит межчленные корреляции, которые осуждают допущение попарной ортогональности. В частности, фактор рассматривал новое пространство, где каждый член вектора тя выражалась как линейная комбинация 2п векторов мр куда г = 1 ... 2п.

Для документа dk и запрос q функция подобия теперь становится:

куда тя и тj теперь векторы 2п пространственное пространство.

Корреляция сроков может быть реализован несколькими способами. Например, Wong et al. использует матрицу частот встречаемости терминов, полученную в результате автоматической индексации, в качестве входных данных для своего алгоритма. Термин «появление» и «выход» - это термин «корреляция» между любой парой значений индекса.

Семантическая информация о GVSM

Существует как минимум два основных направления внедрения термина в соответствие термину, помимо точного соответствия ключевых слов, в модель поиска:

  1. вычислять семантические корреляции между терминами
  2. вычислить статистику совпадения частот из больших корпусов

Недавно Цацаронис[2] сосредоточился на первом подходе.

Они измеряют семантическую взаимосвязь (SR) с помощью тезауруса (О) подобно WordNet. Он учитывает длину пути, захваченную компактностью (СКМ) и глубина пути, полученная с помощью семантической обработки пути (SPEОни оценивают внутренний продукт:

куда sя и sj смысл терминов тя и тj соответственно, максимизируя .

Опираясь также на первый подход, Вайтелонис и др. al.[3] вычислили семантическую взаимосвязь из Связанные открытые данные ресурсы, включая DBpedia так же хорошо как Таксономия YAGO Таким образом, они используют таксономические отношения между семантическими сущностями в документах и ​​запросах после связывание именованных сущностей.



Рекомендации

  1. ^ Вонг, С. К. М .; Зярко, Войцех; Вонг, Патрик С. Н. (1985-06-05), "Модель обобщенных векторных пространств в поиске информации", Материалы 8-й ежегодной международной конференции ACM SIGIR по исследованиям и разработкам в области информационного поиска - SIGIR '85, СИГИР ACM, стр. 18–25, Дои:10.1145/253495.253506, ISBN  0897911598
  2. ^ Цацаронис, Георгий; Панагиотопулу, Вики (2 апреля 2009 г.), Обобщенная модель векторного пространства для поиска текста на основе семантического родства (PDF), EACL ACM
  3. ^ Вайтелонис, Йорг; Экселер, Клаудия; Мешок, Харальд (2015-09-11), Связанные данные позволили использовать обобщенную модель векторного пространства для улучшения поиска документов (PDF), ISWC 2015, CEUR-WS 1581