Язык запросов информационного поиска - Википедия - Information retrieval query language

An язык запросов информационного поиска (IR) это язык запросов используется для выполнения запросов в поисковом индексе. Язык запросов формально определяется в контекстно-свободная грамматика (CFG) и может использоваться пользователями в текстовой, визуальной / пользовательской или речевой форме. Расширенные языки запросов часто определяются для профессиональных пользователей в вертикальные поисковые системы, поэтому они получают больший контроль над формулировкой запросов.

Типы языков запросов

  • Полный текст. В простейшем языке запросов все термины рассматриваются как набор слов, которые необходимо сопоставить с сообщениями в инвертированный индекс и где впоследствии применяются модели ранжирования для поиска наиболее релевантных документов. В CFG определены только токены. Поисковые системы часто используют этот подход.
  • Булево. Язык запросов, который также поддерживает использование логических операторов AND, OR, NOT.
  • Структурированный. Язык, который поддерживает поиск в (комбинации) полей, когда документ структурирован и индексируется с использованием его структуры документа.
  • Естественный язык. Язык запросов, который поддерживает естественный язык путем синтаксического анализа запроса на естественном языке до формы, которая может лучше всего использоваться для получения соответствующих документов, например с помощью Ответ на вопрос системы или разговорный поиск.

Обратите внимание, что языки запросов IR могут представлять собой смесь разных типов. Специальные операторы с подстановочными знаками и специальные функции поиска для поиска с учетом регистра или фраз могут быть определены как часть языка запросов.

Примеры

Пример языка запросов IR: Язык контекстных запросов (CQL), формальный язык для представления запросов к информационно-поисковым системам, таким как веб-индексы, библиографические каталоги и информация о музейных собраниях.

Смотрите также

внешняя ссылка