Получение состязательной информации - Adversarial information retrieval

Получение состязательной информации (состязательный IR) - тема в поиск информации связаны со стратегиями работы с источником данных, часть которого была использована злонамеренно. Задачи могут включать в себя сбор, индексирование, фильтрацию, извлечение и ранжирование информации из такого источника данных. Adversarial IR включает изучение методов обнаружения, выделения и пресечения таких манипуляций.

В Интернете преобладающей формой таких манипуляций является рассылка спама в поисковых системах (также известный как спамдексинг), который включает использование различных методов для нарушения работы поисковые системы, обычно ради финансовой выгоды. Примеры спамодексирования: бомбардировка ссылок, комментарий или же реферер спам, спам-блоги (splogs), вредоносные теги. Разобрать механизм с целью понять, как это работает из алгоритмы ранжирования, блокировка рекламы, мошенничество с кликами,[1] и фильтрация веб-контента также могут рассматриваться как формы состязательности манипуляция данными.[2]

Темы

Темы, связанные с веб-спамом (спамодексингом):

Другие темы:

История

Термин «состязательный поиск информации» был впервые введен в обращение в 2000 г. Андрей Бродер (затем главный научный сотрудник Альта Виста ) во время веб-пленарного заседания на TREC -9 конференция.[3]

Смотрите также

Рекомендации

  1. ^ Янсен, Б. Дж. (2007) Мошенничество с кликами. Компьютер IEEE. 40 (7), 85-86.
  2. ^ Б. Дэвисон, М. Наджорк и Т. Конверс (2006 г.), Отчет SIGIR Worksheet: состязательный поиск информации в Интернете (AIRWeb 2006)
  3. ^ Д. Хокинг и Н. Крэсуэлл (2004 г.), Очень крупномасштабное извлечение и поиск в Интернете (препринт) В архиве 2007-08-29 на Wayback Machine

внешняя ссылка