Поисковый запрос в Интернете - Web search query

А поисковый запрос в Интернете это запрос, основанный на конкретном искать термин что пользователь входит в поисковая система чтобы удовлетворить их информационные потребности. Поисковые запросы в Интернете отличаются тем, что они часто представляют собой обычный текст или гипертекст с необязательными директивами поиска (такими как "и" / или "с" - "для исключения). Они сильно отличаются от стандартных языки запросов, которые регулируются строгими правилами синтаксиса, такими как командные языки с ключевым словом или позиционным параметры.

Типы

Существует три широких категории, которые охватывают большинство поисковых запросов в Интернете: информационные, навигационные и транзакционные.[1] Их также называют «делай, знай, иди».[2] Хотя эта модель поиска не была получена теоретически, классификация была подтверждена эмпирически с помощью реальных запросов поисковых систем.[3]

  • Информационные запросы - Запросы по широкой теме (например, Колорадо или же грузовики), для которого могут быть тысячи релевантных результатов.
  • Навигационные запросы - Запросы, которые ищут один веб-сайт или веб-страницу одного объекта (например, YouTube или же дельта-воздушные линии).
  • Транзакционные запросы - Запросы, отражающие намерение пользователя выполнить определенное действие, например приобрести автомобиль или загрузить заставку.

Поисковые системы часто поддерживают четвертый тип запроса, который используется гораздо реже:

  • Запросы на подключение - Запросы, сообщающие о подключении проиндексированных веб-график (например, какие ссылки указывают на это URL ?, и сколько страниц проиндексировано из этого доменное имя ?).[4]

Характеристики

Список предложения поиска по поисковому запросу

Большинство коммерческих поисковых систем не раскрывают свои журналы поиска, поэтому трудно получить информацию о том, что пользователи ищут в Интернете.[5] Тем не менее исследования появились в 1998 году.[6][7] Позже исследование 2001 г.[8] проанализировали запросы от Возбудить поисковая система показала некоторые интересные характеристики веб-поиска:

  • Средняя длина поискового запроса составила 2,4 термина.
  • Около половины пользователей вводили один запрос, тогда как немногим менее трети пользователей вводили три или более уникальных запроса.
  • Почти половина пользователей изучали только первые одну или две страницы результатов (10 результатов на страницу).
  • Менее 5% пользователей использовали расширенные функции поиска (например, логические операторы например И, ИЛИ и НЕ).
  • Четыре наиболее часто используемых термина: (пустой поиск) и, из, и секс.

Исследование тех же журналов запросов Excite показало, что 19% запросов содержали географические термины (например, названия мест, почтовые индексы, географические особенности и т. Д.).[9] Исследования также показывают, что помимо коротких запросов (то есть запросов с небольшим количеством терминов) существуют также предсказуемые закономерности того, как пользователи меняют свои запросы.[10]

Исследование журналов запросов Yahoo в 2005 году показало, что 33% запросов от одного и того же пользователя были повторными запросами, и что 87% случаев пользователь нажимал на тот же результат.[11] Это говорит о том, что многие пользователи используют повторяющиеся запросы для повторного посещения или повторного поиска информации. Этот анализ подтверждается сообщением в блоге поисковой системы Bing, в котором говорится, что около 30% запросов являются навигационными. [12]

Кроме того, многие исследования показали, что частотное распределение терминов запросов соответствует сила закона, или же длинный хвост кривые распределения. То есть небольшая часть терминов, наблюдаемых в большом журнале запросов (например,> 100 миллионов запросов), используется наиболее часто, в то время как остальные термины используются реже по отдельности.[13] Этот пример Принцип Парето (или же Правило 80–20) позволяет поисковым системам использовать методы оптимизации например, index или разделение базы данных, кеширование и предварительная загрузка. Кроме того, были проведены исследования по обнаружению лингвистически ориентированных атрибутов, которые могут распознать, является ли веб-запрос навигационным, информационным или транзакционным.[14]

Но в недавнем исследовании, проведенном в 2011 году, было обнаружено, что средняя длина запросов неуклонно росла с течением времени, а средняя длина запросов на языках, отличных от английского, увеличилась больше, чем у запросов на английском языке.[15] Google внедрил колибри обновление в августе 2013 года, чтобы обрабатывать более длинные поисковые запросы, поскольку все больше запросов носят разговорный характер (например, «где ближайшая кофейня?»).[16] Для более длинных запросов Обработка естественного языка помогает, поскольку деревья синтаксического анализа запросов могут быть сопоставлены с деревьями синтаксического анализа ответов и их фрагментов.[17] Для запросов с несколькими предложениями, где статистика ключевых слов и Tf – idf не очень помогает, Разбирать чаще Используется техника для структурного представления сложных вопросов и ответов.[18]

Структурированные запросы

С поисковыми системами, поддерживающими логические операторы и круглые скобки, можно применить метод, традиционно используемый библиотекарями. Пользователь, который ищет документы по нескольким темам или грани может захотеть описать каждого из них дизъюнкция характерных слов, таких как автомобили ИЛИ автомобили ИЛИ автомобили. А фасетный запрос это соединение таких граней; например такой запрос, как (электронный ИЛИ компьютеризированный ИЛИ DRE) И (голосование ИЛИ выборы ИЛИ выборы ИЛИ голосование ИЛИ выборы) могут найти документы об электронном голосовании, даже если они опускают одно из слов «электронное» и «голосование», или даже оба слова.[19]

Смотрите также

Рекомендации

  1. ^ Бродер, А. (2002). Таксономия веб-поиска. СИГИР Форум, 36 (2), 3–10.
  2. ^ Гиббонс, Кевин (2013-01-11). «Делай, знай, иди: как создавать контент на каждом этапе цикла покупки». Search Engine Watch. Получено 24 мая 2014.
  3. ^ Янсен, Б. Дж., Бут, Д., и Спинк, А. (2008) Определение информационного, навигационного и транзакционного намерения веб-запросов, Обработка информации и управление. 44 (3), 1251-1266.
  4. ^ Мур, Росс. «Серверы подключения». Издательство Кембриджского университета. Получено 24 мая 2014.
  5. ^ Доун Кавамото и Элинор Миллс (2006), AOL приносит извинения за публикацию пользовательских поисковых данных
  6. ^ Янсен, Б. Дж., Спинк, А., Бейтман, Дж., И Сарачевич, Т. 1998. Получение информации из реальной жизни: исследование запросов пользователей в сети.. СИГИР Форум, 32 (1), 5-17.
  7. ^ Сильверстайн, К., Хенцингер, М., Марэ, Х., и Мориц, М. (1999). Анализ очень большого журнала запросов поисковой системы. СИГИР Форум, 33 (1), 6–12.
  8. ^ Аманда Спинк; Дитмар Вольфрам; Майор Б. Дж. Янсен; Тефко Сарачевич (2001). "Поиск в Интернете: публика и их запросы ". Журнал Американского общества информационных наук и технологий. 52 (3): 226–234. CiteSeerX  10.1.1.23.9800. Дои:10.1002 / 1097-4571 (2000) 9999: 9999 <:: AID-ASI1591> 3.3.CO; 2-I. Внешняя ссылка в | название = (помощь)
  9. ^ Марк Сандерсон и Джанет Колер (2004). «Анализ географических запросов». Материалы семинара по географической информации (SIGIR '04).
  10. ^ Янсен, Б. Дж., Бут, Д. Л., и Спинк, А. (2009). Паттерны модификации запроса при поиске в сети. Журнал Американского общества информационных наук и технологий. 60 (3), 557-570. 60 (7), 1358-1371.
  11. ^ Хайме Тиван; Эйтан Адар; Рози Джонс; Майкл Поттс (2005). «История повторяется: повторные запросы в журналах запросов Yahoo» (PDF). Материалы 29-й ежегодной конференции ACM по исследованиям и разработкам в области информационного поиска (SIGIR '06). С. 703–704. Дои:10.1145/1148170.1148326.[постоянная мертвая ссылка ]
  12. ^ http://www.bing.com/community/site_blogs/b/search/archive/2011/02/10/making-search-yours.aspx
  13. ^ Рикардо Баеза-Йейтс (2005). «Приложения интеллектуального анализа веб-запросов». Достижения в области поиска информации. Конспект лекций по информатике. 3408. Springer Berlin / Heidelberg. С. 7–22. Дои:10.1007/978-3-540-31865-1_2. ISBN  978-3-540-25295-5.
  14. ^ Алехандро Фигероа (2015). «Изучение эффективных функций для распознавания намерений пользователя, стоящих за веб-запросами». 68. Эльзевьер: 162–169. Цитировать журнал требует | журнал = (помощь)
  15. ^ Мона Тагави; Ахмед Патель; Никита Шмидт; Кристофер Уиллс; Ики Тью (2011). «Анализ журналов веб-прокси с использованием схемы распределения запросов для поисковых систем». Компьютерные стандарты и интерфейсы. 34 (1): 162–170. Дои:10.1016 / j.csi.2011.07.001.
  16. ^ Салливан, Дэнни (26 сентября 2013). "FAQ: Все о новом алгоритме Google" Hummingbird "". Search Engine Land. Получено 24 мая 2014.
  17. ^ Галицкий Б. Машинное обучение синтаксических деревьев разбора для поиска и классификации текста. Инженерные приложения искусственного интеллекта. 2013;26(3):153–172. Дои:10.1016 / j.engappai.2012.09.017.
  18. ^ Галицкий Б., Ильвовский Д., Кузнецов С.О., Строк Ф. Нахождение максимальных общих зарослей подпарсинга для поиска по нескольким предложениям. Конспект лекций по искусственному интеллекту. 2013;8323.
  19. ^ Войкан Михайлович; Джорд Хиемстра; Хенк Эрнст Блок; Питер М.Г. Apers (октябрь 2006 г.). «Использование структуры запроса и структуры документа для повышения эффективности поиска документов» (PDF). Цитировать журнал требует | журнал = (помощь)