Apache Solr - Apache Solr
Разработчики) | Фонд программного обеспечения Apache |
---|---|
Стабильный выпуск | 8.7.0 / 3 ноября 2020 г.[1] |
Репозиторий | Репозиторий Solr |
Написано в | Ява |
Операционная система | Кроссплатформенность |
Тип | Поиск и показатель API |
Лицензия | Лицензия Apache 2.0 |
Интернет сайт | Люцен |
Solr (произносится как «солнечный») Открытый исходный код поиск на предприятии платформа, написанная на Ява, из Apache Lucene проект. Его основные особенности включают полнотекстовый поиск, выделение нажатия, многогранный поиск, индексирование в реальном времени, динамическая кластеризация, интеграция с базами данных, NoSQL Особенности[2] и многофункциональная обработка документов (например, Word, PDF). Обеспечивая распределенный поиск и репликацию индексов, Solr обеспечивает масштабируемость и Отказоустойчивость.[3] Solr широко используется для примеров использования корпоративного поиска и аналитики, имеет активное сообщество разработчиков и регулярные выпуски.
Solr работает как автономный сервер полнотекстового поиска. Он использует Lucene Библиотека поиска Java в своей основе для полнотекстового индексирования и поиска и имеет ОСТАЛЬНЫЕ -любить HTTP /XML и JSON API-интерфейсы, которые позволяют использовать его из самых популярных языков программирования. Внешняя конфигурация Solr позволяет адаптировать его ко многим типам приложений без программирования на Java, и он имеет архитектуру плагинов для поддержки более продвинутой настройки.
Apache Lucene и Apache Solr производятся одним и тем же Фонд программного обеспечения Apache Команда разработчиков.
История
В 2004 году Йоник Сили создал Solr в Сети CNET как собственный проект по добавлению возможностей поиска на веб-сайт компании.
В январе 2006 года CNET Networks решила открыто опубликовать исходный код, пожертвовав его Фонд программного обеспечения Apache.[4] Как и любой новый проект Apache, он вступил в инкубационный период, который помог решить организационные, правовые и финансовые вопросы.
В январе 2007 года Solr перешел из инкубационного статуса в отдельный проект верхнего уровня (TLP) и неуклонно рос за счет накопленных функций, тем самым привлекая пользователей, участников и коммиттеров. Хотя он был довольно новым в качестве общедоступного проекта, он поддерживал несколько веб-сайтов с высоким трафиком.[5]
В сентябре 2008 года был выпущен Solr 1.3, включающий, среди прочего, возможности распределенного поиска и улучшения производительности.[6]
В январе 2009 года к нам присоединились Йоник Сили, Грант Ингерсолл и Эрик Хэтчер. Lucidworks (ранее Lucid Imagination), первая компания, предоставляющая коммерческую поддержку и обучение поисковым технологиям Apache Solr.[нужна цитата ] С тех пор предложения поддержки вокруг Solr были многочисленны.[7]
В ноябре 2009 года был выпущен Solr 1.4. В этой версии были внесены улучшения в индексирование, поиск и фасетирование, а также многие другие улучшения, такие как расширенная обработка документов (PDF, слово, HTML ), Кластеризация результатов поиска на основе Морковь2 а также улучшенная интеграция с базой данных. В выпуске также есть много дополнительных плагинов.[8]
В марте 2010 г. Lucene и Solr объединены.[9] Solr стал подпроектом Lucene. Раздельная загрузка продолжалась, но теперь продукты разрабатывались совместно одним набором коммиттеров.
В 2011 году схема номеров версий Solr была изменена, чтобы соответствовать Lucene. После Solr 1.4 следующий выпуск Solr был помечен как 3.1, чтобы сохранить Solr и Lucene с одним и тем же номером версии.[10]
В октябре 2012 года была выпущена версия 4.0 Solr, включая новую функцию SolrCloud.[11] В 2013 и 2014 годах было выпущено несколько выпусков Solr в линейке 4.x, постоянно расширяющих набор функций и повышающих надежность.
В феврале 2015 года был выпущен Solr 5.0,[12] первый выпуск, в котором Solr упакован как отдельное приложение,[13] прекращение официальной поддержки развертывания Solr как война. В Solr 5.3 была встроена подключаемая среда аутентификации и авторизации.[14]
В апреле 2016 года была выпущена Solr 6.0.[15] Добавлена поддержка выполнения параллельных SQL-запросов в коллекциях SolrCloud. Включает поддержку StreamExpression и новый драйвер JDBC для интерфейса SQL.
В сентябре 2017 года был выпущен Solr 7.0.[16] В этом выпуске, помимо прочего, добавлена поддержка нескольких типов реплик, автомасштабирования и математического механизма.
В марте 2019 года был выпущен Solr 8.0, включающий множество исправлений ошибок и обновлений компонентов.[17] Узлы Solr теперь могут прослушивать и обслуживать запросы HTTP / 2. Имейте в виду, что по умолчанию внутренние запросы также отправляются с использованием HTTP / 2. Кроме того, был добавлен вход в пользовательский интерфейс администратора с поддержкой BasicAuth и Kerberos. И теперь возможно построение математических выражений в Apache Zeppelin.
Операции
Для поиска в документе Apache Solr последовательно выполняет следующие операции:
- Индексирование: прежде всего, он преобразует документы в машиночитаемый формат, который называется индексированием.
- Запросы: понимание условий запроса, заданного пользователем. Эти термины могут быть, например, изображениями или ключевыми словами.
- Сопоставление: Solr сопоставляет пользовательский запрос с документами, хранящимися в базе данных, чтобы найти соответствующий результат.
- Ранжирование результата: как только механизм выполняет поиск проиндексированных документов, он ранжирует результаты по их релевантности.
Сообщество
В Solr есть как частные лица, так и компании, которые вносят новые функции и исправляют ошибки.[18][19][20][21][22]
Интеграция Solr
Solr входит в состав встроенного поиска во многих приложениях, таких как системы управления контентом и управление корпоративным контентом системы. Hadoop распределения из Cloudera,[23] Hortonworks[24] и MapR все пакеты Solr в качестве поисковой системы для своих продуктов, продаваемых для большое количество данных. DataStax DSE интегрирует Solr как поисковую систему с Кассандра.[25] Solr поддерживается в качестве конечной точки в различных средах обработки данных и Корпоративная интеграция рамки.[нужна цитата ]
Solr представляет отраслевой стандарт HTTP REST-подобный API с обоими XML и JSON поддержка и будет интегрироваться с любой системой или языком программирования, поддерживающими эти стандарты. Для простоты использования доступны также клиентские библиотеки для Ява, C #, PHP, Python, Рубин и большинство других популярных языков программирования.[26]
Смотрите также
- Открытая семантическая структура
- Ориентированная на поиск архитектура
- Список информационно-поисковых библиотек
использованная литература
- ^ "Новости". Фонд Apache. Получено 14 августа 2020.
- ^ «Архивная копия». Архивировано из оригинал на 2014-07-06. Получено 2014-07-10.CS1 maint: заархивированная копия как заголовок (ссылка на сайт)
- ^ "Apache Solr -". apache.org. Получено 16 января 2017.
- ^ "[SOLR-1] Добавление кода CNET - ASF JIRA". apache.org. Получено 16 января 2017.
- ^ "PublicServers - Solr Wiki". apache.org. Получено 16 января 2017.
- ^ "Apache Solr -". apache.org. Получено 16 января 2017.
- ^ "Поддержка - Solr Wiki". apache.org. Получено 16 января 2017.
- ^ "Apache Solr -". apache.org. Получено 16 января 2017.
- ^ «[ГОЛОСОВАНИЕ] разработка слияния lucene / solr (дубль 3) - Йоник Сили - org.apache.lucene.general - MarkMail». markmail.org. Получено 16 января 2017.
- ^ Solr3.1 - Solr Wiki. Wiki.apache.org (16 мая 2013 г.). Проверено 21 июля 2013.
- ^ Apache Lucene. Lucene.apache.org. Проверено 21 июля 2013.
- ^ "Apache Solr - Новости". apache.org. Получено 16 января 2017.
- ^ «[SOLR-6733] Проблема зонтика - Solr как отдельное приложение - ASF JIRA». apache.org. Получено 16 января 2017.
- ^ "Объявление о выпуске Solr 5.3". lucene.apache.org. Получено 2015-09-24.
- ^ "Apache Solr - Новости". apache.org. Получено 16 января 2017.
- ^ "Apache Solr - Новости".
- ^ «Примечания к выпуску Apache Solr 8.0».
- ^ "Наибольшее количество голосов" за вопросы ". stackoverflow.com. Получено 16 января 2017.
- ^ "Lucene / Solr Revolution 2016". lucenerevolution.org. Получено 16 января 2017.
- ^ "Встреча SFBay Apache Lucene / Solr". meetup.com. Получено 16 января 2017.
- ^ "Сообщество Oslo Solr". meetup.com. Получено 16 января 2017.
- ^ «LinkedIn Solr Group». linkedin.com. Получено 16 января 2017.
- ^ «Hadoop для всех: внутри поиска Cloudera - блог разработчиков Cloudera». cloudera.com. 24 июня 2013 г.. Получено 16 января 2017.
- ^ «Использование корпоративного поиска в Enterprise Hadoop - Hortonworks». hortonworks.com. 2 апреля 2014 г.. Получено 16 января 2017.
- ^ «DataStax Enterprise: Cassandra с подробностями интеграции с Solr». datastax.com. 12 апреля 2012 г.. Получено 6 февраля 2017.
- ^ "IntegratingSolr - Solr Wiki". apache.org. Получено 16 января 2017.
Список используемой литературы
- Грейнджер, Трей; Поттер, Тимоти (март 2014 г.). Solr в действии (1-е изд.). Публикации Мэннинга. п. 664. ISBN 9781617291029.
- Смайли, Дэвид; Пью, Эрик; Париса, Кранти; Митчелл, Мэтт (февраль 2014 г.). Корпоративный поисковый сервер Apache Solr 4 (1-е изд.). Packt Publishing. п. 451. ISBN 9781782161363.
- Серафини, Альфредо (декабрь 2013 г.). Руководство для начинающих по Apache Solr (1-е изд.). Packt Publishing. п. 324. ISBN 9781782162520.
- Рафалович, Александр (июнь 2013 г.). Мгновенный Apache Solr для индексирования данных How-to (1-е изд.). Packt Publishing. п. 90. ISBN 9781782164845.
- Куч, Рафал (январь 2013 г.). Поваренная книга Apache Solr 4 (1-е изд.). Packt Publishing. п. 328. ISBN 9781782161325.
- Смайли, Дэвид; Пью, Эрик (20 ноября 2011 г.). Корпоративный поисковый сервер Apache Solr 3 (1-е изд.). Packt Publishing. п. 418. ISBN 1-84951-606-5.
- Куч, Рафал (22 июля 2011 г.). Поваренная книга Apache Solr 3.1 (1-е изд.). Packt Publishing. п. 300. ISBN 1-84951-218-3.
- Смайли, Дэвид; Пью, Эрик (19 августа 2009 г.). Корпоративный поисковый сервер Solr 1.4 (1-е изд.). Packt Publishing. п. 336. ISBN 1-84719-588-1.