Апач Друид - Apache Druid
Оригинальный автор (ы) |
|
---|---|
Разработчики) | Апач Друид |
Стабильный выпуск | 0.20.0 / 16 октября 2020 |
Репозиторий | Хранилище друидов |
Написано в | Ява |
Операционная система | Кроссплатформенность |
Тип | |
Лицензия | Лицензия Apache 2.0 |
Интернет сайт | друид |
Друид это столбчатый, Открытый исходный код, распределен хранилище данных написано в Ява. Druid разработан для быстрого приема огромных объемов данных о событиях и предоставления запросов с малой задержкой поверх данных.[1] Название Друид происходит от изменение формы Друид во многих ролевые игры, чтобы отразить тот факт, что архитектура системы может изменяться для решения различных типов проблем с данными.
Друид обычно используется в бизнес-аналитика /OLAP приложения для анализа больших объемов в реальном времени и исторические данные.[2] Druid используется в производстве технологическими компаниями, такими как Алибаба,[2] Airbnb,[2] Cisco,[3][2] eBay,[4] Lyft,[5] Netflix,[6] PayPal,[2] Pinterest,[7] Twitter,[8] Walmart,[9] Фонд Викимедиа[10] и Yahoo.[11]
История
Druid был запущен в 2011 году для поддержки аналитического продукта Metamarkets. Проект был открыт под лицензией GPL в октябре 2012 года.[12][13] и перешел на лицензию Apache в феврале 2015 года.[14][15]
Со временем ряд организаций и компаний интегрировали Druid в свои серверные технологии,[2] и коммиттеры были добавлены из множества различных организаций.[16]
Архитектура
Полностью развернутый Druid работает как кластер специализированных процессов (называемых узлами в Druid) для поддержки отказоустойчивой архитектура[17] где данные хранятся с избыточностью и нет единой точки отказа.[18] В кластер включены внешние зависимости для согласования (Apache ZooKeeper ), хранилище метаданных (например, MySQL, PostgreSQL, или же дерби ) и глубокое хранилище (например, HDFS, или же Amazon S3 ) для постоянного резервного копирования данных.
Управление запросами
Клиентские запросы сначала попадают в узлы брокера, которые направляют их в соответствующие узлы данных (исторические или в реальном времени). Поскольку сегменты Druid могут быть разделены, входящий запрос может потребовать данные из нескольких сегментов и разделов (или осколки ) хранятся на разных узлах кластера. Брокеры могут узнать, какие узлы имеют необходимые данные, а также объединить частичные результаты перед возвратом агрегированного результата.
Управление кластером
Операции, связанные с управлением данными в исторических узлах, контролируются узлами-координаторами. Apache ZooKeeper используется для регистрации всех узлов, управления определенными аспектами межузловой связи и обеспечения выборов лидера.
особенности
- Прием данных с низкой задержкой (потоковая передача)
- Произвольный анализ данных срезов и игральных костей
- Подсекундные аналитические запросы
- Приближенные и точные расчеты
Смотрите также
использованная литература
- ^ Хемсот, Николь. "Друид призывает силу в реальном времени" В архиве 2013-02-27 в Wayback Machine, Датанами, 08 ноября 2012
- ^ а б c d е ж друид. "Друид | На основе Друида". druid.apache.org. Получено 2016-06-29.
- ^ Батлер, Брэндон. «Под капотом платформы Cisco Tetration Analytics». Получено 2016-06-23.
- ^ "Друид в Pulsar - ebay 的 专栏 - 博客 频道 - CSDN.NET". blog.csdn.net. Получено 2016-06-23.
- ^ Потоковая передача SQL и Druid от Арупа Малакара, получено 2020-01-29
- ^ "Технический блог Netflix: анонс Suro: основа конвейера данных Netflix". techblog.netflix.com. Получено 2016-06-23.
- ^ Pinterest: использование аналитики рекламы с помощью Apache Druid, получено 2020-01-29
- ^ «Интерактивная аналитика в MoPub: запрос терабайтов данных за секунды». blog.twitter.com. Получено 2020-01-29.
- ^ Наяк, Амареш (23 февраля 2018 г.). «Аналитика потока событий в Walmart с помощью Druid». Середина. Получено 2020-01-29.
- ^ https://conferences.oreilly.com/strata/strata-ny/public/schedule/detail/60986
- ^ «Дополнение Hadoop в Yahoo: интерактивная аналитика с помощью Druid». Получено 2016-06-23.
- ^ Четтер, Эрик. "Знакомство с друидом", druid.apache.org, 24 октября 2012 г.
- ^ Хиггинботэм, Стейси. «Metamarkets с открытым исходным кодом Druid, его база данных в оперативной памяти», GigaOM, 24 октября 2012 г.
- ^ Харрис, Деррик (20 февраля 2015 г.). «База данных реального времени Druid переходит на лицензию Apache». Получено 2015-08-04.
- ^ "Druid получает Open Source-ier под лицензией Apache". Получено 2015-08-04.
- ^ друид. "Друид | Сообщество друидов". druid.apache.org. Получено 2016-06-23.
- ^ Документация по проекту друидов
- ^ Ян, Фанцзинь; Четтер, Эрик; Леоте, Ксавье; Рэй, Нельсон; Мерлино, Джан; Гангули, Глубокий. "Druid: хранилище аналитических данных в реальном времени", Метамаркеты, дата обращения 6 февраля 2014.