Апач Друид - Apache Druid

Друид
Логотип Друида
Оригинальный автор (ы)
  • Эрик Четтер
  • Фанцзинь Ян
Разработчики)Апач Друид
Стабильный выпуск
0.20.0 / 16 октября 2020; 38 дней назад (2020-10-16)
РепозиторийХранилище друидов
Написано вЯва
Операционная системаКроссплатформенность
Тип
ЛицензияЛицензия Apache 2.0
Интернет сайтдруид.apache.org

Друид это столбчатый, Открытый исходный код, распределен хранилище данных написано в Ява. Druid разработан для быстрого приема огромных объемов данных о событиях и предоставления запросов с малой задержкой поверх данных.[1] Название Друид происходит от изменение формы Друид во многих ролевые игры, чтобы отразить тот факт, что архитектура системы может изменяться для решения различных типов проблем с данными.

Друид обычно используется в бизнес-аналитика /OLAP приложения для анализа больших объемов в реальном времени и исторические данные.[2] Druid используется в производстве технологическими компаниями, такими как Алибаба,[2] Airbnb,[2] Cisco,[3][2] eBay,[4] Lyft,[5] Netflix,[6] PayPal,[2] Pinterest,[7] Twitter,[8] Walmart,[9] Фонд Викимедиа[10] и Yahoo.[11]

История

Druid был запущен в 2011 году для поддержки аналитического продукта Metamarkets. Проект был открыт под лицензией GPL в октябре 2012 года.[12][13] и перешел на лицензию Apache в феврале 2015 года.[14][15]

Со временем ряд организаций и компаний интегрировали Druid в свои серверные технологии,[2] и коммиттеры были добавлены из множества различных организаций.[16]

Архитектура

Архитектура кластера друидов

Полностью развернутый Druid работает как кластер специализированных процессов (называемых узлами в Druid) для поддержки отказоустойчивой архитектура[17] где данные хранятся с избыточностью и нет единой точки отказа.[18] В кластер включены внешние зависимости для согласования (Apache ZooKeeper ), хранилище метаданных (например, MySQL, PostgreSQL, или же дерби ) и глубокое хранилище (например, HDFS, или же Amazon S3 ) для постоянного резервного копирования данных.

Управление запросами

Клиентские запросы сначала попадают в узлы брокера, которые направляют их в соответствующие узлы данных (исторические или в реальном времени). Поскольку сегменты Druid могут быть разделены, входящий запрос может потребовать данные из нескольких сегментов и разделов (или осколки ) хранятся на разных узлах кластера. Брокеры могут узнать, какие узлы имеют необходимые данные, а также объединить частичные результаты перед возвратом агрегированного результата.

Управление кластером

Операции, связанные с управлением данными в исторических узлах, контролируются узлами-координаторами. Apache ZooKeeper используется для регистрации всех узлов, управления определенными аспектами межузловой связи и обеспечения выборов лидера.

особенности

  • Прием данных с низкой задержкой (потоковая передача)
  • Произвольный анализ данных срезов и игральных костей
  • Подсекундные аналитические запросы
  • Приближенные и точные расчеты

Смотрите также

использованная литература

  1. ^ Хемсот, Николь. "Друид призывает силу в реальном времени" В архиве 2013-02-27 в Wayback Machine, Датанами, 08 ноября 2012
  2. ^ а б c d е ж друид. "Друид | На основе Друида". druid.apache.org. Получено 2016-06-29.
  3. ^ Батлер, Брэндон. «Под капотом платформы Cisco Tetration Analytics». Получено 2016-06-23.
  4. ^ "Друид в Pulsar - ebay 的 专栏 - 博客 频道 - CSDN.NET". blog.csdn.net. Получено 2016-06-23.
  5. ^ Потоковая передача SQL и Druid от Арупа Малакара, получено 2020-01-29
  6. ^ "Технический блог Netflix: анонс Suro: основа конвейера данных Netflix". techblog.netflix.com. Получено 2016-06-23.
  7. ^ Pinterest: использование аналитики рекламы с помощью Apache Druid, получено 2020-01-29
  8. ^ «Интерактивная аналитика в MoPub: запрос терабайтов данных за секунды». blog.twitter.com. Получено 2020-01-29.
  9. ^ Наяк, Амареш (23 февраля 2018 г.). «Аналитика потока событий в Walmart с помощью Druid». Середина. Получено 2020-01-29.
  10. ^ https://conferences.oreilly.com/strata/strata-ny/public/schedule/detail/60986
  11. ^ «Дополнение Hadoop в Yahoo: интерактивная аналитика с помощью Druid». Получено 2016-06-23.
  12. ^ Четтер, Эрик. "Знакомство с друидом", druid.apache.org, 24 октября 2012 г.
  13. ^ Хиггинботэм, Стейси. «Metamarkets с открытым исходным кодом Druid, его база данных в оперативной памяти», GigaOM, 24 октября 2012 г.
  14. ^ Харрис, Деррик (20 февраля 2015 г.). «База данных реального времени Druid переходит на лицензию Apache». Получено 2015-08-04.
  15. ^ "Druid получает Open Source-ier под лицензией Apache". Получено 2015-08-04.
  16. ^ друид. "Друид | Сообщество друидов". druid.apache.org. Получено 2016-06-23.
  17. ^ Документация по проекту друидов
  18. ^ Ян, Фанцзинь; Четтер, Эрик; Леоте, Ксавье; Рэй, Нельсон; Мерлино, Джан; Гангули, Глубокий. "Druid: хранилище аналитических данных в реальном времени", Метамаркеты, дата обращения 6 февраля 2014.

внешняя ссылка