Apache ORC - Википедия - Apache ORC

Apache ORC
Apache ORC
изначальный выпуск20 февраля 2013 г.; 7 лет назад (2013-02-20)[1]
Стабильный выпуск
1.6.0 / 3 сентября 2019; 15 месяцев назад (2019-09-03)[2]
РепозиторийРепозиторий ORC
Операционная системаКроссплатформенность
ТипСистема управления базой данных
ЛицензияЛицензия Apache 2.0
Интернет сайторк.apache.org

Apache ORC (Оптимизированный столбец строк) - это бесплатно и с открытым исходным кодом столбчатый формат хранения данных Apache Hadoop экосистема. Он похож на другие форматы файлов столбчатого хранения, доступные в Hadoop экосистема, такая как RCFile и Паркет. Он совместим с большинством платформ обработки данных в Hadoop среда.

В феврале 2013 года о формате файла Optimized Row Columnar (ORC) объявили Hortonworks в сотрудничестве с Facebook.[3]Через месяц Паркет Apache формат анонсирован, разработан Cloudera и Twitter.[4]

Смотрите также

Рекомендации

  1. ^ «Инициатива Stinger: сделать Apache Hive в 100 раз быстрее». Получено 1 января, 2019.
  2. ^ «Релизы».
  3. ^ Алан Гейтс (20 февраля 2013 г.). «Инициатива Stinger: сделать Apache Hive в 100 раз быстрее». Блог Hortonworks. Получено 31 декабря, 2018.
  4. ^ Джастин Кестелин (13 марта 2013 г.). «Представляем Parquet: эффективное колоночное хранилище для Apache Hadoop». Блог Cloudera. Архивировано из оригинал 19 сентября 2016 г.. Получено 4 мая, 2017.