Apache ORC - Википедия - Apache ORC
Эта статья поднимает множество проблем. Пожалуйста помоги Улучши это или обсудите эти вопросы на страница обсуждения. (Узнайте, как и когда удалить эти сообщения-шаблоны) (Узнайте, как и когда удалить этот шаблон сообщения)
|
изначальный выпуск | 20 февраля 2013 г.[1] |
---|---|
Стабильный выпуск | 1.6.0 / 3 сентября 2019[2] |
Репозиторий | Репозиторий ORC |
Операционная система | Кроссплатформенность |
Тип | Система управления базой данных |
Лицензия | Лицензия Apache 2.0 |
Интернет сайт | орк |
Apache ORC (Оптимизированный столбец строк) - это бесплатно и с открытым исходным кодом столбчатый формат хранения данных Apache Hadoop экосистема. Он похож на другие форматы файлов столбчатого хранения, доступные в Hadoop экосистема, такая как RCFile и Паркет. Он совместим с большинством платформ обработки данных в Hadoop среда.
В феврале 2013 года о формате файла Optimized Row Columnar (ORC) объявили Hortonworks в сотрудничестве с Facebook.[3]Через месяц Паркет Apache формат анонсирован, разработан Cloudera и Twitter.[4]
Смотрите также
- Apache Hive
- Apache NiFi
- Свинья (инструмент для программирования)
- Apache Spark
- Presto (механизм запросов SQL)
Рекомендации
- ^ «Инициатива Stinger: сделать Apache Hive в 100 раз быстрее». Получено 1 января, 2019.
- ^ «Релизы».
- ^ Алан Гейтс (20 февраля 2013 г.). «Инициатива Stinger: сделать Apache Hive в 100 раз быстрее». Блог Hortonworks. Получено 31 декабря, 2018.
- ^ Джастин Кестелин (13 марта 2013 г.). «Представляем Parquet: эффективное колоночное хранилище для Apache Hadoop». Блог Cloudera. Архивировано из оригинал 19 сентября 2016 г.. Получено 4 мая, 2017.