BeeGFS - BeeGFS

BeeGFS
BeeGFS-Logo.png
Разработчики)ThinkParQ Фраунгофер ITWM,
Стабильный выпуск
7.0[1] / 29 мая 2018 г.
Операционная системаGNU / Linux
ТипРаспределенная файловая система
Интернет сайтbeegfs.io

BeeGFS (ранее FhGFS) является параллельная файловая система, разработан и оптимизирован для высокопроизводительные вычисления. BeeGFS включает распределенную архитектуру метаданных по причинам масштабируемости и гибкости. Самый важный его аспект - это скорость передачи данных.

BeeGFS был первоначально разработан в Фраунгофер Центр высокопроизводительных вычислений в Германия командой Свена Бройнера,[2] который позже стал генеральным директором ThinkParQ (2014-2018), дочерней компании, основанной в 2014 году для поддержки BeeGFS и предоставления профессиональных услуг.

В то время как Community Edition BeeGFS можно загрузить и использовать бесплатно, Enterprise Edition необходимо использовать в соответствии с контрактом на профессиональную поддержку.[3]

История и использование

BeeGFS началась в 2005 году как собственная разработка в Центре Фраунгофера для HPC для замены существующей файловой системы в новом вычислительном кластере института и для использования в производственной среде.

В 2007 году первая бета-версия программного обеспечения была анонсирована на ISC07 в Дрездене, Германия, и представлена ​​публике на SC07 в Рино, штат Невада. Год спустя стал доступен первый стабильный основной выпуск.

В 2014 году Fraunhofer начал свое отделение, новую компанию под названием ThinkParQ.[4] для BeeGFS. В этом процессе FhGFS был переименован в BeeGFS®.[5] ThinkParQ обслуживает программное обеспечение и предлагает профессиональные услуги, а дальнейшая разработка функций будет продолжена в сотрудничестве с ThinkParQ и Fraunhofer.

Поскольку BeeGFS является бесплатной, неизвестно, сколько сейчас активных установок. Однако в 2014 году уже около 100 клиентов по всему миру использовали BeeGFS при коммерческой поддержке ThinkParQ и Fraunhofer. Среди них академические пользователи, такие как университеты и исследовательские центры.[6] а также коммерческие компании в таких областях, как финансы или нефтегазовая промышленность.

Известные установки включают несколько TOP500 компьютеры, такие как Loewe-CSC[7] кластер в Университет Гете во Франкфурте, Германия (№22 по установке), Венский научный кластер[8] на Венский университет, Австрия (# 56 по установке) и Abel[9] кластер в Университет Осло, Норвегия (№96 по установке).

Ключевые концепции и особенности

При разработке BeeGFS Фраунгофер руководствовался тремя ключевыми концепциями программного обеспечения: масштабируемость, гибкость и удобство использования.

BeeGFS работает на любой машине Linux и состоит из нескольких компонентов, которые включают службы для клиентов, серверов метаданных и серверов хранения. Кроме того, существует служба для хоста управления, а также служба для графической системы администрирования и мониторинга.

[10]

Для запуска BeeGFS требуется как минимум один экземпляр сервера метаданных и сервера хранения. Но BeeGFS позволяет нескольким экземплярам каждой службы распределять нагрузку с большого количества клиентов. Масштабируемость каждого компонента гарантирует масштабируемость самой системы.

Содержимое файла распределяется по нескольким серверам хранения с использованием чередования, то есть каждый файл разбивается на блоки заданного размера, и эти блоки распределяются по существующим серверам хранения. Размер этих блоков может быть определен администратором файловой системы. Кроме того, метаданные также распределяются по нескольким серверам метаданных на уровне каталогов, причем каждый сервер хранит часть полного дерева файловой системы. Такой подход обеспечивает быстрый доступ к данным.

Клиенты, а также серверы метаданных или хранилища могут быть добавлены в существующую систему без простоев. Сам клиент - это легкий модуль ядра, не требующий никаких исправлений ядра. Серверы работают поверх существующей локальной файловой системы. Нет никаких ограничений на тип базовой файловой системы, если она поддерживает POSIX; Рекомендуется использовать ext4 для серверов метаданных и XFS для серверов хранения. Оба сервера работают в пользовательском пространстве.

Кроме того, нет строгих требований к выделенному оборудованию для отдельных служб. Дизайн позволяет администратору файловой системы запускать службы в любой комбинации на заданном наборе машин и расширять их в будущем. Среди пользователей BeeGFS распространенный способ воспользоваться этим - объединить серверы метаданных и серверы хранения на одних и тех же машинах.

BeeGFS поддерживает различные сетевые соединения с динамическим аварийным переключением, такие как Ethernet или Infiniband, а также множество различных дистрибутивов и ядер Linux (от 2.6.16 до последней версии vanilla). Программное обеспечение имеет простой механизм установки и запуска с использованием сценариев инициализации. Для пользователей, которые предпочитают графический интерфейс командным строкам, доступен графический интерфейс на основе Java (AdMon). Графический интерфейс пользователя обеспечивает мониторинг состояния BeeGFS и управление настройками системы. Помимо управления и администрирования установки BeeGFS, этот инструмент также предлагает несколько вариантов мониторинга, помогающих выявлять проблемы с производительностью в системе.

BeeOND (BeeGFS по запросу)

BeeOND (BeeGFS on-demand) позволяет создавать экземпляры файловой системы BeeGFS на наборе узлов с помощью одной командной строки. Возможные варианты использования инструмента разнообразны; некоторые из них включают настройку выделенной параллельной файловой системы для кластерного задания (часто называемое буферизация пакетов), облачных вычислений или для быстрой и простой временной настройки в целях тестирования.

Контрольные точки

Следующие тесты были выполнены на Fraunhofer Seislab, тестовом и экспериментальном кластере в Fraunhofer ITWM с 25 узлами (20 вычислений + 5 хранилищ) и трехуровневой памятью: 1 ТБ ОЗУ, 20 ТБ SSD, 120 ТБ HDD. Производительность одного узла в локальной файловой системе без BeeGFS составляет 1332 МБ / с (запись) и 1317 МБ / с (чтение).

Узлы оснащены 2x Intel Xeon X5660, 48 ГБ ОЗУ, 4x Intel 510 Series SSD (RAID 0), Ext4, QDR Infiniband и работают под управлением Scientific Linux 6.3, Kernel 2.6.32-279 и FhGFS 2012.10-beta1.

BeeGFS и exascale

Fraunhofer ITWM участвует в проекте Европейского Союза Dynamic-Exascale Entry Platform - Extended Reach (DEEP-ER),[11] который решает проблемы растущего разрыва между скоростью вычислений и пропускной способностью ввода-вывода, а также отказоустойчивостью системы для крупномасштабных систем.

Некоторые аспекты, над которыми разработчики BeeGFS работают в рамках этого проекта:

  • поддержка многоуровневого хранения,
  • Расширения интерфейса POSIX,
  • отказоустойчивость и высокая доступность (HA), а также
  • улучшенные средства мониторинга и диагностики.

План состоит в том, чтобы сохранить интерфейс POSIX для обратной совместимости, но также предоставить приложениям больший контроль над тем, как файловая система обрабатывает такие вещи, как размещение данных и согласованность, через расширения API.

Смотрите также

использованная литература

  1. ^ «Последний стабильный выпуск BeeGFS». 29 мая 2018 г.. Получено 23 августа, 2018.
  2. ^ «FhGFS: быстрая и масштабируемая параллельная файловая система | Файловые системы | Столбцы». www.clustermonkey.net. Получено 2019-01-13.
  3. ^ «Лицензионное соглашение с конечным пользователем BeeGFS (EULA)». Fraunhofer ITWM. 22 февраля 2012 г.. Получено 15 марта, 2014.
  4. ^ «Веб-сайт ThinkParQ». Получено 17 марта, 2014.
  5. ^ Рич Брюкнер (13 марта 2014 г.). «Фраунгофер выделит переименованную файловую систему BeeGFS». внутриHPC. Получено 17 марта, 2014.
  6. ^ «Высокопроизводительная параллельная файловая система FraunhoferFS». ClusterVision eNews. Ноябрь 2012. Архивировано с оригинал 17 марта 2014 г.. Получено 17 марта, 2014.
  7. ^ "... И фраунгофера". StorageNewsletter.com. 18 июня 2010 г.. Получено 17 марта, 2014.
  8. ^ «ВСК-2». Список Top500. 20 июня 2011 г.. Получено 17 марта, 2014.
  9. ^ "Авель". Список Top500. 18 июня 2012 г.. Получено 17 марта, 2014.
  10. ^ "BeeGFS - ведущая файловая система параллельного кластера". BeeGFS. Получено 2017-12-07.
  11. ^ «Сайт проекта DEEP-ER». Получено 17 марта, 2014.