Ядро базы данных - Database engine

А ядро базы данных (или же механизм хранения) - это базовый программный компонент, который система управления базами данных (СУБД) использует для создавать, читать, обновлять и удалять (CRUD) данные из база данных. Большинство систем управления базами данных включают собственные интерфейс прикладного программирования (API), который позволяет пользователю взаимодействовать с их базовым механизмом, минуя пользовательский интерфейс СУБД.

Термин «ядро базы данных» часто используется как синоним «сервер базы данных "или" система управления базой данных "." Экземпляр базы данных "относится к процессам и структурам памяти ядро базы данных.

Двигатели хранения

Многие современные СУБД поддерживают несколько механизмов хранения в одной базе данных. Например, MySQL поддерживает InnoDB а также MyISAM.

Некоторые механизмы хранения транзакционный.

ИмяЛицензияТранзакционный
АрияGPLНет
СоколGPLда
InnoDBGPLда
MyISAMGPLНет
InfiniDBGPLНет
TokuDBGPLда
WiredTigerGPLда
XtraDBGPLда
RocksDBBSDда

Дополнительные типы двигателей включают:

Соображения по дизайну

Информация в базе данных хранится в виде битов, представленных как структуры данных в хранилище, которое может быть эффективно прочитано и записано с учетом свойств оборудования. Обычно само хранилище предназначено для удовлетворения требований различных областей, которые широко используют хранилище, включая базы данных. А СУБД в работе всегда одновременно использует несколько типов хранилищ (например, память и внешнее хранилище) с соответствующими методами компоновки.

В принципе хранилище базы данных можно рассматривать как линейное адресное пространство, где каждый бит данных имеет свой уникальный адрес в этом адресном пространстве. На практике только очень небольшой процент адресов сохраняется в качестве начальных опорных точек (что также требует хранения); доступ к большинству данных осуществляется путем косвенного обращения с использованием вычислений смещения (расстояние в битах от опорных точек) и структур данных, которые определяют пути доступа (с использованием указателей) ко всем необходимым данным эффективным способом, оптимизированным для необходимых операций доступа к данным.

Иерархия хранилища базы данных

База данных во время работы находится одновременно в нескольких типах хранилищ, образуя иерархия хранения. По природе современных компьютеров большая часть части базы данных внутри компьютера, на котором размещена СУБД, находится (частично реплицируется) в энергозависимой памяти. Данные (части базы данных), которые обрабатываются / обрабатываются, находятся внутри процессора, возможно, в кеши процессора. Эти данные читаются / записываются в память, обычно через компьютер. автобус (пока что обычно компоненты энергозависимого хранилища). Компьютерная память передает данные (передаваемые в / из) во внешнее хранилище, обычно через стандартные интерфейсы хранилища или сети (например, волоконный канал, iSCSI ). А массив хранения, обычное внешнее устройство хранения, обычно имеет собственную иерархию хранения из быстрого кеша, обычно состоящего из (энергозависимого и быстрого) DRAM, который подключен (опять же через стандартные интерфейсы) к дискам, возможно, с разной скоростью, например флэш-накопители и магнитный Дисковый привод (нелетучий). Приводы могут быть подключены к магнитные ленты, на котором обычно могут находиться наименее активные части большой базы данных, или генерации резервных копий базы данных.

Обычно в настоящее время существует корреляция между скоростью хранения и ценой, в то время как более быстрое хранилище обычно нестабильно.

Структуры данных

Структура данных - это абстрактная конструкция, которая встраивает данные четко определенным образом. Эффективная структура данных позволяет эффективно манипулировать данными. Манипулирование данными может включать в себя вставку, удаление, обновление и поиск данных в различных режимах. Определенный тип структуры данных может быть очень эффективным в одних операциях и очень неэффективным в других. Тип структуры данных выбирается при разработке СУБД, чтобы наилучшим образом соответствовать операциям, необходимым для типов данных, которые она содержит. Тип структуры данных, выбранной для определенной задачи, обычно также принимает во внимание тип хранилища, в котором она находится (например, скорость доступа, минимальный размер доступного фрагмента хранилища и т. Д.). В некоторых СУБД администраторы баз данных имеют возможность выбирать среди вариантов структур данных, которые будут содержать пользовательские данные по соображениям производительности. Иногда структуры данных имеют выбираемые параметры для настройки производительности базы данных.

Базы данных могут хранить данные во многих типах структур данных.[1] Типичные примеры:

Ориентация данных и кластеризация

В отличие от традиционной строковой ориентации, реляционные базы данных также могут быть столбчатый или же корреляционный способом хранения данных в любой конкретной структуре.

Как правило, достигается существенное улучшение производительности, если различные типы объектов базы данных, которые обычно используются вместе, размещаются в хранилище рядом, будучи «кластеризованными». Обычно это позволяет извлечь необходимые связанные объекты из хранилища за минимальное количество операций ввода (каждая из которых иногда требует значительных затрат времени). Даже для баз данных в памяти кластеризация обеспечивает преимущество в производительности из-за обычного использования больших кешей для операций ввода-вывода в памяти с аналогичным результирующим поведением.

Например, может быть полезно сгруппировать запись «предмета» на складе со всеми соответствующими записями «заказа». Решение о том, кластеризовать ли определенные объекты или нет, зависит от статистики использования объектов, размеров объектов, размеров кешей, типов хранилищ и т. Д.

Индексирование базы данных

Индексирование - это метод, который некоторые механизмы хранения используют для повышения производительности базы данных. У многих типов индексов есть общее свойство, заключающееся в том, что они уменьшают необходимость проверки каждой записи при выполнении запроса. В больших базах данных это может сократить время / стоимость запроса на порядки. Самая простая форма индекса - это отсортированный список значений, в которых можно искать с помощью бинарный поиск со смежной ссылкой на расположение записи, аналогично указателю на обратной стороне книги. Одни и те же данные могут иметь несколько индексов (база данных сотрудников может быть проиндексирована по фамилии и дате найма).

Индексы влияют на производительность, но не на результаты. Разработчики баз данных могут добавлять или удалять индексы без изменения логики приложения, снижая затраты на обслуживание по мере роста базы данных и развития использования базы данных. Индексы могут ускорить доступ к данным, но они занимают место в базе данных и должны обновляться каждый раз при изменении данных. Таким образом, индексы могут ускорить доступ к данным, но замедлить их обслуживание. Эти два свойства определяют, стоит ли данный индекс затрат.

Рекомендации

  1. ^ Lightstone, S .; Теорей, Т .; Надо, Т. (2007). Physical Database Design: руководство для профессионалов по базам данных по использованию индексов, представлений, хранилищ и многого другого. Морган Кауфманн Пресс. ISBN  978-0-12-369389-1.

внешняя ссылка