База данных в памяти - Википедия - In-memory database
An база данных в памяти (IMDB, также система базы данных основной памяти или же MMDB или же резидентная база данных в памяти) это система управления базами данных что в первую очередь полагается на основная память за компьютерное хранилище данных. Это контрастирует с системами управления базами данных, которые используют дисковое хранилище механизм. Базы данных в памяти работают быстрее, чем базы данных, оптимизированные для диска, поскольку доступ к диску медленнее, чем доступ к памяти, внутренние алгоритмы оптимизации проще и выполняют меньше инструкций ЦП. Доступ к данным в памяти устраняет время поиска при запросе данных, что обеспечивает более быструю и предсказуемую производительность, чем диск.[1][2]
Приложения, в которых время отклика имеет решающее значение, например, работающие с телекоммуникационным сетевым оборудованием и мобильная реклама сети, часто используют базы данных в оперативной памяти.[3] IMDB приобрели большую популярность, особенно в аналитика данных пространство, начиная с середина 2000-х - в основном из-за многоядерных процессоров, которые могут работать с большой памятью, и из-за меньшей стоимости баран.[4][5]
Потенциальным техническим препятствием при хранении данных в памяти является непостоянство оперативной памяти. В частности, в случае отключения питания, преднамеренного или иного, данные, хранящиеся в энергозависимая RAM потерян.[6] С введением энергонезависимая память с произвольным доступом технологии, базы данных в памяти смогут работать на полной скорости и сохранять данные в случае сбоя питания.[7][8][9]
Поддержка ACID
В простейшей форме базы данных в основной памяти хранят данные на энергозависимая память устройств. Эти устройства теряют всю сохраненную информацию, когда устройство теряет питание или перезагружается. В этом случае можно сказать, что IMDB не поддерживает часть «долговечности» КИСЛОТА (атомарность, последовательность, изоляция, долговечность) свойства. IMDB на основе энергозависимой памяти могут поддерживать и часто поддерживают три других свойства ACID: атомарность, согласованность и изоляцию.
Многие IMDB повысили надежность с помощью следующих механизмов:
- Снимок файлы, или, пропускной пункт изображения, которые фиксируют состояние базы данных в данный момент времени. Система обычно генерирует их периодически или, по крайней мере, когда IMDB выполняет контролируемое отключение. Хотя они обеспечивают определенную устойчивость данных (в том смысле, что база данных не теряет все в случае сбоя системы), они предлагают только частичную долговечность (поскольку «недавние» изменения будут потеряны). с одним из следующих:
- Ведение журнала транзакций, который записывает изменения в базе данных в файл журнала и облегчает автоматическое восстановление базы данных в памяти.
- Энергонезависимый DIMM (NVDIMM ), модуль памяти с интерфейсом DRAM, часто в сочетании с флеш-памятью NAND для энергонезависимой защиты данных. Первые решения NVDIMM были разработаны с суперконденсаторы вместо батарей для резервного источника питания. С этим хранилищем IMDB может безопасно выйти из своего состояния после перезагрузки.
- Энергонезависимая память с произвольным доступом (NVRAM), обычно в виде статической RAM с резервным питанием от батареи (батарея RAM) или электрически стираемого программируемого ПЗУ (EEPROM ). С помощью этого хранилища перезагружающаяся система IMDB может восстановить хранилище данных из его последнего согласованного состояния.
- Высокая доступность реализации, которые полагаются на базу данных репликация, с автоматическим аварийное переключение к идентичной резервной базе данных в случае отказа первичной базы данных. Для защиты от потери данных в случае полного отказа системы репликация IMDB обычно используется в дополнение к одному или нескольким механизмам, перечисленным выше.
Некоторые IMDB позволяют схеме базы данных указывать различные требования к долговечности для выбранных областей базы данных - таким образом, быстро изменяющиеся данные, которые можно легко восстановить или которые не имеют смысла после выключения системы, не нужно будет регистрировать для обеспечения долговечности (хотя для обеспечения высокой доступности ее необходимо будет реплицировать), тогда как информация о конфигурации будет помечена как требующая сохранения.
Гибриды с базами данных на диске
Хотя хранение данных в памяти дает преимущества в производительности, это дорогостоящий метод хранения данных. Подход к реализации преимуществ хранения в памяти при ограничении затрат заключается в хранении наиболее часто используемых данных в памяти, а остальных на диске. Поскольку нет четкого различия между данными, которые должны храниться в памяти, а какие - на диске, некоторые системы динамически обновляют место хранения данных в зависимости от их использования.[10] Этот подход немного отличается от кеширование, в котором больше всего недавно доступ данные кэшируются, в отличие от большинства часто посещаемый данные хранятся в памяти.
Гибкость гибридных подходов позволяет найти баланс между:
- производительность (которая повышается за счет сортировки, хранения и извлечения указанных данных полностью в памяти, а не на диске)
- стоимость, потому что более дешевый жесткий диск можно заменить большим объемом памяти
- упорство
- форм-фактор, потому что чипы RAM не могут приблизиться к плотность небольшого жесткого диска
в облачные вычисления В отрасли термины «температура данных» или «горячие данные» и «холодные данные» появились для описания того, как данные хранятся в этом отношении.[11] Горячие данные используются для описания критически важных данных, к которым требуется частый доступ, в то время как холодные данные описывают данные, которые требуются реже и менее срочно, например данные, хранящиеся для целей архивирования или аудита. Горячие данные должны храниться таким образом, чтобы предлагать быстрое извлечение и модификацию, часто выполняемое хранением в памяти, но не всегда. С другой стороны, холодные данные можно хранить более экономичным способом, и считается, что доступ к данным, вероятно, будет медленнее по сравнению с горячими данными. Хотя эти описания полезны, нет конкретного определения для терминов «горячий» и «холодный».[11]
Эффективность производства - еще одна причина для выбора комбинированной системы баз данных в памяти и на диске. Некоторые линейки устройств, особенно в бытовая электроника, включите некоторые блоки с постоянным хранилищем, а другие полагаются на память для хранения (телеприставки, Например). Если для таких устройств требуется система базы данных, производитель может принять гибридную систему базы данных по более низкой и верхний стоимость и меньшая настройка кода, вместо использования отдельных баз данных в памяти и на диске, соответственно, для бездисковых и дисковых продуктов.
Первый ядро базы данных для поддержки таблиц в памяти и на диске в одной базе данных, WebDNA, был выпущен в 1995 году.
Память для хранения
Другой вариант включает в себя большие объемы энергонезависимой памяти на сервере, например микросхемы флэш-памяти в качестве адресуемой памяти, а не структурированные как дисковые массивы. База данных в этой форме памяти сочетает в себе очень быструю скорость доступа с устойчивостью при перезагрузках и потерях питания.[12]
Смотрите также
- Сравнение систем управления реляционными базами данных
- Распределенное хранилище данных
- Встроенные базы данных
- Обработка в памяти
- Список баз данных в памяти
- NoSQL
- NewSQL
Примечания
- ^ «Определение: база данных в памяти». WhatIs.com. Получено 19 января 2013.
- ^ Майкл Визард. "Рост баз данных в памяти". Slashdot. Архивировано из оригинал 1 февраля 2013 г.. Получено 19 января 2013.
- ^ "TeleCommunication Systems становится реселлером TimesTen; операторы мобильной связи и операторы мобильной связи получают платформу реального времени для предоставления услуг на основе определения местоположения". Деловой провод. 2002-06-24.
- ^ «Падение цен на оперативную память приводит к резкому увеличению объема баз данных в оперативной памяти». SAP. Получено 19 января 2013.
- ^ «Рост количества баз данных в оперативной памяти влияет на широкий спектр рабочих мест». Dice.com. 13 июля 2012 г.
- ^ «Вычисления в оперативной памяти: что происходит при отключении питания?». Получено 10 марта, 2017.
- ^ Исторически оперативная память не использовалась в качестве постоянного хранилища данных, и поэтому потеря данных в этих случаях не была проблемой. http://research.microsoft.com/apps/pubs/default.aspx?id=160853
- ^ Мрачное будущее флэш-памяти NAND http://research.microsoft.com/apps/pubs/default.aspx?id=162804
- ^ AGIGARAM NVDIMM сохраняет данные при сбое системы https://www.embedded.com/electronics-products/electronic-product-reviews/real-time-and-performance/4422291/AGIGARAM-NVDIMM-saves-data-through-system-failure
- ^ "Терадата входит в борьбу с оперативной памятью, разумно ZDNet". Получено 28 июля, 2017.
- ^ а б «В чем разница: горячее и холодное хранение данных». Получено 28 июля, 2017.
- ^ «Воистину, это ЗОЛОТЫЕ ГОДЫ ХРАНЕНИЯ».
Рекомендации
- Джек Белзер. Энциклопедия компьютерных наук и технологий - Том 14: Системы очень больших баз данных для нулевой памяти и марковский источник информации. Marcel Dekker Inc. ISBN 978-0-8247-2214-2.