Распределенное хранилище данных - Distributed data store

А распределенное хранилище данных это компьютерная сеть где информация хранится более чем на одном узел, часто в воспроизведен мода.[1] Обычно он специально используется для обозначения распределенная база данных где пользователи хранят информацию о количество узлов, или компьютерная сеть в котором пользователи хранят информацию о количество одноранговых сетевых узлов.

Распределенные базы данных

Распределенные базы данных обычно нереляционные базы данных которые обеспечивают быстрый доступ к данным на большом количестве узлов. Некоторые распределенные базы данных предоставляют широкие возможности запросов, в то время как другие ограничены хранилище ключей и значений семантика. Примеры ограниченных распределенных баз данных: Google с Большой стол, что намного больше, чем просто распределенная файловая система или одноранговая сеть,[2] Amazon с Динамо[3]и Хранилище Microsoft Azure.[4]

Поскольку возможность произвольных запросов не так важна, как доступность разработчики распределенных хранилищ данных увеличили последнее за счет согласованности. Но высокоскоростной доступ для чтения / записи приводит к снижению согласованности, поскольку невозможно иметь и то, и другое. последовательность, доступность и устойчивость к разделению сети, как это было доказано CAP теорема.

Хранилища данных одноранговых сетевых узлов

В одноранговых сетевых хранилищах данных пользователь обычно может отвечать взаимностью и разрешать другим пользователям также использовать свой компьютер в качестве узла хранения. Информация может быть доступна или недоступна другим пользователям в зависимости от конструкции сети.

Наиболее пиринговый сети не имеют распределенных хранилищ данных, поскольку данные пользователя доступны только тогда, когда их узел находится в сети. Однако это различие несколько размыто в такой системе, как BitTorrent, где исходный узел может перейти в автономный режим, но контент будет продолжать обслуживаться. Тем не менее, это справедливо только для отдельных файлов, запрашиваемых распространителями, в отличие от таких сетей, как Freenet, Винни, доля и Perfect Dark где любой узел может хранить любую часть файлов в сети.

Распределенные хранилища данных обычно используют обнаружение и исправление ошибок Некоторые распределенные хранилища данных (например, Parchive через NNTP) используйте упреждающее исправление ошибок методы восстановления исходного файла, когда части этого файла повреждены или недоступны. Другие пытаются снова загрузить этот файл с другого зеркала.

Примеры

Распределенные нереляционные базы данных

ТоварЛицензияВысокая доступностьПримечания
Apache AccumuloAL2
AerospikeAGPL
Апач КассандраAL2даранее использовался Facebook
Apache IgniteAL2
Большой столПроприетарныйиспользован Google
ДиванAL2использован LinkedIn, PayPal, и eBay
CrateDBAL2да
Druid (хранилище данных с открытым исходным кодом)AL2использован Netflix, и Yahoo
ДинамоПроприетарныйиспользован Amazon
HazelcastAL2, Проприетарный
HBaseAL2даранее использовался Facebook
ГипертаблицаGPL 2Baidu
MongoDBобычай
РиакAL2да
RedisЛицензия BSDда
СциллаAGPL
Волан-де-МортAL2использован LinkedIn

Хранилища данных одноранговых сетевых узлов

Смотрите также

Рекомендации

  1. ^ Янив Песач, Распределенное хранилище (Распределенное хранилище: концепции, алгоритмы и реализации ред.), ПР  25423189M
  2. ^ "Bigtable: распределенное хранилище данных Google". http://the-paper-trail.org/: Paper Trail. Архивировано из оригинал на 2017-07-16. Получено 2011-04-05. Хотя GFS обеспечивает Google надежным масштабируемым распределенным хранилищем файлов, он не предоставляет никаких средств для структурирования данных, содержащихся в файлах, за исключением иерархической структуры каталогов и значимых имен файлов. Хорошо известно, что для больших наборов данных требуются более выразительные решения. Терабайты и терабайты данных Google, которые они получают от поисковых роботов, среди многих других источников, нуждаются в организации, чтобы клиентские приложения могли быстро выполнять поиск и обновления с более высокой степенью детализации, чем на уровне файлов. [...] Первое, что вам нужно знать о Bigtable, это то, что это не реляционная база данных. Это не должно вызывать удивления: во всех этих статьях о крупномасштабных распределенных хранилищах данных постоянно присутствует одна постоянная тема: реляционные СУБД трудно добиться с хорошей производительностью. В Bigtable нет жесткой фиксированной схемы, нет ссылочной целостности между таблицами (поэтому нет внешних ключей) и, следовательно, мало поддержки оптимизированных объединений.
  3. ^ Сара Пидкок (31 января 2011). «Dynamo: высокодоступный магазин ключей и значений Amazon» (PDF). http://www.cs.uwaterloo.ca/: WATERLOO - ХЕРИТОНСКАЯ ШКОЛА ИНФОРМАТИКИ. п. 2/22. Получено 2011-04-05. Dynamo: высокодоступное и масштабируемое распределенное хранилище данных
  4. ^ «Хранилище Windows Azure». 2011-09-16. Архивировано из оригинал 9 ноября 2011 г.. Получено 6 ноября 2011.