Amazon DynamoDB - Amazon DynamoDB

Amazon DynamoDB
DynamoDB.png
Разработчики)Amazon.com
изначальный выпускЯнварь 2012 г.; 8 лет назад (2012-01)[1]
Операционная системаКроссплатформенность
Доступно ванглийский
Тип
ЛицензияПроприетарный
Интернет сайтaws.amazon.com/ Dynamodb/

Amazon DynamoDB полностью управляемая проприетарная NoSQL база данных сервис, который поддерживает ключ-значение и документировать структуры данных[2] и предлагается Amazon.com как часть Веб-сервисы Amazon портфолио.[3] DynamoDB предоставляет аналогичную модель данных и получает свое название от Динамо, но имеет другую базовую реализацию. В Dynamo была многоуровневая архитектура, требующая от клиента разрешения конфликтов версий, а DynamoDB использует синхронную репликацию между несколькими дата-центры[4] за высокую прочность и доступность. DynamoDB анонсировал технический директор Amazon Вернер Фогельс 18 января 2012 г.,[5] и представлен как эволюция Amazon SimpleDB решение.[6]

Фон

Вернер Фогельс, Технический директор Amazon.com, мотивировал этот проект в своем объявлении в 2012 году.[5] Amazon начинал как децентрализованная сеть услуг. Изначально сервисы имели прямой доступ к базам данных друг друга. Когда это стало узким местом для инженерных работ, службы отказались от этой схемы прямого доступа в пользу публичного доступа. API. Тем не менее сторонний системы управления реляционными базами данных изо всех сил пытался справиться с клиентской базой Amazon. Это стало кульминацией во время курортного сезона 2004 года, когда несколько технологий вышли из строя из-за высокой посещаемости.

Инженеры нормализовали эти реляционные системы, чтобы уменьшить избыточность данных, конструкция, оптимизированная для хранения. Жертва: они хранили данный «элемент» данных (например, информацию, относящуюся к продукту в базе данных продуктов) в нескольких отношениях, и требуется время, чтобы собрать непересекающиеся части для запроса. Многие сервисы Amazon требовали, чтобы их данные считывались в основном по первичному ключу, и, учитывая скорость, являющуюся главным приоритетом, объединение этих частей было чрезвычайно утомительным.[7]

Контент с компромиссной эффективностью хранения, ответ Amazon был Динамо: высокодоступное хранилище ключей и значений, созданное для внутреннего использования.[5] Казалось, что «Динамо» - это все, что нужно их инженерам, но его внедрение замедлилось. Разработчики Amazon выбрали шаблоны проектирования "просто работает" с S3 и SimpleDB. Хотя эти системы имели заметные конструктивные недостатки, они не требовали дополнительных затрат на выделение оборудования, масштабирование и перераспределение данных. Следующая итерация Amazon NoSQL Технология DynamoDB автоматизировала эти операции по управлению базами данных.

Обзор

Веб-консоль
Веб-консоль

DynamoDB отличается от других сервисов Amazon тем, что позволяет разработчикам приобретать сервис на основе пропускная способность, скорее, чем место хранения. Если автоматическое масштабирование включено, база данных будет шкала автоматически.[8] Кроме того, администраторы могут запрашивать изменения пропускной способности, и DynamoDB распределяет данные и трафик по нескольким серверам, используя твердотельные накопители, что обеспечивает предсказуемую производительность.[3] Предлагает интеграцию с Hadoop через Эластичный MapReduce.[9]

В сентябре 2013 года Amazon сделал доступной локальную версию DynamoDB для разработки, чтобы разработчики могли локально тестировать приложения, поддерживаемые DynamoDB.[10]

Соображения по развитию

Моделирование данных

Обзор веб-консоли

DynamoDB стол элементы, имеющие атрибуты, некоторые из которых образуют первичный ключ.[11] Однако в реляционных системах элемент имеет каждый атрибут таблицы (или жонглирует «нулевыми» и «неизвестными» значениями при их отсутствии), элементы DynamoDB не имеют схемы. Единственное исключение: при создании таблицы разработчик указывает первичный ключ, а таблица требует ключ для каждого элемента. Первичные ключи должны быть скалярными (струны, числа или двоичный ) и может принимать одну из двух форм. Первичный ключ с одним атрибутом известен как «ключ раздела» таблицы, который определяет раздел, в котором элемент хеши к –– подробнее о разделении ниже –– так, чтобы идеальный ключ раздела имел равномерное распределение по всему диапазону. Первичный ключ также может содержать второй атрибут, который DynamoDB называет «ключом сортировки» таблицы. В этом случае ключи разделов не обязательно должны быть уникальными; они сочетаются с ключами сортировки, чтобы создать уникальный идентификатор для каждого элемента. Ключ раздела по-прежнему используется для определения раздела, в котором хранится элемент, но в каждом разделе элементы сортируются по ключу сортировки.

Индексы

В реляционной модели индексы обычно служат «помощниками» структуры данных дополнить таблицу. Они позволяют СУБД внутренне оптимизировать запросы и не улучшают функциональность запросов. В DynamoDB нет оптимизатор запросов, а индекс - это просто другая таблица с другим ключом (или двумя), которая находится рядом с оригиналом.[11] Когда разработчик создает индекс, он создает новую копию своих данных, но копируются только те поля, которые они указали (как минимум, поля, которые они индексируют, и первичный ключ исходной таблицы).

Пользователи DynamoDB отправляют запросы непосредственно к своим индексам. Доступны два типа индексов. Глобальный вторичный индекс содержит ключ раздела (и необязательный ключ сортировки), отличный от ключа раздела исходной таблицы. Локальный вторичный индекс имеет тот же ключ раздела, что и исходная таблица, но другой ключ сортировки. Оба индекса вводят совершенно новую функциональность запросов в базу данных DynamoDB, разрешая запросы по новым ключам. Подобно системам управления реляционными базами данных, DynamoDB автоматически обновляет индексы при добавлении / обновлении / удалении, поэтому вы должны быть осторожны при их создании, иначе вы рискуете замедлить работу базы данных с большим объемом записи за счет множества обновлений индекса.

Синтаксис

DynamoDB использует JSON за его синтаксис из-за его повсеместного распространения.[нужна цитата ] Действие создания таблицы требует всего трех аргументов: TableName, KeySchema –– список, содержащий ключ раздела и необязательный ключ сортировки –– и AttributeDefinitions –– список атрибутов, которые необходимо определить, которые должны как минимум содержать определения для атрибутов, используемых в качестве раздела. и ключи сортировки. В то время как реляционные базы данных предлагает надежные языки запросов, DynamoDB предлагает только операции Put, Get, Update и Delete. Запросы на размещение содержат атрибут TableName и атрибут Item, который состоит из всех атрибутов и значений, которые имеет элемент. Запрос на обновление следует тому же синтаксису. Точно так же, чтобы получить или удалить элемент, просто укажите TableName и Key.

Архитектура системы

Таблица создания в DynamoDB

Структуры данных

DynamoDB использует хеширование и B-деревья для управления данными. При входе данные сначала распределяются по различным разделам путем хеширования по ключу раздела. Каждый раздел может хранить до 10 ГБ данных и обрабатывать по умолчанию 1000 единиц емкости записи (WCU) и 3000 единиц емкости чтения (RCU).[12] Один RCU представляет один строго последовательный читать в секунду или две в конечном итоге последовательный чтения в секунду для элементов размером до 4 КБ.[11] Один WCU соответствует одной записи в секунду для элемента размером до 1 КБ.

Чтобы предотвратить потерю данных, DynamoDB предлагает двухуровневую систему резервного копирования с репликацией и долгосрочным хранением.[13] Каждый раздел состоит из трех узлов, каждый из которых содержит копию данных этого раздела. Каждый узел также содержит две структуры данных: B-дерево, используемое для поиска элементов, и журнал репликации, в котором записываются все изменения, внесенные в узел. DynamoDB периодически делает снимки этих двух структур данных и сохраняет их в течение месяца в S3 чтобы инженеры могли выполнять восстановление своих баз данных на определенный момент времени.

Внутри каждого раздела один из трех узлов обозначен как «ведущий узел». Все операции записи перед распространением проходят сначала через ведущий узел, что обеспечивает согласованность операций записи в DynamoDB. Чтобы сохранить свой статус, лидер отправляет «контрольный сигнал» друг другу каждые 1,5 секунды. Если другой узел перестанет получать контрольные сообщения, он может инициировать выборы нового лидера. DynamoDB использует Алгоритм Паксоса избирать лидеров.

Инженеры Amazon изначально избегали Dynamo из-за дополнительных затрат на проектирование, таких как выделение ресурсов и управление разделами и узлами.[7] В ответ команда DynamoDB создала службу, которую она называет AutoAdmin для управления базой данных.[13] AutoAdmin заменяет узел, когда он перестает отвечать, копируя данные с другого узла. Когда раздел превышает любое из трех пороговых значений (RCU, WCU или 10 ГБ), AutoAdmin автоматически добавит дополнительные разделы для дальнейшего сегментирования данных.[12]

Как и системы индексации в реляционной модели, DynamoDB требует, чтобы любые обновления таблицы отражались в каждом из индексов таблицы. DynamoDB обрабатывает это с помощью службы, которую он называет «распространителем журналов», который подписывается на журналы репликации в каждом узле и при необходимости отправляет дополнительные запросы на размещение, обновление и удаление в индексы.[13] Поскольку индексы приводят к значительному снижению производительности для запросов на запись, DynamoDB разрешает пользователю не более пяти из них для любой данной таблицы.[нужна цитата ]

Выполнение запроса

Предположим, что пользователь DynamoDB выполняет операцию записи (Put, Update или Delete). В то время как типичная реляционная система преобразует SQL-запрос в реляционная алгебра и запускать алгоритмы оптимизации, DynamoDB пропускает оба процесса и сразу приступает к работе.[13] Запрос поступает на маршрутизатор запросов DynamoDB, который аутентифицирует –– «Запрос исходит от того, откуда / кем он заявляется?» –– и проверяет авторизацию –– «Имеет ли пользователь, отправляющий запрос, необходимые разрешения?» Если эти проверки пройдены, система хеширует ключ раздела запроса, чтобы он прибыл в соответствующий раздел. Внутри есть три узла, каждый с копией данных раздела. Система сначала записывает в ведущий узел, затем записывает во второй узел, затем отправляет сообщение об успешном завершении и, наконец, продолжает распространение на третий узел. Записи согласованы, потому что они всегда сначала проходят через ведущий узел.

Наконец, распространитель журнала распространяет изменение на все индексы. Для каждого индекса он получает значение первичного ключа этого индекса из элемента, а затем выполняет ту же запись в этот индекс без распространения журнала. Если операция представляет собой обновление уже существующего элемента, обновленный атрибут может служить первичным ключом для индекса, и, следовательно, B-дерево для этого индекса также должно обновляться. Деревья B обрабатывают только операции вставки, удаления и чтения, поэтому на практике, когда распространитель журнала получает операцию обновления, он выдает и операцию удаления, и операцию размещения для всех индексов.

Теперь предположим, что пользователь DynamoDB выполняет операцию Get. Маршрутизатор запросов продолжает аутентификацию и авторизацию, как и раньше. Затем, как указано выше, мы хэшируем наш ключ раздела, чтобы получить соответствующий хеш. Теперь мы сталкиваемся с проблемой: когда три узла в конечном итоге согласованы друг с другом, как мы можем решить, какие из них исследовать? DynamoDB предлагает пользователю два варианта выполнения чтения: согласованный и в конечном итоге согласованный. Последовательное чтение посещает узел лидера. Но компромисс между согласованностью и доступностью снова поднимает голову: в системах с интенсивным чтением постоянное чтение от лидера может привести к перегрузке одного узла и снижению доступности.

Второй вариант, в итоге согласованное чтение, выбирает случайный узел. На практике именно здесь DynamoDB жертвует согласованностью на доступность. Если мы пойдем по этому пути, каковы шансы на несоответствие? Нам понадобится операция записи, чтобы вернуть «успех» и начать распространение на третий узел, но не завершить. Нам также понадобится наш Get для нацеливания на этот третий узел. Это означает, что вероятность несогласованности в пределах окна распространения операции записи составляет 1 к 3. Как долго это окно? Любое количество катастроф может привести к отставанию узла, но в подавляющем большинстве случаев третий узел обновляется в пределах миллисекунд от лидера.

Спектакль

Вкладка Емкость, масштабирование

DynamoDB предоставляет метрики производительности, которые помогают пользователям правильно подготавливать его и обеспечивать бесперебойную работу приложений, использующих DynamoDB:

Эти показатели можно отслеживать с помощью AWS Консоль управления с использованием AWS Интерфейс командной строки, или инструмент мониторинга, интегрированный с Amazon CloudWatch.[15]


Языковые привязки

Языки и фреймворки с DynamoDB привязка включают Ява, JavaScript, Node.js, Идти, C # .СЕТЬ, Perl, PHP, Python, Рубин, Haskell, Erlang, Джанго, и Грааль.[16]

Примеры кода

AWS DynamoDB: просмотр элементов

Против HTTP API, элементы запроса:

ПОЧТОВЫЙ / HTTP /1.1Хозяин: Dynamodb. <регион>. <домен>;Принять-кодирование: личностьContent-Length: <PayloadSizeBytes>Пользователь-агент: <UserAgentString>Тип содержимого: приложение / x-amz-json-1.0Авторизация: AWS4-HMAC-SHA256 Credential = , SignedHeaders = , Подпись = <Подпись>X-Amz-Date: <Date>X-Amz-Target: DynamoDB_20120810.Запрос{    "TableName": "Отвечать",    "IndexName": "Размещено-указателем",    «Предел»: 3,    "ConsistentRead": истинный,    "ProjectionExpression": "Id, PostedBy, ReplyDateTime",    «KeyConditionExpression»: "Id =: v1 И РАЗРЕШЕНО МЕЖДУ: v2a И: v2b",    "ExpressionAttributeValues": {        ": v1": {"S": "Amazon DynamoDB # DynamoDB Thread 1"},        ": v2a": {"S": «Пользователь А»},        ": v2b": {"S": «Пользователь C»}    },    «ReturnConsumedCapacity»: "ОБЩИЙ"}

Образец ответа:

HTTP /1.1 200 Okx-amzn-RequestId: <RequestId>x-amz-crc32: <Checksum>Тип содержимого: приложение / x-amz-json-1.0Content-Length: <PayloadSizeBytes>Дата: <Date> {    «Потребляемая мощность»: {        «Единицы мощности»: 1,        "TableName": "Отвечать"    },    "Считать": 2,    "Предметы": [        {            "ReplyDateTime": {"S": «2015-02-18T20: 27: 36.165Z»},            "Сообщение от": {"S": «Пользователь А»},            "Идентификатор": {"S": "Amazon DynamoDB # DynamoDB Thread 1"}        },        {            "ReplyDateTime": {"S": "2015-02-25T20: 27: 36.165Z"},            "Сообщение от": {"S": «Пользователь Б»},            "Идентификатор": {"S": "Amazon DynamoDB # DynamoDB Thread 1"}        }    ],    "ScannedCount": 2}

GetItem в Идти:

getItemInput := &динамодб.GetItemInput{	TableName: aws.Нить("счастливый маркетолог"),	Ключ: карта[нить]*динамодб.AttributeValue{		"pk": {			S: aws.Нить("проект"),		},		"sk": {			S: aws.Нить(электронное письмо + " " + имя),		},	},}getItemOutput, ошибаться := DynamodbClient.GetItem(getItemInput)

DeleteItem в Идти:

deleteItemInput := &динамодб.DeleteItemInput{	TableName: aws.Нить("счастливый маркетолог"),	Ключ: карта[нить]*динамодб.AttributeValue{		"pk": {			S: aws.Нить("проект"),		},		"sk": {			S: aws.Нить(электронное письмо + " " + имя),		},	},}_, ошибаться := DynamodbClient.Удалить пункт(deleteItemInput)если ошибаться != ноль {	паника(ошибаться)}

UpdateItem в Go, используя Построитель выражений:

Обновить := выражение.Набор(	выражение.Имя(имя),	выражение.Ценить(ценить),)expr, ошибаться := выражение.NewBuilder().WithUpdate(Обновить).Строить()если ошибаться != ноль {	паника(ошибаться)}updateItemInput := &динамодб.UpdateItemInput{	TableName: aws.Нить(tableName),	Ключ: карта[нить]*динамодб.AttributeValue{		"pk": {			S: aws.Нить("проект"),		},		"sk": {			S: aws.Нить("mySortKeyValue"),		},	},	UpdateExpression:          expr.Обновлять(),	ExpressionAttributeNames:  expr.Имена(),	ExpressionAttributeValues: expr.Значения(),}fmt.Printf("updateItemInput:% # v  n", updateItemInput)_, ошибаться = DynamodbClient.UpdateItem(updateItemInput)если ошибаться != ноль {	паника(ошибаться)}

Смотрите также

Рекомендации

  1. ^ «Amazon DynamoDB - быстрая и масштабируемая служба баз данных NoSQL, разработанная для приложений Интернет-масштаба - все распределено». www.allthingsdistributed.com.
  2. ^ «Amazon DynamoDB - Часто задаваемые вопросы». Amazon Web Services, Inc.
  3. ^ а б Кларк, Джек (19 января 2012 г.). «Amazon переходит на облачную службу баз данных DynamoDB». ZDNet. Получено 2012-01-21.
  4. ^ «Часто задаваемые вопросы: масштабируемость, доступность и надежность». Веб-сервисы Amazon.
  5. ^ а б c Фогельс, Вернер (18 января 2012 г.). «Amazon DynamoDB - быстрая и масштабируемая служба баз данных NoSQL, разработанная для приложений Интернет-масштабирования». Блог All Things Distributed. Получено 2012-01-21.
  6. ^ «Amazon DynamoDB - Часто задаваемые вопросы». Amazon Web Services, Inc. Получено 2019-06-03.
  7. ^ а б Декандия, Джузеппе; Хасторун, Дениз; Джампани, Мадан; Какулапати, Гунавардхан; Лакшман, Авинаш; Пильчин, Алексей; Сивасубраманиан, Сваминатан; Фосхолл, Питер; Фогельс, Вернер (октябрь 2007 г.). «Dynamo: высокодоступный магазин ключей и значений Amazon». SIGOPS Oper. Syst. Rev. 41 (6): 205–220. Дои:10.1145/1323293.1294281. ISSN  0163-5980.
  8. ^ «Автоматическое управление пропускной способностью с помощью DynamoDB Auto Scaling». Amazon DynamoDB. Получено 2017-07-05.
  9. ^ Грей, Адам (25 января 2012 г.). «AWS HowTo: Использование Amazon Elastic MapReduce с DynamoDB (гостевой пост)». Блог новостей AWS. Получено 29 октября 2019.
  10. ^ «DynamoDB Local для разработки настольных компьютеров». Веб-сервисы Amazon. 12 сентября 2013 г.. Получено 13 сентября 2013.
  11. ^ а б c «Руководство разработчика Amazon DynamoDB». AWS. 10 августа 2012 г.. Получено 18 июля, 2019.
  12. ^ а б Гунасекара, Арчи (27.06.2016). «Глубокое погружение в разделы DynamoDB». Группа Shine Solutions. Получено 2019-08-03.
  13. ^ а б c d AWS re: Invent 2018: Amazon DynamoDB под капотом: как мы создали гипермасштабируемую базу данных (DAT321), получено 2019-08-03
  14. ^ «Лучшие показатели производительности DynamoDB».
  15. ^ «Как собирать метрики DynamoDB».
  16. ^ «Изобилие библиотек, средств отображения и фиктивных реализаций Amazon DynamoDB!». Веб-сервисы Amazon.

внешняя ссылка