Изоляция снимков - Википедия - Snapshot isolation

В базы данных, и обработка транзакции (управление транзакциями), изоляция моментального снимка гарантия того, что все операции чтения сделка увидит согласованный моментальный снимок базы данных (на практике он считывает последние зафиксированные значения, которые существовали на момент запуска), а сама транзакция будет успешно зафиксирована только в том случае, если никакие обновления не вступили в конфликт с любыми одновременными обновлениями, сделанными после этого моментального снимка.

Изоляция моментальных снимков была принята несколькими основными системы управления базами данных, Такие как InterBase, Жар-птица, Oracle, MySQL,[1] PostgreSQL, SQL Anywhere, MongoDB[2] и Microsoft SQL Server (2005 г. и позже). Основная причина его принятия заключается в том, что он обеспечивает лучшую производительность, чем сериализуемость, но все же позволяет избежать большинства аномалий параллелизма, которых позволяет избежать сериализуемость (но не всегда). На практике изоляция моментальных снимков реализована внутри мультиверсионный контроль параллелизма (MVCC), где поддерживаются генерационные значения каждого элемента данных (версий): MVCC - это распространенный способ повышения параллелизма и производительности путем создания новой версии объекта базы данных каждый раз при записи объекта и разрешения операций чтения транзакций несколько последних актуальных версий (каждого объекта). Использована изоляция моментального снимка[3] критиковать ANSI SQL -92 стандартное определение изоляция уровней, поскольку он не демонстрирует никаких «аномалий», запрещенных стандартом SQL, но не может быть сериализован (уровень изоляции без аномалий, определенный ANSI).

Несмотря на отличие от сериализуемости, изоляцию моментальных снимков иногда называют сериализуемый от Oracle.

Определение

Транзакция, выполняемая в условиях изоляции моментального снимка, похоже, работает с личным снимок базы данных, взятой в начале транзакции. Когда транзакция завершается, она будет успешно зафиксирована только в том случае, если значения, обновленные транзакцией, не были изменены извне с момента создания моментального снимка. Такой конфликт записи и записи вызовет прерывание транзакции.

В писать перекос аномалия, две транзакции (T1 и T2) одновременно читают перекрывающийся набор данных (например, значения V1 и V2), одновременно делают непересекающиеся обновления (например, T1 обновляет V1, T2 обновляет V2) и, наконец, одновременно фиксируются, ни одна из которых не видела обновление, выполненное другой. Если бы система была сериализуемой, такая аномалия была бы невозможна, поскольку либо T1, либо T2 должны были бы возникать «первыми» и быть видимыми для другого. Напротив, изоляция моментальных снимков допускает аномалии перекоса записи.

В качестве конкретного примера представьте, что V1 и V2 - это два баланса, которыми владеет один человек, Фил. Банк позволит либо V1, либо V2 иметь дефицит при условии, что общая сумма, хранящаяся в обоих, никогда не будет отрицательной (т.е.V1 + V2 ≥ 0). Оба баланса в настоящее время составляют 100 долларов. Фил инициирует две транзакции одновременно: T1 снимает 200 долларов с V1, а T2 снимает 200 долларов с V2.

Если база данных гарантирует сериализуемые транзакции, простейший способ кодирования T1 - вычесть 200 долларов из V1, а затем проверить, что V1 + V2 ≥ 0 все еще выполняется, в противном случае - прервать выполнение. T2 аналогичным образом вычитает 200 долларов из V2, а затем проверяет V1 + V2 ≥ 0. Поскольку транзакции должны сериализоваться, либо T1 выполняется первым, оставляя V1 = - 100 долларов, V2 = 100 долларов и предотвращая успешное выполнение T2 (поскольку V1 + (V2 - 200 долларов)) сейчас - 200 долларов), или T2 происходит первым и аналогичным образом предотвращает фиксацию T1.

Однако, если база данных находится в режиме изоляции моментальных снимков (MVCC), T1 и T2 работают с частными моментальными снимками базы данных: каждый вычитает 200 долларов из учетной записи, а затем проверяет, что новая сумма равна нулю, используя значение другой учетной записи, которое сохранялось, когда снимок сделан. Поскольку ни Обновить конфликты, оба фиксируются успешно, оставляя V1 = V2 = - 100 долларов, а V1 + V2 = - 200 долларов.

Некоторые системы построены с использованием мультиверсионный контроль параллелизма (MVCC) может поддерживать (только) изоляцию моментальных снимков, чтобы транзакции продолжались, не беспокоясь о параллельных операциях, и, что более важно, без необходимости повторной проверки всех операций чтения, когда транзакция окончательно фиксируется. Это удобно, потому что MVCC поддерживает ряд состояний, согласованных с недавней историей. Единственная информация, которая должна храниться во время транзакции, - это список сделанных обновлений, который можно довольно легко просканировать на наличие конфликтов перед фиксацией. Однако системы MVCC (такие как MarkLogic) будут использовать блокировки для сериализации записи вместе с MVCC, чтобы получить некоторый прирост производительности и по-прежнему поддерживать более сильный уровень изоляции «сериализуемости».

Обходные пути

Потенциальные проблемы несогласованности, возникающие из-за аномалий перекоса записи, могут быть устранены путем добавления (в противном случае ненужных) обновлений к транзакциям для обеспечения соблюдения сериализуемость свойство.[4]

Материализовать конфликт
Добавьте специальную таблицу конфликтов, которую обе транзакции обновляют, чтобы создать прямой конфликт записи-записи.
Повышение
Попросите одну транзакцию «обновить» доступное только для чтения местоположение (заменив значение тем же значением), чтобы создать прямой конфликт записи-записи (или используйте эквивалентное продвижение, например, Oracle SELECT FOR UPDATE).

В приведенном выше примере мы можем материализовать конфликт, добавив новую таблицу, которая делает скрытое ограничение явным, сопоставляя каждого человека с его Итоговый баланс. Фил начинал с общего баланса в 200 долларов, и каждая транзакция пыталась вычесть из него 200 долларов, создавая конфликт записи и записи, который не позволял двум одновременно добиться успеха. Однако такой подход нарушает нормальная форма.

В качестве альтернативы мы можем преобразовать одно из операций чтения транзакции в запись. Например, T2 может установить V1 = V1, создавая искусственный конфликт записи-записи с T1 и, опять же, предотвращая одновременное выполнение двух операций. Это решение не всегда возможно.

Таким образом, в целом изоляция моментальных снимков накладывает некоторые проблемы с поддержанием нетривиальных ограничений на пользователя, который может не осознавать ни потенциальных ловушек, ни возможных решений. Плюс к этому переводу - лучшая производительность.

Терминология

Изоляция моментального снимка называется "сериализуемым" режимом в Oracle[5][6][7] и PostgreSQL версии до 9.1,[8][9][10] что может вызвать путаницу с "реальным сериализуемость "режим. Существуют аргументы как за, так и против этого решения; очевидно, что пользователи должны знать об этом различии, чтобы избежать возможного нежелательного аномального поведения в логике их системы баз данных.

История

Изоляция снимков возникла в результате работы над мультиверсионный контроль параллелизма базы данных, в которых одновременно поддерживается несколько версий базы данных, что позволяет читателям работать без столкновения с писателями. Такая система позволяет естественным образом определить и реализовать такой уровень изоляции.[3] InterBase, позже принадлежащий Borland, было признано, что он обеспечивает SI, а не полную сериализуемость в версии 4,[3] и, вероятно, допускал аномалии перекоса записи с момента его первого выпуска в 1985 году.[11]

К сожалению, ANSI SQL-92 стандарт был написан с замок на основе базы данных и, следовательно, довольно расплывчатый в применении к системам MVCC. Беренсон и другие. написал статью в 1995 году[3] критикуя стандарт SQL, и процитировал изоляцию моментальных снимков в качестве примера уровня изоляции, который не проявлял стандартных аномалий, описанных в стандарте ANSI SQL-92, но все же имел аномальное поведение по сравнению с сериализуемый транзакции.

В 2008 году Кэхилл и другие. показали, что аномалии перекоса записи можно предотвратить путем обнаружения и прерывания «опасных» троек одновременных транзакций.[12] Эта реализация сериализуемости хорошо подходит для мультиверсионный контроль параллелизма баз данных и был принят в PostgreSQL 9.1,[9][10][13] где это называется «изоляция сериализуемых моментальных снимков», сокращенно SSI. При постоянном использовании это устраняет необходимость в вышеупомянутых обходных решениях. Обратной стороной изоляции моментальных снимков является увеличение количества прерванных транзакций. Это может работать лучше или хуже, чем изоляция моментальных снимков с помощью описанных выше обходных путей, в зависимости от рабочей нагрузки.

В 2011 году Хименес-Перис и др. подал патент [14] где было показано, как можно масштабировать до многих миллионов транзакций обновления в секунду с помощью нового метода достижения изоляции моментальных снимков распределенным образом. Этот метод основан на наблюдении, что становится возможным совершать транзакции полностью параллельно без какой-либо координации и, следовательно, устраняя узкое место традиционных методов обработки транзакций. В этом методе используется секвенсор фиксации, который генерирует временные метки фиксации, и сервер моментальных снимков, который продвигает текущий моментальный снимок вперед по мере заполнения пробелов в порядке сериализации. Этот метод является основой базы данных LeanXcale.[15] Первое внедрение этого метода было осуществлено в 2010 году в рамках европейского проекта CumuloNimbo.[16]

Рекомендации

  1. ^ "Справочное руководство MySQL :: MySQL 8.0 :: 15.5.2.3 Согласованное неблокирующее чтение". dev.mysql.com. Получено 2018-08-27.
  2. ^ Управление многоверсионным параллелизмом в MongoDB, Технический директор MongoDB: как наш новый механизм хранения WiredTiger получит свои преимущества
  3. ^ а б c d Беренсон, Хэл; Бернштейн, Фил; Грей, Джим; Мелтон, Джим; О'Нил, Элизабет; О'Нил, Патрик (1995), «Критика уровней изоляции ANSI SQL», Материалы международной конференции ACM SIGMOD 1995 года по управлению данными, стр. 1–10, arXiv:cs / 0701157, Дои:10.1145/223784.223785, ISBN  978-0897917315
  4. ^ Фекете, Алан; Лиарокапис, Димитриос; О'Нил, Элизабет; О'Нил, Патрик; Шаша, Деннис (2005), "Создание сериализуемой изоляции моментальных снимков", Транзакции ACM в системах баз данных, 30 (2): 492–528, CiteSeerX  10.1.1.503.3169, Дои:10.1145/1071610.1071615, ISSN  0362-5915
  5. ^ Oracle Database Concepts 10g Release 1 (10.1) Глава 13: Параллелизм и согласованность данных - уровни изоляции Oracle
  6. ^ Спросите Тома: об уровнях изоляции транзакций
  7. ^ Спросите Тома: "Сериализуемая транзакция"
  8. ^ Документация PostgreSQL 9.0: 13.2.2.1. Сериализуемая изоляция против истинной сериализуемости
  9. ^ а б Пресс-релиз PostgreSQL 9.1
  10. ^ а б PostgreSQL 9.1.14 Документация: 13.2.3. Сериализуемый уровень изоляции
  11. ^ Stuntz, Крейг. «Управление многоверсионным параллелизмом до InterBase». Получено 30 октября, 2014.
  12. ^ Майкл Дж. Кэхилл, Уве Рем, Алан Д. Фекете (2008) «Сериализуемая изоляция для баз данных моментальных снимков», Материалы международной конференции ACM SIGMOD 2008 г. по управлению данными, стр. 729–738, ISBN  978-1-60558-102-6 (Премия SIGMOD 2008 за лучшую работу)
  13. ^ Порты, Дэн Р. К .; Гриттнер, Кевин (2012). «Сериализуемая изоляция моментальных снимков в PostgreSQL» (PDF). Труды эндаумента VLDB. 5 (12): 1850–1861. arXiv:1208.4179. CiteSeerX  10.1.1.294.3803. Дои:10.14778/2367502.2367523.
  14. ^ [1], ХИМЕНЕС-ПЕРИС, Рикардо и Марта ПАТИНЬО-МАРТИНЕС, «Система и метод для высокомасштабируемой децентрализованной обработки транзакций с низким уровнем конкуренции» 
  15. ^ "LeanXcale". Leanxcale.com. Получено 2017-08-20.
  16. ^ Хименес-Перис, Рикардо; Патиньо-Мартинес, Марта; Магутис, Костас; Билас, Ангелос; Брондино, Иван (апрель 2012). «CumuloNimbo: высокомасштабируемая платформа обработки транзакций как услуга». Новости Ercim.

дальнейшее чтение