Алгоритм внешней памяти - External memory algorithm

В вычисление, алгоритмы внешней памяти или же алгоритмы вне ядра находятся алгоритмы которые предназначены для обработки данных, которые слишком велики, чтобы поместиться в компьютер основная память однажды. Такие алгоритмы должны быть оптимизированы для эффективного извлечения и доступа к данным, хранящимся в медленной большой памяти (вспомогательная память ) Такие как жесткие диски или же ленточные накопители, или когда память занята компьютерная сеть.[1][2] Алгоритмы внешней памяти анализируются в модель внешней памяти.

Модель

Кэш слева содержит блоки размера каждый, в общей сложности M объекты. Объем внешней памяти справа неограничен.

Алгоритмы внешней памяти анализируются в идеализированном виде. модель вычисления называется моделью внешней памяти (или Модель ввода / вывода, или же модель доступа к диску). Модель внешней памяти - это абстрактная машина аналогично RAM модель машины, но с тайник в добавление к основная память. Модель учитывает тот факт, что операции чтения и записи выполняются намного быстрее в тайник чем в основная память, и это чтение длинные смежные блоки быстрее, чем случайное чтение с использованием головка для чтения и записи диска. В Продолжительность из алгоритм в модели внешней памяти определяется количеством требуемых операций чтения и записи в память.[3] Модель была представлена ​​Алоком Аггарвалом и Джеффри Виттер в 1988 г.[4] Модель внешней памяти связана с модель без кеширования, но алгоритмы в модели внешней памяти могут знать как размер блока и тайник размер. По этой причине модель иногда называют модель с учетом кеширования.[5]

Модель состоит из процессор с внутренней памятью или тайник размера M, подключенный к неограниченный внешняя память. Как внутренняя, так и внешняя память делятся на блоки размера B. Одна операция ввода / вывода или передачи в память состоит из перемещения блока B смежные элементы из внешней памяти во внутреннюю, а Продолжительность алгоритма определяется количеством этих операций ввода / вывода.[4]

Алгоритмы

Алгоритмы в модели внешней памяти используют тот факт, что при извлечении одного объекта из внешней памяти извлекается весь блок размером . Это свойство иногда называют местностью.

Поиск элемента среди объектов возможно во внешней модели памяти с помощью B-дерево с фактором ветвления . Используя B-дерево, поиск, вставка и удаление могут быть выполнены в время в Обозначение Big O ). Информация теоретически, это минимум Продолжительность возможно для этих операций, поэтому использование B-дерева асимптотически оптимальный.[4]

Внешняя сортировка выполняется сортировка во внешней памяти. Внешнюю сортировку можно выполнить с помощью сортировки по распределению, которая похожа на быстрая сортировка, или через сортировка слиянием. Оба варианта достигают асимптотически оптимальный время выполнения Сортировать N объекты. Эта оценка также применима к быстрое преобразование Фурье в модели внешней памяти.[2]

Проблема перестановки состоит в том, чтобы переставить элементы в конкретные перестановка. Это можно сделать либо путем сортировки, для чего требуется указанная выше среда выполнения сортировки, либо путем вставки каждого элемента по порядку и игнорирования преимущества локальности. Таким образом, перестановка может быть выполнена в время.

Приложения

Модель внешней памяти фиксирует иерархия памяти, который не моделируется в других распространенных моделях, используемых при анализе структуры данных, такой как машина с произвольным доступом, и полезно для доказательства нижняя граница для структур данных. Модель также полезна для анализа алгоритмов, которые работают с наборами данных, слишком большими для размещения во внутренней памяти.[4]

Типичный пример: географические информационные системы, особенно цифровые модели рельефа, где полный набор данных легко превышает несколько гигабайты или даже терабайты данных.

Эта методология выходит за рамки ЦП общего назначения а также включает GPU вычислительные, а также классические цифровая обработка сигналов. В универсальные вычисления на графических процессорах (GPGPU), мощные графические карты (GPU) с небольшим объемом памяти (по сравнению с более привычной системной памятью, которую чаще всего называют просто баран ) используются при относительно медленной передаче памяти от процессора к графическому процессору (по сравнению с пропускной способностью вычислений).

История

Термин «вне ядра» в качестве прилагательного был впервые использован в 1962 году в связи с устройства что кроме основная память из IBM 360.[6] Раннее использование термина «вне ядра» в отношении алгоритмы появляется в 1971 году.[7]

Смотрите также

Рекомендации

  1. ^ Виттер, Дж. С. (2001). «Алгоритмы внешней памяти и структуры данных: работа с МАССИВНЫМИ ДАННЫМИ». Опросы ACM Computing. 33 (2): 209–271. CiteSeerX  10.1.1.42.7064. Дои:10.1145/384192.384193.
  2. ^ а б Виттер, Дж. С. (2008). Алгоритмы и структуры данных для внешней памяти (PDF). Основы и тенденции теоретической информатики. Серия «Основы и тенденции теоретической информатики». 2. Ганновер, Массачусетс: Теперь издатели. С. 305–474. CiteSeerX  10.1.1.140.3731. Дои:10.1561/0400000014. ISBN  978-1-60198-106-6.
  3. ^ Чжан, Дунхуэй; Цотрас, Василис Дж .; Левиальди, Стефано; Гринштейн, Жорж; Берри, Дэймон Эндрю; Гуэ-Брюне, Валери; Кош, Харальд; Деллер, Марио; Деллер, Марио; Кош, Харальд; Майер, Пол; Бхаттачарья, Арнаб; Лйоса, Вебьорн; Нак, Фрэнк; Бартолини, Илария; Гуэ-Брюне, Валери; Мэй, Дао; Руи, Йонг; Круциану, Мишель; Ши, Фрэнк Ю.; Фань, Вэньфэй; Ульман-Каллере, Молли; Кларк, Юджин; Аронсон, Самуэль; Меллин, Джонас; Берндтссон, Микаэль; Grahne, Gösta; Бертосси, Леопольдо; Дун, Гочжу; и другие. (2009). «Модель ввода-вывода вычислений». Энциклопедия систем баз данных. Springer Science + Business Media. С. 1333–1334. Дои:10.1007/978-0-387-39940-9_752. ISBN  978-0-387-35544-3.
  4. ^ а б c d Аггарвал, Алок; Виттер, Джеффри (1988). «Сложность ввода / вывода сортировки и связанных с ней проблем». Коммуникации ACM. 31 (9): 1116–1127. Дои:10.1145/48529.48535.
  5. ^ Демейн, Эрик (2002). Не обращающие внимания на кеш алгоритмы и структуры данных (PDF). Конспект лекций Летней школы EEF по массивным массивам данных. Орхус: БРИКС.
  6. ^ НАСА СП. НАСА. 1962. с. 276.
  7. ^ Компьютеры в кризисе. ACM. 1971. с. 296.

внешняя ссылка