Проблема суммы подмножества - Subset sum problem

В проблема суммы подмножества это проблема решения в Информатика. Есть несколько эквивалентных формулировок задачи. Один из них: учитывая мультимножество целых чисел, существует ли непустое подмножество, сумма которого равна нулю? Например, учитывая набор ${displaystyle {-7, -3, -2,9000,5,8}}$ , ответ да потому что подмножество ${displaystyle {-3, -2,5}}$ суммы к нулю. Другая эквивалентная формулировка: дано мультимножество положительный целые числа и целевая сумма Т, сумма любого подмножества чисел в точности Т?^[1] Сумму подмножества также можно рассматривать как проблема оптимизации: найти подмножество, сумма которого максимально приближена к Т.

Сумма подмножества связана с несколькими другими проблемами:

В проблема раздела является частным случаем подмножества-суммы, в котором целевая сумма Т составляет ровно половину суммы всех входных чисел (т. е. ${displaystyle T = {frac {1} {2}} (a_ {1} + точки + a_ {n})}$ ).
В проблема с рюкзаком является обобщением subset-sum.^[2]

Проблема суммы подмножества НП-полный, но есть несколько алгоритмов, которые на практике могут решить эту проблему достаточно быстро.

Сложность

В сложность задачи суммы подмножества зависит от двух параметров: п - количество вводимых целых чисел, и L - точность задачи, выраженная как количество двоичных разрядов, необходимых для постановки задачи.

Если п (количество целых чисел) - небольшое фиксированное число, тогда исчерпывающий поиск для решения практично.
Если L (количество двоичных цифр) - небольшое фиксированное число, тогда есть динамическое программирование алгоритмы, которые могут ее точно решить.

Проблема становится сложной, когда оба п и L большие. Сложность наиболее известных алгоритмов составляет экспоненциальный в меньшем из двух параметров п и L.

Экспоненциальные временные алгоритмы

Есть несколько способов решить сумму подмножества по экспоненте во времени в п.^[3]

Включение-исключение

Большинство наивный алгоритм будет проходить через все подмножества п числа и для каждого из них проверьте, соответствует ли подмножество правильному числу. Время работы в порядке ${displaystyle O (2 ^ {n} cdot n)}$ , поскольку есть ${displaystyle 2 ^ {n}}$ подмножества и, чтобы проверить каждое подмножество, нам нужно суммировать не более п элементы.

Алгоритм может быть реализован поиск в глубину двоичного дерева: каждому уровню в дереве соответствует входной номер; левая ветвь соответствует исключению числа из набора, а правая ветвь соответствует включению числа (отсюда и название «Включение-исключение»). Требуемая память ${displaystyle O (n)}$ . Время выполнения можно улучшить с помощью нескольких эвристик:^[3]

Обработайте входные числа в порядке убывания.
Если целые числа, включенные в данный узел, превышают сумму лучшего подмножества, найденного на данный момент, узел удаляется.
Если целые числа, включенные в данный узел, плюс все оставшиеся целые числа меньше суммы лучшего подмножества, найденного на данный момент, узел удаляется.

Горовиц и Санхи

Горовиц и Сахни^[4] опубликовал более быстрый алгоритм экспоненциального времени, который работает во времени ${displaystyle O (2 ^ {n / 2} cdot (n / 2))}$ , но требует гораздо больше места - ${displaystyle O (2 ^ {n / 2})}$ . Алгоритм произвольно разбивает п элементы в два набора ${displaystyle n / 2}$ каждый. Для каждого из этих двух наборов хранится список сумм всех ${displaystyle 2 ^ {n / 2}}$ возможные подмножества его элементов. Затем каждый из этих двух списков сортируется. Использование стандартного алгоритма сортировки сравнения для этого шага потребует времени. ${displaystyle O (2 ^ {n / 2} n)}$ . Однако, учитывая отсортированный список сумм для ${displaystyle k}$ элементов, список может быть расширен до двух отсортированных списков с введением ( ${displaystyle k + 1}$ ) th элемент, и эти два отсортированных списка могут быть объединены во времени ${displaystyle O (2 ^ {k})}$ . Таким образом, каждый список может быть сформирован в отсортированном виде по времени. ${displaystyle O (2 ^ {n / 2})}$ . Учитывая два отсортированных списка, алгоритм может проверить, суммируются ли элемент первого массива и элемент второго массива до Т во время ${displaystyle O (2 ^ {n / 2})}$ . Для этого алгоритм проходит через первый массив в порядке убывания (начиная с самого большого элемента) и второй массив в порядке увеличения (начиная с наименьшего элемента). Всякий раз, когда сумма текущего элемента в первом массиве и текущего элемента во втором массиве больше, чем Т, алгоритм переходит к следующему элементу в первом массиве. Если меньше чем Т, алгоритм переходит к следующему элементу во втором массиве. Если два элемента, сумма которых равна Т найдены, он останавливается.

Шреппель и Шамир

Schroeppel и Шамир^[5] представил алгоритм, основанный на Горовитце и Санхи, который требует аналогичного времени выполнения - ${displaystyle O (2 ^ {n / 2} cdot (n / 4))}$ , гораздо меньше места - ${displaystyle O (2 ^ {n / 4})}$ . Вместо того, чтобы создавать все подмножества п/ 2 элемента заранее, они делят элементы на 4 набора п/ 4 элемента каждый и генерируют подмножества п/ 2 элемента динамически с использованием мин куча.

Из-за нехватки места алгоритм HS применим примерно для 50 целых чисел, а алгоритм SS применим до 100 целых чисел.^[3]

Хоугрейв-Грэм и Жу

Хаугрейв-Грэм и Жу^[6] представил вероятностный алгоритм который работает быстрее всех предыдущих - по времени ${displaystyle O (2 ^ {n / 3})}$ . Он решает только проблему решения, не может доказать, что для данной суммы нет решения, и не возвращает сумму подмножества, ближайшую к Т.

Решение для динамического программирования с псевдополиномиальным временем

Проблему можно решить в псевдополиномиальное время с помощью динамическое программирование. Предположим, что последовательность

{displaystyle x_ {1}, ldots, x_ {N}}

отсортированы в порядке возрастания, и мы хотим определить, существует ли непустое подмножество, сумма которого равна нулю. Определите булевозначную функцию ${displaystyle Q (i, s)}$ быть ценностью ( ${displaystyle true}$ или же ${displaystyle false}$ ) из

"есть непустое подмножество

{displaystyle x_ {1}, ldots, x_ {i}}

что в сумме

{displaystyle s}

."

Таким образом, решение проблемы «Для данного набора целых чисел существует непустое подмножество, сумма которого равна нулю?» это ценность ${displaystyle Q (N, 0)}$ .

Позволять ${displaystyle A}$ быть суммой отрицательных значений и ${displaystyle B}$ сумма положительных значений. Четко, ${displaystyle Q (i, s) = false}$ , если ${displaystyle s$ или же ${displaystyle s> B}$ . Таким образом, эти значения не нужно хранить или вычислять.

Создайте массив для хранения значений ${displaystyle Q (i, s)}$ за ${displaystyle 1leq ileq N}$ и ${displaystyle Aleq sleq B}$ .

Теперь массив можно заполнить простой рекурсией. Первоначально для ${displaystyle Aleq sleq B}$ , набор

{displaystyle Q (1, s): = (x_ {1} == s)}

куда ${displaystyle ==}$ это логическая функция, которая возвращает истину, если ${displaystyle x_ {1}}$ равно ${displaystyle s}$ , иначе - ложь.

Тогда для ${displaystyle i = 2, ldots, N}$ , набор

{displaystyle Q (i, s): = Q (i-1, s)}

или же

{displaystyle (x_ {i} == s)}

или же

{displaystyle Q (i-1, s-x_ {i}), forAleq sleq B}

.

Для каждого присвоения значения ${displaystyle Q}$ справа уже известны, либо потому, что они были сохранены в таблице для предыдущего значения ${displaystyle i}$ или потому что ${displaystyle Q (i-1, s-x_ {i}) = false}$ если ${displaystyle s-x_ {i}$ или же ${displaystyle s-x_ {i}> B}$ . Следовательно, общее количество арифметических операций равно ${displaystyle O (N (B-A))}$ . Например, если все значения равны ${displaystyle O (N ^ {k})}$ для некоторых ${displaystyle k}$ , то необходимое время ${displaystyle O (N ^ {k + 2})}$ .

Этот алгоритм легко изменить, чтобы вернуть подмножество с суммой 0, если оно есть.

Решение для динамического программирования имеет время выполнения ${displaystyle O (sN)}$ куда ${displaystyle s}$ это сумма, которую мы хотим найти в наборе ${displaystyle N}$ числа. Это решение не считается полиномиальным временем в теории сложности, потому что ${displaystyle B-A}$ не полиномиален от размер проблемы, которая представляет собой количество битов, используемых для ее представления. Этот алгоритм полиномиален от значений ${displaystyle A}$ и ${displaystyle B}$ , которые являются экспоненциальными по количеству битов.

В случае, если каждый ${displaystyle x_ {i}}$ положительна и ограничена фиксированной константой ${displaystyle C}$ , Писингер нашел алгоритм линейного времени, имеющий временную сложность ${displaystyle O (NC)}$ (обратите внимание, что это для версии задачи, где целевая сумма не обязательно равна нулю, иначе проблема была бы тривиальной).^[7]^[8] В 2015 году Койлиарис и Сюй обнаружили детерминированный ${displaystyle {ilde {O}} (s {sqrt {N}})}$ алгоритм для задачи суммы подмножеств, где ${displaystyle s}$ это сумма, которую нам нужно найти.^[9] В 2017 году Брингманн обнаружил рандомизированный ${displaystyle {ilde {O}} (s)}$ временной алгоритм ^[10].

Приближенный алгоритм с полиномиальным временем

An приблизительный версия суммы подмножества будет: с учетом набора ${displaystyle N}$ числа ${displaystyle x_ {i}, ldots, x_ {N}}$ и ряд ${displaystyle s}$ , выход:

Да, если есть подмножество, которое в сумме составляет до ${displaystyle s}$ .
Нет, если нет подмножества суммирования до числа между ${displaystyle (1-c) s}$ и ${displaystyle s}$ для небольшого ${displaystyle c> 0}$ .
Любой ответ, если есть подмножество суммирования до числа между ${displaystyle (1-c) s}$ и ${displaystyle s}$ но нет подмножества, суммирующего до ${displaystyle s}$ .

Если все числа неотрицательны, приблизительная сумма подмножества разрешима за полиномиальное время от ${displaystyle N}$ и ${displaystyle 1 / c}$ .

Решение для суммы подмножества также обеспечивает решение исходной проблемы суммы подмножества в случае, когда числа малы (опять же, для неотрицательных чисел). Если любую сумму чисел можно указать не более чем ${displaystyle P}$ бит, затем решая задачу примерно с ${displaystyle c = 2 ^ {- P}}$ эквивалентно ее точному решению. Тогда алгоритм полиномиального времени для приближенной суммы подмножества становится точным алгоритмом с полиномиальным временем работы от ${displaystyle N}$ и ${displaystyle 2 ^ {P}}$ (т.е. экспоненциальная по ${displaystyle P}$ ).

Алгоритм решения задачи приблизительной суммы подмножеств следующий:

инициализировать список S содержать один элемент 0.для каждого я от 1 до N делать    позволять Т быть списком, состоящим из Икс_я + у, для всех у в S    позволять U быть союзом Т и S    Сортировать U    делать S пусто пусть у быть самым маленьким элементом U     Добавить у к S    для каждого элемент z из U в порядке возрастания делать        // Обрезать список, удалив близкие друг к другу числа // и выбросить элементы больше, чем s.        если у + cs/N < z ≤ s тогда            у = z            Добавить z к Sесли S содержит число между (1 - c)s и s тогда    возвращаться даеще    возвращаться нет

Алгоритм является полиномиальным временем, потому что списки ${displaystyle S}$ , ${displaystyle T}$ и ${displaystyle U}$ всегда оставаться полиномиального размера в ${displaystyle N}$ и ${displaystyle 1 / c}$ и, пока они имеют полиномиальный размер, все операции над ними могут выполняться за полиномиальное время. Размер списков остается полиномиальным за счет шага обрезки, на котором мы включаем только число ${displaystyle z}$ в ${displaystyle S}$ если он больше предыдущего на ${displaystyle cs / N}$ и не больше чем ${displaystyle s}$ .

Этот шаг гарантирует, что каждый элемент в ${displaystyle S}$ меньше следующего как минимум на ${displaystyle cs / N}$ и не содержат элементов больше, чем ${displaystyle s}$ . Любой список с этим свойством состоит не более чем из ${displaystyle N / c}$ элементы.

Алгоритм правильный, потому что каждый шаг вносит аддитивную ошибку не более ${displaystyle cs / N}$ и ${displaystyle N}$ шаги вместе приводят к ошибке не более ${displaystyle cs}$ .

Смотрите также

дальнейшее чтение

Кормен, Томас Х.; Лейзерсон, Чарльз Э.; Ривест, Рональд Л.; Штейн, Клиффорд (2001) [1990]. «35.5: проблема подмножества суммы». Введение в алгоритмы (2-е изд.). MIT Press и McGraw-Hill. ISBN 0-262-03293-7.
Майкл Р. Гарей и Дэвид С. Джонсон (1979). Компьютеры и непреодолимость: руководство по теории NP-полноты. W.H. Фримен. ISBN 0-7167-1045-5. A3.2: SP13, стр. 223.

[kleinberg2006p491-1] Клейнберг, Джон; Тардос, Ева (2006). Разработка алгоритма (2-е изд.). п.491. ISBN 0-321-37291-3.

[MartelloToth-2] Мартелло, Сильвано; Тот, Паоло (1990). «Проблема 4-х подмножеств». Задачи о ранце: алгоритмы и компьютерные интерпретации. Wiley-Interscience. стр.105–136. ISBN 0-471-92420-2. МИСТЕР 1086874.CS1 maint: ref = harv (связь)

[:0-3] а ^б ^c Ричард Э. Корф, Итан Л. Шрайбер и Майкл Д. Моффитт (2014). «Оптимальное последовательное многостороннее разбиение номеров» (PDF).CS1 maint: несколько имен: список авторов (связь)

[4] Горовиц, Эллис; Сахни, Сартадж (1974), «Вычислительные перегородки с приложениями к задаче о ранце» (PDF), Журнал Ассоциации вычислительной техники, 21 (2): 277–292, Дои:10.1145/321812.321823, HDL:1813/5989, МИСТЕР 0354006

[5] Schroeppel, Ричард; Шамир, Ади (1981-08-01). "Алгоритм A $ T = O (2 ^ {n / 2}) $, $ S = O (2 ^ {n / 4}) $ для некоторых NP-полных задач". SIAM Журнал по вычислениям. 10 (3): 456–464. Дои:10.1137/0210033. ISSN 0097-5397.

[6] Хаугрейв-Грэм, Ник; Жу, Антуан (2010). Гилберт, Анри (ред.). «Новые универсальные алгоритмы для тяжелых ранцев». Достижения в криптологии - EUROCRYPT 2010. Конспект лекций по информатике. Берлин, Гейдельберг: Springer: 235–256. Дои:10.1007/978-3-642-13190-5_12. ISBN 978-3-642-13190-5.

[7] ttp://hjemmesider.diku.dk/~pisinger/codes.html

[Pisinger09-8] Писингер Д. (1999). "Линейные временные алгоритмы для задач о ранце с ограниченным весом". Журнал алгоритмов, Volume 33, Number 1, October 1999, pp. 1–14.

[9] Койлиарис, Константинос; Сюй, Чао (2015-07-08). «Более быстрый алгоритм псевдополиномиального времени для суммы подмножества». arXiv:1507.02318 [cs.DS ].

[10] Брингманн К. Алгоритм псевдополиномиального времени, близкий к линейному, для суммы подмножества [C] // Материалы двадцать восьмого ежегодного симпозиума ACM-SIAM по дискретным алгоритмам. Общество промышленной и прикладной математики, 2017: 1073-1084

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]