Выбор алгоритма - Algorithm selection

Выбор алгоритма (иногда также называют выбор алгоритма для каждого экземпляра или выбор автономного алгоритма) является мета-алгоритмическая техника выбирать алгоритм из портфолио для каждого экземпляра. Это мотивировано наблюдением, что во многих практических задачах алгоритмы имеют разную производительность. То есть, в то время как один алгоритм работает хорошо в некоторых случаях, он плохо работает в других, и наоборот, для другого алгоритма. Если мы сможем определить, когда использовать какой алгоритм, мы сможем получить лучшее из обоих миров и улучшить общую производительность. На это и направлен выбор алгоритма. Единственным предварительным условием для применения методов выбора алгоритмов является наличие (или возможность создания) набора дополнительных алгоритмов.

Определение

Учитывая портфолио ${ displaystyle { mathcal {P}}}$ алгоритмов ${ displaystyle { mathcal {A}} in { mathcal {P}}}$ , набор экземпляров ${ displaystyle i in { mathcal {I}}}$ и метрика стоимости ${ displaystyle m: { mathcal {P}} times { mathcal {I}} to mathbb {R}}$ , задача выбора алгоритма состоит в нахождении отображения ${ displaystyle s: { mathcal {I}} to { mathcal {P}}}$ из экземпляров ${ displaystyle { mathcal {I}}}$ к алгоритмам ${ displaystyle { mathcal {P}}}$ так что стоимость ${ Displaystyle сумма _ {я in { mathcal {I}}} м (s (я), я)}$ во всех экземплярах оптимизирован.^[1]^[2]

Примеры

Проблема логической выполнимости (и другие сложные комбинаторные проблемы)

Хорошо известным приложением выбора алгоритма является Проблема логической выполнимости. Здесь портфель алгоритмов представляет собой набор (дополнительных) SAT решатели, экземпляры представляют собой логические формулы, метрикой стоимости является, например, среднее время выполнения или количество нерешенных экземпляров. Итак, цель состоит в том, чтобы выбрать хорошо работающий решатель SAT для каждого отдельного экземпляра. Таким же образом выбор алгоритма может быть применен ко многим другим ${ displaystyle { mathcal {NP}}}$ -сложные проблемы (например, смешанное целочисленное программирование, CSP, Планирование ИИ, TSP, MAXSAT, QBF и программирование набора ответов ). Системы SAT победили в соревнованиях: SATzilla,^[3] 3S^[4] и CSHC^[5]

Машинное обучение

В машинное обучение, выбор алгоритма более известен как мета-обучение. Портфель алгоритмов состоит из алгоритмов машинного обучения (например, случайный лес, SVM, DNN), экземпляры - это наборы данных, а метрика стоимости - это, например, коэффициент ошибок. Итак, цель состоит в том, чтобы предсказать, какой алгоритм машинного обучения будет иметь небольшую ошибку для каждого набора данных.

Особенности экземпляра

Проблема выбора алгоритма в основном решается с помощью методов машинного обучения. Представляя экземпляры проблемы числовыми признаками ${ displaystyle f}$ , выбор алгоритма можно рассматривать как мультиклассовая классификация проблема, изучая отображение ${ displaystyle f_ {i} mapsto { mathcal {A}}}$ для данного случая ${ displaystyle i}$ .

Функции экземпляра - это числовые представления экземпляров. Например, мы можем подсчитать количество переменных, предложений, среднюю длину предложения для булевых формул,^[6] или количество образцов, функций, баланс классов для наборов данных ML, чтобы получить представление об их характеристиках.

Статические и измерительные функции

Мы различаем два типа функций:

Статические характеристики - это в большинстве случаев некоторые подсчеты и статистика (например, отношение предложений к переменным в SAT). Эти функции варьируются от очень дешевых функций (например, количество переменных) до очень сложных функций (например, статистика о графах переменных-предложений).
Функции зондирования (иногда также называемые ориентирами) вычисляются путем выполнения некоторого анализа поведения алгоритма на экземпляре (например, точности дешевого алгоритма дерева решений на наборе данных машинного обучения или запуска в течение короткого времени решателя стохастического локального поиска на Булева формула). Эти функции часто стоят больше, чем простые статические функции.

Стоимость функции

В зависимости от используемой метрики производительности ${ displaystyle m}$ , вычисление функций может быть связано с затратами. Например, если мы используем время выполнения в качестве метрики производительности, мы включаем время, затрачиваемое на вычисление функций нашего экземпляра, в производительность системы выбора алгоритма. САТ-решение является конкретным примером, когда такая функция стоит нельзя пренебрегать, поскольку особенности экземпляра для CNF формулы могут быть либо очень дешевыми (например, получение количества переменных может быть выполнено за постоянное время для CNF в формате DIMAC), либо очень дорогими (например, графические функции, которые могут стоить десятки или сотни секунд).

В таких сценариях на практике важно учитывать накладные расходы на вычисление признаков; в противном случае создается ложное впечатление о производительности подхода к выбору алгоритма. Например, если решение, какой алгоритм выбрать, может быть принято с идеальной точностью, но характеристиками являются время работы алгоритмов портфеля, нет никакой пользы от портфельного подхода. Это было бы неочевидно, если бы не указывать стоимость функций.

Подходы

Регрессионный подход

Один из первых успешных подходов к выбору алгоритма предсказал производительность каждого алгоритма. ${ displaystyle { hat {m}} _ { mathcal {A}}: { mathcal {I}} to mathbb {R}}$ и выбрали алгоритм с наилучшей прогнозируемой производительностью ${ displaystyle arg min _ {{ mathcal {A}} in { mathcal {P}}} { hat {m}} _ { mathcal {A}} (я)}$ например ${ displaystyle i}$ .^[3]

Кластерный подход

Распространенное предположение состоит в том, что данный набор экземпляров ${ displaystyle { mathcal {I}}}$ могут быть сгруппированы в однородные подмножества, и для каждого из этих подмножеств существует один хорошо работающий алгоритм для всех имеющихся в нем экземпляров. Таким образом, обучение состоит из определения однородных кластеров с помощью подхода неконтролируемой кластеризации и связывания алгоритма с каждым кластером. новый экземпляр назначается кластеру и выбирается связанный алгоритм.^[7]

Более современный подход требует затрат иерархическая кластеризация^[5] использование обучения с учителем для определения однородных подмножеств экземпляров.

Парный подход к классификации с учетом затрат

Распространенный подход для мультиклассовой классификации состоит в том, чтобы изучить попарные модели между каждой парой классов (здесь алгоритмы) и выбрать класс, который наиболее часто предсказывался попарными моделями. Мы можем взвесить экземпляры задачи попарного прогнозирования по разнице в производительности Это обусловлено тем фактом, что мы больше всего заботимся о получении правильных прогнозов с большой разницей, но штраф за неправильный прогноз невелик, если почти нет разницы в производительности. ${ displaystyle i}$ для обучения модели классификации ${ displaystyle { mathcal {A}} _ {1}}$ против ${ displaystyle { mathcal {A}} _ {2}}$ связано со стоимостью ${ displaystyle | m ({ mathcal {A}} _ {1}, i) -m ({ mathcal {A}} _ {2}, i) |}$ .^[8]

Требования

Кластеризация SAT-решателей из сценария SAT12-INDU ASlib согласно коэффициенту корреляции Спирмена.

Значения Шепли для дополнительного анализа по сценарию SAT12-INDU ASlib^[9]

Задача выбора алгоритма может быть эффективно применена при следующих предположениях:

Портфолио ${ displaystyle { mathcal {P}}}$ алгоритмов является комплементарным по отношению к набору экземпляров ${ displaystyle { mathcal {I}}}$ , т.е. не существует единого алгоритма ${ displaystyle { mathcal {A}} in { mathcal {P}}}$ который доминирует над производительностью всех других алгоритмов над ${ displaystyle { mathcal {I}}}$ (примеры дополнительного анализа см. на рисунках справа).
В некоторых приложениях вычисление характеристик экземпляра связано с затратами. Например, если метрикой стоимости является время выполнения, мы также должны учитывать время для вычисления функций экземпляра. В таких случаях затраты на вычисление функций не должны превышать прирост производительности за счет выбора алгоритма.

Домены приложений

Выбор алгоритма не ограничивается отдельными доменами, но может применяться к любому типу алгоритма, если вышеуказанные требования удовлетворены. Домены приложений включают:

сложные комбинаторные задачи:^[10] СИДЕЛ, Смешанное целочисленное программирование, CSP, AI планирование, TSP, MAXSAT, QBF и Программирование набора ответов
комбинаторные аукционы
в машинном обучении проблема известна как мета-обучение
разработка программного обеспечения
оптимизация черного ящика
мультиагентные системы
численная оптимизация
линейная алгебра, дифференциальные уравнения
эволюционные алгоритмы
проблема с маршрутизацией автомобиля
энергосистемы

Для получения обширного списка литературы о выборе алгоритма, мы ссылаемся на обзор литературы.

Варианты выбора алгоритма

Выбор онлайн

Под онлайн-выбором алгоритма понимается переключение между различными алгоритмами в процессе решения. Это полезно как гиперэвристический. Напротив, при выборе автономного алгоритма алгоритм для данного экземпляра выбирается только один раз и до процесса решения.

Расчет расписаний

Расширением выбора алгоритма является проблема планирования алгоритма для каждого экземпляра, в которой мы не выбираем только один решатель, но мы выбираем временной бюджет для каждого алгоритма на основе каждого экземпляра. Такой подход улучшает производительность систем выбора, в частности, если особенности экземпляра не очень информативны и вероятен неправильный выбор одного решателя.^[11]

Подбор параллельных портфелей

Учитывая возрастающую важность параллельных вычислений, расширением выбора алгоритмов для параллельных вычислений является выбор параллельного портфеля, в котором мы выбираем подмножество алгоритмов для одновременного запуска в параллельном портфеле.^[12]

внешние ссылки

использованная литература

^ Райс, Джон Р. (1976). «Проблема выбора алгоритма». Достижения в области компьютеров. 15. С. 65–118. Дои:10.1016 / S0065-2458 (08) 60520-3. ISBN 9780120121151.
^ Бишл, Бернд; Кершке, Паскаль; Коттхофф, Ларс; Линдауэр, Мариус; Малицкий, Юрий; Фрешетт, Александр; Хус, Хольгер; Хаттер, Фрэнк; Лейтон-Браун, Кевин; Тирни, Кевин; Ваншорен, Хоакин (2016). «ASlib: эталонная библиотека для выбора алгоритма». Искусственный интеллект. 237: 41–58. arXiv:1506.02465. Дои:10.1016 / j.artint.2016.04.003.
^ ^а ^б Л. Сюй; Ф. Хаттер; Х. Хус и К. Лейтон-Браун (2008). «SATzilla: выбор алгоритма на основе портфеля для SAT». Журнал исследований искусственного интеллекта. 32: 565–606. arXiv:1111.2249. Дои:10.1613 / jair.2490.
^ С. Кадыоглу; Ю. Малицкий; А. Сабхарвал; Х. Самуловиц; М. Селлманн (2011). «Выбор алгоритма и планирование». В Ли, Дж. (Ред.). Принципы и практика программирования в ограничениях. Конспект лекций по информатике. 6876. С. 454–469. CiteSeerX 10.1.1.211.1807. Дои:10.1007/978-3-642-23786-7_35. ISBN 978-3-642-23785-0.
^ ^а ^б Ю. Малицкий; А. Сабхарвал; Х. Самуловиц; М. Селлманн (2013). «Портфели алгоритмов, основанные на иерархической кластеризации с учетом затрат». Материалы двадцать третьей международной совместной конференции по искусственному интеллекту. С. 608–614. ISBN 978-1-57735-633-2.
^ Э. Нудельман; К. Лейтон-Браун; Х. Хус; А. Девкар; Ю. Шохам (2004). "Понимание случайного SAT: за пределами соотношения пунктов к переменным" (PDF). Производство CP.
^ С. Кадыоглу; Ю. Малицкий; М. Селлманн; К. Тирни (2010). "ISAC - Конфигурация алгоритма для конкретного экземпляра" (PDF). Труды Европейской конференции по искусственному интеллекту.
^ Л. Сюй; Ф. Хаттер; Дж. Шен; Х. Хус; К. Лейтон-Браун (2012). «SATzilla2012: улучшенный выбор алгоритма на основе экономичных классификационных моделей» (PDF). Труды SAT Challenge 2012: Описание решателей и тестов.
^ А. Фрешетт; Л. Коттофф; Т. Михалак; Т. Рахван; Х. Хус и К. Лейтон-Браун (2016). «Использование значения Шепли для анализа портфелей алгоритмов». Материалы Международной конференции по AAAI.
^ Коттхофф, Ларс. "Выбор алгоритма для задач комбинаторного поиска: обзор. "Интеллектуальный анализ данных и программирование ограничений. Спрингер, Чам, 2016. 149-190.
^ М. Линдауэр; Р. Бергдолл; Ф. Хаттер (2016). «Эмпирическое исследование расписания алгоритмов по экземплярам» (PDF). Материалы международной конференции по обучению и интеллектуальной оптимизации. Конспект лекций по информатике. 10079: 253–259. Дои:10.1007/978-3-319-50349-3_20. ISBN 978-3-319-50348-6.
^ М. Линдауэр; Х. Хус и Ф. Хаттер (2015). «От последовательного выбора алгоритма к параллельному выбору портфеля» (PDF). Материалы международной конференции по обучению и интеллектуальной оптимизации. Конспект лекций по информатике. 8994: 1–16. Дои:10.1007/978-3-319-19084-6_1. ISBN 978-3-319-19083-9.

[1] Райс, Джон Р. (1976). «Проблема выбора алгоритма». Достижения в области компьютеров. 15. С. 65–118. Дои:10.1016 / S0065-2458 (08) 60520-3. ISBN 9780120121151.

[2] Бишл, Бернд; Кершке, Паскаль; Коттхофф, Ларс; Линдауэр, Мариус; Малицкий, Юрий; Фрешетт, Александр; Хус, Хольгер; Хаттер, Фрэнк; Лейтон-Браун, Кевин; Тирни, Кевин; Ваншорен, Хоакин (2016). «ASlib: эталонная библиотека для выбора алгоритма». Искусственный интеллект. 237: 41–58. arXiv:1506.02465. Дои:10.1016 / j.artint.2016.04.003.

[zilla08-3] а ^б Л. Сюй; Ф. Хаттер; Х. Хус и К. Лейтон-Браун (2008). «SATzilla: выбор алгоритма на основе портфеля для SAT». Журнал исследований искусственного интеллекта. 32: 565–606. arXiv:1111.2249. Дои:10.1613 / jair.2490.

[4] С. Кадыоглу; Ю. Малицкий; А. Сабхарвал; Х. Самуловиц; М. Селлманн (2011). «Выбор алгоритма и планирование». В Ли, Дж. (Ред.). Принципы и практика программирования в ограничениях. Конспект лекций по информатике. 6876. С. 454–469. CiteSeerX 10.1.1.211.1807. Дои:10.1007/978-3-642-23786-7_35. ISBN 978-3-642-23785-0.

[CSHC-5] а ^б Ю. Малицкий; А. Сабхарвал; Х. Самуловиц; М. Селлманн (2013). «Портфели алгоритмов, основанные на иерархической кластеризации с учетом затрат». Материалы двадцать третьей международной совместной конференции по искусственному интеллекту. С. 608–614. ISBN 978-1-57735-633-2.

[6] Э. Нудельман; К. Лейтон-Браун; Х. Хус; А. Девкар; Ю. Шохам (2004). "Понимание случайного SAT: за пределами соотношения пунктов к переменным" (PDF). Производство CP.

[7] С. Кадыоглу; Ю. Малицкий; М. Селлманн; К. Тирни (2010). "ISAC - Конфигурация алгоритма для конкретного экземпляра" (PDF). Труды Европейской конференции по искусственному интеллекту.

[8] Л. Сюй; Ф. Хаттер; Дж. Шен; Х. Хус; К. Лейтон-Браун (2012). «SATzilla2012: улучшенный выбор алгоритма на основе экономичных классификационных моделей» (PDF). Труды SAT Challenge 2012: Описание решателей и тестов.

[9] А. Фрешетт; Л. Коттофф; Т. Михалак; Т. Рахван; Х. Хус и К. Лейтон-Браун (2016). «Использование значения Шепли для анализа портфелей алгоритмов». Материалы Международной конференции по AAAI.

[10] Коттхофф, Ларс. "Выбор алгоритма для задач комбинаторного поиска: обзор. "Интеллектуальный анализ данных и программирование ограничений. Спрингер, Чам, 2016. 149-190.

[11] М. Линдауэр; Р. Бергдолл; Ф. Хаттер (2016). «Эмпирическое исследование расписания алгоритмов по экземплярам» (PDF). Материалы международной конференции по обучению и интеллектуальной оптимизации. Конспект лекций по информатике. 10079: 253–259. Дои:10.1007/978-3-319-50349-3_20. ISBN 978-3-319-50348-6.

[12] М. Линдауэр; Х. Хус и Ф. Хаттер (2015). «От последовательного выбора алгоритма к параллельному выбору портфеля» (PDF). Материалы международной конференции по обучению и интеллектуальной оптимизации. Конспект лекций по информатике. 8994: 1–16. Дои:10.1007/978-3-319-19084-6_1. ISBN 978-3-319-19083-9.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]