Исключение переменных - Википедия - Variable elimination

Исключение переменных (VE) - это простой и общий точный вывод алгоритм в вероятностные графические модели, Такие как Байесовские сети и Марковские случайные поля.[1] Его можно использовать для вывода максимум апостериори (MAP) состояние или оценка условный или же маржинальные распределения над подмножеством переменных. Алгоритм имеет экспоненциальную временную сложность, но может быть эффективным на практике для малыхширина дерева графики, если используется правильный порядок исключения.

Факторы

Обеспечение ключевого снижения алгоритмической сложности, фактор , также известный как потенциал, переменных это отношение между каждым экземпляром переменных к неотрицательному числу, обычно обозначаемому как .[2] Фактор не обязательно имеет установленную интерпретацию. Можно выполнять операции с факторами различных представлений, таких как распределение вероятностей или условное распределение.[2] Совместные распределения часто становятся слишком большими для обработки, поскольку сложность этой операции экспоненциальна. Таким образом, исключение переменных становится более возможным при вычислении факторизованных сущностей.

Основные операции

Суммирование переменных

Алгоритм 1, называемый суммированием (SO) или маргинализацией, исключает единственную переменную из набора факторов,[3] и возвращает результирующий набор факторов. Алгоритм, релевантный для сбора, просто возвращает эти факторы в с участием переменной .

Алгоритм 1 итог (,)

= собрать факторы, относящиеся к
= произведение всех факторов в


возвращаться

Пример

Здесь у нас есть совместное распределение вероятностей. Переменная, можно суммировать между набором экземпляров, где набор как минимум должны согласовать оставшиеся переменные. Значение не имеет значения, если это переменная, которую нужно суммировать. [2]

истинныйистинныйистинныйложныйложный0.80
ложныйистинныйистинныйложныйложный0.20

После устранения , его ссылка исключается, и мы остаемся с распределением только по оставшимся переменным и сумме каждого экземпляра.

истинныйистинныйложныйложный1.0

Результирующее распределение, которое следует за операцией суммирования, помогает только отвечать на запросы, в которых не упоминается .[2] Также стоит отметить, что операция суммирования коммутативна.

Фактор умножения

Вычисление продукта между несколькими факторами приводит к фактору, совместимому с одним экземпляром каждого фактора.[2]

Алгоритм 2 многофакторные (,)[2]

= Объединение всех переменных между произведением факторов
= коэффициент больше куда для всех
За каждый экземпляр
За 1 к
создание переменных в соответствии с
возвращаться

Умножение множителей не только коммутативно, но и ассоциативно.

Вывод

Самый распространенный тип запроса - это форма куда и непересекающиеся подмножества , и наблюдается, приобретая ценность . Базовый алгоритм вычисления p (X | E = e) называется исключение переменных (VE), впервые выдвинутый в.[1]

Взято из,[1] этот алгоритм вычисляет из дискретной байесовской сети B. VE вызывает SO для удаления переменных по одной. В частности, в алгоритме 2 множество C таблиц условной вероятности (далее "CPT") для B, список переменных запроса, список наблюдаемых переменных, - соответствующий список наблюдаемых значений, а порядок исключения для переменных , куда обозначает .

Алгоритм исключения переменных VE ()

Умножьте множители с соответствующими CPT, пока σ не пусто
Удалите первую переменную из
= итог
= произведение всех факторов

возвращаться

Заказ

Нахождение оптимального порядка исключения переменных - это NP-трудная задача. Таким образом, существуют эвристики, которым можно следовать, чтобы лучше оптимизировать производительность по порядку:

  1. Минимальная степень: Исключить переменную, которая приводит к построению наименьшего возможного фактора.[2]
  2. Минимальное заполнение: путем построения неориентированного графа, показывающего отношения переменных, выраженные всеми CPT, исключите переменную, которая приведет к добавлению наименьшего количества ребер после исключения.[2]

Рекомендации

  1. ^ а б c Чжан Н.Л., Пул Д.: Простой подход к вычислениям байесовских сетей // 7-я Канадская конференция по искусственному интеллекту, стр. 171-178. Спрингер, Нью-Йорк (1994)
  2. ^ а б c d е ж грамм час Дарвиче, Аднан (01.01.2009). Моделирование и рассуждение с помощью байесовских сетей. Дои:10.1017 / cbo9780511811357. ISBN  9780511811357.
  3. ^ Коллер, Д., Фридман, Н .: Вероятностные графические модели: принципы и методы. MIT Press, Кембридж, Массачусетс (2009)