Сеть зависимостей (графическая модель) - Dependency network (graphical model)

Сети зависимостей (DN) находятся графические модели, похожий на Марковские сети, где каждая вершина (узел) соответствует случайной величине, а каждое ребро фиксирует зависимости между переменными. В отличие от Байесовские сети, DN могут содержать циклы. Каждый узел связан с таблицей условной вероятности, которая определяет реализацию случайной величины с учетом ее родителей.[1]

Марковское одеяло

В Байесовская сеть, то Марковское одеяло узла - это набор родителей и потомков этого узла вместе с родителями детей. Значения родителей и потомков узла, очевидно, дают информацию об этом узле. Однако родители его детей также должны быть включены в марковское одеяло, потому что их можно использовать для объяснения рассматриваемого узла. В Марковское случайное поле, то Марковское одеяло поскольку узел - это просто его соседние (или соседние) узлы. В сети зависимостей Марковское одеяло для узла - это просто набор его родителей.

Сеть зависимостей против байесовских сетей

Сети зависимостей имеют преимущества и недостатки по сравнению с байесовскими сетями. В частности, их легче параметризовать на основе данных, поскольку существуют эффективные алгоритмы для изучения как структуры, так и вероятностей сети зависимостей на основе данных. Такие алгоритмы недоступны для байесовских сетей, для которых проблема определения оптимальной структуры NP-сложна.[2] Тем не менее, сеть зависимостей может быть труднее построить с использованием подхода, основанного на знаниях, управляемого экспертными знаниями.

Сети зависимостей против сетей Маркова

Согласованные сети зависимостей и сети Маркова обладают одинаковой репрезентативной силой. Тем не менее, можно построить несовместимые сети зависимостей, то есть сети зависимостей, для которых нет совместимых действительных совместное распределение вероятностей. Марковские сети, напротив, всегда согласованы.

Определение

Последовательная сеть зависимостей для набора случайных величин с совместным распределением пара куда - циклический ориентированный граф, каждый из узлов которого соответствует переменной в , и представляет собой набор условных распределений вероятностей. Родители узла , обозначенный , соответствуют этим переменным которые удовлетворяют следующим отношениям независимости

Сеть зависимостей согласована в том смысле, что каждое локальное распределение может быть получено из совместного распределения. . Сети зависимостей, изученные с использованием больших наборов данных с большими размерами выборки, почти всегда будут согласованными. Несогласованная сеть - это сеть, для которой нет совместного распределения вероятностей, совместимого с парой . В этом случае не существует совместного распределения вероятностей, которое удовлетворяет отношениям независимости, входящим в эту пару.

Структура и параметры обучения

Две важные задачи в сети зависимостей - это изучение ее структуры и вероятностей на основе данных. По сути, алгоритм обучения состоит из независимого выполнения вероятностной регрессии или классификации для каждой переменной в домене. Это происходит из наблюдения, что локальное распределение для переменной в сети зависимости условное распределение , которые можно оценить с помощью любого количества методов классификации или регрессии, таких как методы, использующие вероятностное дерево решений, нейронную сеть или машину вероятностных опорных векторов. Следовательно, для каждой переменной в домене , мы независимо оцениваем его локальное распределение на основе данных с помощью алгоритма классификации, хотя это отдельный метод для каждой переменной. Здесь мы кратко покажем, как вероятностные деревья решений используются для оценки локальных распределений. Для каждой переменной в , изучается вероятностное дерево решений, где целевая переменная и - входные переменные. Чтобы изучить древовидную структуру решений для , алгоритм поиска начинается с одноэлементного корневого узла без дочерних узлов. Затем каждый листовой узел в дереве заменяется двоичным разбиением по некоторой переменной. в , пока никакие замены не увеличат счет дерева.

Вероятностный вывод

Вероятностный вывод - это задача, в которой мы хотим ответить на вероятностные запросы в форме , учитывая графическую модель для , куда ("целевые" переменные) (входные переменные) - непересекающиеся подмножества . Одна из альтернатив для выполнения вероятностных выводов - использование Выборка Гиббса. Наивный подход для этого использует упорядоченный сэмплер Гиббса, чья важная трудность состоит в том, или же мала, то для точной оценки вероятности требуется много итераций. Другой подход к оценке когда заключается в использовании модифицированного заказанного сэмплера Гиббса, где он фиксирует во время отбора проб Гиббса.

Также может случиться так, что редко, например содержит много переменных. Таким образом, закон полной вероятности вместе с зависимостями, закодированными в сети зависимостей, можно использовать для разложения задачи вывода на набор задач вывода по отдельным переменным. Этот подход имеет то преимущество, что некоторые термины могут быть получены прямым поиском, что позволяет избежать некоторой выборки Гиббса.

Вы можете увидеть ниже алгоритм, который можно использовать для получения для конкретного случая и , куда и непересекающиеся подмножества.

  • Алгоритм 1:
  1. (* необработанные переменные *)
  2. (* обрабатываемые и кондиционирующие переменные *)
  3. (* значения для *)
  4. Пока :
    1. выбирать такой, что нет больше родителей в чем любая переменная в
    2. Если все родители находятся в
    3. Еще
      1. Используйте модифицированный заказанный сэмплер Гиббса для определения
  5. Возвращает произведение условных операторов

Приложения

Помимо приложений для вероятностного вывода, следующие приложения находятся в категории совместной фильтрации (CF), которая является задачей прогнозирования предпочтений. Сети зависимостей - это естественный класс модели, на котором основываются прогнозы CF, поскольку алгоритм для этой задачи требует только оценки дать рекомендации. В частности, эти оценки могут быть получены прямым поиском в сети зависимостей.

  • Предсказать, какие фильмы понравятся человеку, на основе его оценок просмотренных фильмов;
  • Предсказание того, к каким веб-страницам будет обращаться человек, на основе его или ее истории на сайте;
  • Прогнозирование того, какие новости интересуют человека, на основе других историй, которые он или она прочитали;
  • Предсказание того, какой продукт человек купит, на основе продуктов, которые он или она уже приобрели и / или бросили в свою корзину.

Другой класс полезных приложений для сетей зависимостей связан с визуализацией данных, то есть визуализацией прогнозных отношений.

Смотрите также

Рекомендации

  1. ^ ХЕКЕРМАН, Дэвид; МАКСВЕЛЛ К., Дэвид; MEEK, Кристофер; РУНТУЭЙТ, Роберт; КАДИ, Карл (октябрь 2000 г.). «Сети зависимостей для вывода, совместной фильтрации и визуализации данных» (PDF). Журнал исследований в области машинного обучения.
  2. ^ ХЕКЕРМАН, Дэвид. «Изучение байесовских сетей на большой выборке - непростая задача» (PDF). Цитировать журнал требует | журнал = (помощь)