Вперед – обратный алгоритм - Forward–backward algorithm

В вперед-назад алгоритм является вывод алгоритм за скрытые марковские модели который вычисляет задний маргиналы всех скрытых переменных состояния с учетом последовательности наблюдений / выбросов , т.е. вычисляет для всех скрытых переменных состояния , распространение . Эта задача вывода обычно называется сглаживание. В алгоритме используется принцип динамическое программирование для эффективного вычисления значений, необходимых для получения апостериорных маргинальных распределений за два прохода. Первый проход идет вперед во времени, а второй - назад; отсюда и название вперед-назад алгоритм.

Период, термин вперед-назад алгоритм также используется для обозначения любого алгоритма, принадлежащего к общему классу алгоритмов, которые работают с моделями последовательностей в прямом-обратном порядке. В этом смысле описания в оставшейся части этой статьи относятся только к одному конкретному экземпляру этого класса.

Обзор

На первом проходе алгоритм прямого-обратного вычисляет набор прямых вероятностей, которые обеспечивают для всех , вероятность оказаться в каком-либо конкретном состоянии с учетом первого наблюдения в последовательности, т.е. . Во втором проходе алгоритм вычисляет набор обратных вероятностей, которые обеспечивают вероятность наблюдения оставшихся наблюдений при любой начальной точке. , т.е. . Затем эти два набора распределений вероятностей можно объединить, чтобы получить распределение по состояниям в любой конкретный момент времени с учетом всей последовательности наблюдений:

Последний шаг следует из применения Правило Байеса и условная независимость из и данный .

Как указано выше, алгоритм состоит из трех шагов:

  1. вычисление прямых вероятностей
  2. вычисление обратных вероятностей
  3. вычисление сглаженных значений.

Шаги вперед и назад могут также называться «прямой проход сообщения» и «обратный проход сообщения» - эти термины обусловлены передача сообщений используется в целом распространение веры подходы. Для каждого отдельного наблюдения в последовательности вычисляются вероятности, которые будут использоваться для вычислений при следующем наблюдении. Шаг сглаживания можно рассчитать одновременно во время обратного прохода. Этот шаг позволяет алгоритму учитывать любые прошлые наблюдения за выходными данными для вычисления более точных результатов.

Алгоритм прямого-обратного можно использовать для поиска наиболее вероятного состояния в любой момент времени. Однако его нельзя использовать для поиска наиболее вероятной последовательности состояний (см. Алгоритм Витерби ).

Прямые вероятности

В нижеследующем описании будут использоваться матрицы значений вероятности, а не распределения вероятностей, хотя в целом алгоритм прямого-обратного может применяться как к непрерывным, так и к дискретным моделям вероятностей.

Преобразуем распределения вероятностей, относящиеся к заданному скрытая марковская модель в матричные обозначения следующим образом. данной случайной величины представляющие все возможные состояния в скрытой марковской модели, будут представлены матрицей где индекс столбца будет представлять целевое состояние и индекс строки представляет начальное состояние. Переход из состояния вектор-строка в инкрементное состояние вектора-строки записывается как . В приведенном ниже примере представлена ​​система, в которой вероятность остаться в том же состоянии после каждого шага составляет 70%, а вероятность перехода в другое состояние составляет 30%. Тогда матрица перехода будет следующей:

В типичной марковской модели мы умножаем вектор состояния на эту матрицу, чтобы получить вероятности для последующего состояния. В скрытой марковской модели состояние неизвестно, и вместо этого мы наблюдаем события, связанные с возможными состояниями. Матрица событий вида:

предоставляет вероятности для наблюдения событий в конкретном состоянии. В приведенном выше примере событие 1 будет наблюдаться в 90% случаев, если мы находимся в состоянии 1, в то время как событие 2 имеет 10% вероятность возникновения в этом состоянии. Напротив, событие 1 будет наблюдаться только в 20% случаев, если мы находимся в состоянии 2, а вероятность возникновения события 2 составляет 80%. Для произвольного вектора-строки, описывающего состояние системы (), тогда вероятность наблюдения события j равна:

Вероятность данного состояния, ведущего к наблюдаемому событию j, может быть представлена ​​в матричной форме путем умножения вектора-строки состояния () с матрицей наблюдения (), содержащий только диагональные элементы. Продолжая приведенный выше пример, матрица наблюдения для события 1 будет:

Это позволяет нам вычислить новый вектор состояния ненормированных вероятностей по правилу Байеса, взвешивая по вероятности того, что каждый элемент сгенерировано событие 1 как:

Теперь мы можем конкретизировать эту общую процедуру для нашей серии наблюдений. Предполагая вектор начального состояния , (который может быть оптимизирован как параметр путем повторения процедуры вперед-назад), мы начинаем с , затем обновляя распределение состояний и взвешивание с учетом вероятности первого наблюдения:

Этот процесс можно продолжить с дополнительными наблюдениями, используя:

Это значение представляет собой прямой ненормализованный вектор вероятности. I-я запись этого вектора обеспечивает:

Обычно мы нормализуем вектор вероятности на каждом шаге так, чтобы сумма его элементов равнялась 1. Таким образом, на каждом шаге вводится коэффициент масштабирования, так что:

куда представляет масштабированный вектор из предыдущего шага и представляет коэффициент масштабирования, который заставляет элементы результирующего вектора суммироваться до 1. Произведение коэффициентов масштабирования представляет собой полную вероятность наблюдения данных событий независимо от конечных состояний:

Это позволяет нам интерпретировать масштабированный вектор вероятности как:

Таким образом, мы обнаруживаем, что произведение коэффициентов масштабирования дает нам полную вероятность наблюдения данной последовательности до момента времени t, а масштабированный вектор вероятности дает нам вероятность нахождения в каждом состоянии в это время.

Обратные вероятности

Подобная процедура может быть построена для нахождения обратных вероятностей. Они предназначены для обеспечения вероятностей:

То есть теперь мы хотим предположить, что мы начинаем с определенного состояния (), и теперь нас интересует вероятность наблюдения всех будущих событий из этого состояния. Поскольку исходное состояние считается заданным (т.е. априорная вероятность этого состояния = 100%), мы начинаем с:

Обратите внимание, что теперь мы используем вектор-столбец, в то время как прямые вероятности использовали векторы-строки. Затем мы можем работать в обратном направлении, используя:

Хотя мы могли бы также нормализовать этот вектор, чтобы сумма его записей равнялась единице, обычно этого не делается. Отмечая, что каждая запись содержит вероятность будущей последовательности событий с учетом конкретного начального состояния, нормализация этого вектора была бы эквивалентна применению теоремы Байеса для нахождения вероятности каждого начального состояния с учетом будущих событий (при условии единообразных априорных значений для вектора конечного состояния ). Однако чаще масштабировать этот вектор, используя тот же константы, используемые в расчетах прямой вероятности. не масштабируется, но в последующих операциях используются:

куда представляет предыдущий масштабированный вектор. Этот результат состоит в том, что масштабированный вектор вероятности связан с обратными вероятностями следующим образом:

Это полезно, потому что позволяет нам найти общую вероятность нахождения в каждом состоянии в данный момент времени t путем умножения этих значений:

Чтобы понять это, отметим, что обеспечивает вероятность наблюдения данных событий, проходя через состояние в момент t. Эта вероятность включает прямые вероятности, охватывающие все события до момента времени t, а также обратные вероятности, которые включают все будущие события. Это числитель, который мы ищем в нашем уравнении, и мы делим его на общую вероятность последовательности наблюдений, чтобы нормализовать это значение, и извлекаем только вероятность того, что . Эти значения иногда называют «сглаженными значениями», поскольку они объединяют прямую и обратную вероятности для вычисления окончательной вероятности.

Ценности таким образом обеспечить вероятность пребывания в каждом состоянии в момент времени t. Таким образом, они полезны для определения наиболее вероятного состояния в любое время. Термин «наиболее вероятное состояние» несколько неоднозначен. Хотя наиболее вероятное состояние с наибольшей вероятностью будет правильным в данной точке, последовательность индивидуально вероятных состояний вряд ли будет наиболее вероятной последовательностью. Это связано с тем, что вероятности для каждой точки рассчитываются независимо друг от друга. Они не принимают во внимание вероятности перехода между состояниями, и, таким образом, можно получить состояния в два момента (t и t + 1), которые являются наиболее вероятными в эти моменты времени, но которые имеют очень небольшую вероятность возникновения вместе, т. Е. . Наиболее вероятную последовательность состояний, которые привели к последовательности наблюдений, можно найти с помощью Алгоритм Витерби.

Пример

Этот пример берет за основу зонтичный мир в Russell & Norvig 2010 Глава 15 с. 567 в котором мы хотели бы сделать вывод о погоде по наблюдениям другого человека, несущего или не несущего зонтик. Мы предполагаем два возможных состояния погоды: состояние 1 = дождь, состояние 2 = без дождя. Мы предполагаем, что у погоды есть 70% шанс оставаться неизменной каждый день и 30% шанс измениться. Тогда вероятности перехода таковы:

Мы также предполагаем, что каждое состояние генерирует одно из двух возможных событий: событие 1 = зонтик, событие 2 = отсутствие зонтика. Условные вероятности их появления в каждом состоянии задаются матрицей вероятностей:

Затем мы наблюдаем следующую последовательность событий: {зонтик, зонтик, без зонта, зонтик, зонтик}, которые мы представим в наших расчетах как:

Обратите внимание, что отличается от других наблюдением «без зонтика».

При вычислении прямых вероятностей мы начинаем с:

который является нашим вектором предыдущего состояния, указывающим на то, что мы не знаем, в каком состоянии находится погода до наших наблюдений. Хотя вектор состояния должен быть задан как вектор-строка, мы будем использовать транспонирование матрицы, чтобы было легче читать приведенные ниже вычисления. Наши расчеты записываются в виде:

вместо:

Обратите внимание, что матрица преобразования также транспонируется, но в нашем примере транспонирование равно исходной матрице. Выполнение этих расчетов и нормализация результатов обеспечивает:

Для обратных вероятностей мы начнем с:

Затем мы можем вычислить (используя наблюдения в обратном порядке и нормализовав с разными константами):

Наконец, мы вычислим сглаженные значения вероятности. Эти результаты также должны быть масштабированы так, чтобы их сумма записей равнялась 1, потому что мы не масштабировали обратные вероятности с помощью найден ранее. Таким образом, приведенные выше обратные векторы вероятности фактически представляют вероятность каждого состояния в момент времени t с учетом будущих наблюдений. Поскольку эти векторы пропорциональны реальным обратным вероятностям, результат необходимо дополнительно масштабировать.

Обратите внимание, что значение равно и это равно . Это следует естественно, потому что оба и начать с единых априорных значений по векторам начального и конечного состояния (соответственно) и принять во внимание все наблюдения. Тем не мение, будет только равно когда наш вектор начального состояния представляет собой единый априор (т.е. все записи равны). Когда это не так необходимо объединить с вектором начального состояния, чтобы найти наиболее вероятное начальное состояние. Таким образом, мы находим, что прямых вероятностей самих по себе достаточно для расчета наиболее вероятного конечного состояния. Точно так же обратные вероятности могут быть объединены с вектором начального состояния, чтобы обеспечить наиболее вероятное начальное состояние с учетом наблюдений. Прямые и обратные вероятности нужно только объединить, чтобы вывести наиболее вероятные состояния между начальной и конечной точками.

Приведенные выше расчеты показывают, что наиболее вероятным состоянием погоды на каждый день, кроме третьего, был «дождь». Однако они говорят нам больше, поскольку теперь они предоставляют способ количественной оценки вероятностей каждого состояния в разное время. Возможно, самое главное, наша ценность в количественно оценивает наши знания о векторе состояния в конце последовательности наблюдений. Затем мы можем использовать это, чтобы предсказать вероятность различных погодных условий завтра, а также вероятность наблюдения за зонтом.

Спектакль

Алгоритм вперед-назад работает с временной сложностью в космосе , куда - длина временной последовательности и - количество символов в государственном алфавите.[1] Алгоритм также может работать в постоянном пространстве с временной сложностью. путем пересчета значений на каждом шаге.[2] Для сравнения, процедура перебора сгенерирует все возможные последовательности состояний и вычислить совместную вероятность каждой последовательности состояний с наблюдаемой серией событий, которая будет иметь временная сложность . Грубая сила неразрешима для реалистичных задач, поскольку количество возможных последовательностей скрытых узлов обычно чрезвычайно велико.

Расширение общего алгоритма вперед-назад, названное Алгоритм острова, использует меньшее использование памяти для увеличения времени работы, занимая время и объем памяти. Кроме того, можно инвертировать модель процесса, чтобы получить Космос, алгоритм времени, хотя инвертированный процесс может не существовать или быть плохо воспитанный.[3]

Кроме того, были разработаны алгоритмы для вычисления эффективно с помощью оперативного сглаживания, такого как алгоритм сглаживания с фиксированной задержкой (FLS).[4]

Псевдокод

алгоритм вперед назад является    Вход: guessState int sequenceIndex    выход: результат    если sequenceIndex находится за концом последовательности тогда        возвращаться 1    если (guessState, sequenceIndex) видели раньше тогда        возвращаться сохраненный результат результат := 0    для каждого соседнее государство n: результат : = результат + (вероятность перехода от guessState к n данный элемент наблюдения в sequenceIndex) × Назад (n, sequenceIndex + 1) сохранить результат для (guessState, sequenceIndex)    возвращаться результат

Пример Python

Учитывая HMM (как в Алгоритм Витерби ) представлены в Язык программирования Python:

состояния = ('Здоровый', 'Высокая температура')end_state = 'E' наблюдения = ('нормальный', 'холодный', 'головокружительный') start_probability = {'Здоровый': 0.6, 'Высокая температура': 0.4} transition_probability = {   'Здоровый' : {'Здоровый': 0.69, 'Высокая температура': 0.3, 'E': 0.01},   'Высокая температура' : {'Здоровый': 0.4, 'Высокая температура': 0.59, 'E': 0.01},   } Emission_probability = {   'Здоровый' : {'нормальный': 0.5, 'холодный': 0.4, 'головокружительный': 0.1},   'Высокая температура' : {'нормальный': 0.1, 'холодный': 0.3, 'головокружительный': 0.6},   }

Мы можем написать реализацию алгоритма вперед-назад следующим образом:

def fwd_bkw(наблюдения, состояния, start_prob, trans_prob, emm_prob, end_st):    "" "Алгоритм вперед-назад." ""    # Прямая часть алгоритма    вперед = []    за я, наблюдение_i в перечислять(наблюдения):        f_curr = {}        за ул в состояния:            если я == 0:                # базовый вариант для передней части                prev_f_sum = start_prob[ул]            еще:                prev_f_sum = сумма(f_prev[k] * trans_prob[k][ул] за k в состояния)            f_curr[ул] = emm_prob[ул][наблюдение_i] * prev_f_sum        вперед.добавить(f_curr)        f_prev = f_curr    p_fwd = сумма(f_curr[k] * trans_prob[k][end_st] за k в состояния)    # Обратная часть алгоритма    bkw = []    за я, наблюдение_i_plus в перечислять(перевернутый(наблюдения[1:] + (Никто,))):        b_curr = {}        за ул в состояния:            если я == 0:                # базовый вариант для задней части                b_curr[ул] = trans_prob[ул][end_st]            еще:                b_curr[ул] = сумма(trans_prob[ул][л] * emm_prob[л][наблюдение_i_plus] * b_prev[л] за л в состояния)        bkw.вставлять(0,b_curr)        b_prev = b_curr    p_bkw = сумма(start_prob[л] * emm_prob[л][наблюдения[0]] * b_curr[л] за л в состояния)    # Слияние двух частей    задний = []    за я в классифицировать(len(наблюдения)):        задний.добавить({ул: вперед[я][ул] * bkw[я][ул] / p_fwd за ул в состояния})    утверждать p_fwd == p_bkw    возвращаться вперед, bkw, задний

Функция fwd_bkw принимает следующие аргументы: Икс это последовательность наблюдений, например ["нормально", "холодно", "кружится голова"]; состояния это набор скрытых состояний; a_0 - вероятность старта; а - вероятности перехода; и е - вероятности выбросов.

Для простоты кода мы предполагаем, что последовательность наблюдений Икс не пусто и что a [i] [j] и e [i] [j] определено для всех состояний i, j.

В текущем примере алгоритм вперед-назад используется следующим образом:

def пример():    возвращаться fwd_bkw(наблюдения,                   состояния,                   start_probability,                   transition_probability,                   Emission_probability,                   end_state)
>>> за линия в пример():...     Распечатать(*линия)... {'Здоровый': 0,3, 'Лихорадка': 0,04000000000000001} {'Здоровый': 0,0892, 'Лихорадочный': 0,03408} {'Здоровый': 0,007518, 'Лихорадочный': 0,028120319999999997}{'Здоровый': 0,0010418399999999998, 'Лихорадка': 0,00109578} {'Здоровый': 0,00249, 'Лихорадочный': 0,00394} {'Здоровый': 0,01, 'Лихорадочный': 0,01}{'Здоровый': 0,8770110375573259, 'Лихорадка': 0,1229889624426741} {'Здоровый': 0,623228030950954, 'Лихорадка': 0,3767719690490461} {'Здоровый': 0,2109527048413057, 'Лихорадочный': 0,7890472951586943}

Смотрите также

Рекомендации

  1. ^ Рассел и Норвиг, 2010, стр. 579
  2. ^ Рассел и Норвиг, 2010, стр. 575
  3. ^ Биндер, Джон; Мерфи, Кевин; Рассел, Стюарт (1997). «Эффективное использование пространства в динамических вероятностных сетях» (PDF). Int'l, Joint Conf. Об искусственном интеллекте. Получено 8 июля 2020.
  4. ^ Russell & Norvig, 2010 г. Диаграмма 15,6 с. 580
  • Лоуренс Р. Рабинер, Учебное пособие по скрытым марковским моделям и избранным приложениям в распознавании речи. Труды IEEE, 77 (2), с. 257–286, февраль 1989 г. 10.1109/5.18626
  • Лоуренс Р. Рабинер, Б. Х. Хуанг (январь 1986 г.). «Введение в скрытые марковские модели». Журнал IEEE ASSP: 4–15.
  • Евгений Чарняк (1993). Статистическое изучение языков. Кембридж, Массачусетс: MIT Press. ISBN  978-0-262-53141-2.
  • Стюарт Рассел и Питер Норвиг (2010). Искусственный интеллект - современный подход, 3-е издание. Река Аппер Сэдл, Нью-Джерси: Pearson Education / Prentice-Hall. ISBN  978-0-13-604259-4.

внешняя ссылка