Прогнозируемое представление состояния - Predictive state representation

В Информатика, а прогнозируемое представление состояния (PSR) - способ моделирования состояния контролируемого динамическая система из истории предпринятых действий и результатов наблюдений. PSR фиксирует состояние системы как вектор прогнозов для будущих тестов (экспериментов), которые могут быть выполнены в системе.[1] Тест - это последовательность пар действие-наблюдение, и его предсказание - это вероятность того, что последовательность-наблюдение теста произойдет, если бы последовательность действий теста была выполнена в системе. Одним из преимуществ использования PSR является то, что прогнозы напрямую связаны с наблюдаемыми величинами. В этом отличие от других моделей динамических систем, таких как частично наблюдаемые марковские процессы принятия решений (POMDP), где состояние системы представлено как распределение вероятностей по ненаблюдаемым номинальным состояниям.[2]

Рекомендации

  1. ^ Джеймс, Майкл Р .; Сингх, Сатиндер (01.01.2004). Изучение и обнаружение предиктивных представлений состояний в динамических системах со сбросом. Материалы двадцать первой международной конференции по машинному обучению. ICML '04. Нью-Йорк, Нью-Йорк, США: ACM. С. 53–. CiteSeerX  10.1.1.67.5179. Дои:10.1145/1015330.1015359. ISBN  978-1581138382.
  2. ^ "Алгоритм планирования для прогнозирующих представлений состояний (PDF) - Семантический ученый". www.semanticscholar.org. Получено 2016-07-14.