Прогнозируемое представление состояния - Predictive state representation
Тема этой статьи может не соответствовать Википедии общее руководство по известности.Март 2011 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
В Информатика, а прогнозируемое представление состояния (PSR) - способ моделирования состояния контролируемого динамическая система из истории предпринятых действий и результатов наблюдений. PSR фиксирует состояние системы как вектор прогнозов для будущих тестов (экспериментов), которые могут быть выполнены в системе.[1] Тест - это последовательность пар действие-наблюдение, и его предсказание - это вероятность того, что последовательность-наблюдение теста произойдет, если бы последовательность действий теста была выполнена в системе. Одним из преимуществ использования PSR является то, что прогнозы напрямую связаны с наблюдаемыми величинами. В этом отличие от других моделей динамических систем, таких как частично наблюдаемые марковские процессы принятия решений (POMDP), где состояние системы представлено как распределение вероятностей по ненаблюдаемым номинальным состояниям.[2]
Рекомендации
- ^ Джеймс, Майкл Р .; Сингх, Сатиндер (01.01.2004). Изучение и обнаружение предиктивных представлений состояний в динамических системах со сбросом. Материалы двадцать первой международной конференции по машинному обучению. ICML '04. Нью-Йорк, Нью-Йорк, США: ACM. С. 53–. CiteSeerX 10.1.1.67.5179. Дои:10.1145/1015330.1015359. ISBN 978-1581138382.
- ^ "Алгоритм планирования для прогнозирующих представлений состояний (PDF) - Семантический ученый". www.semanticscholar.org. Получено 2016-07-14.
- Литтман, Майкл Л.; Ричард С. Саттон; Сатиндер Сингх (2002). «Предиктивные представления состояния» (PDF). Достижения в системах обработки нейронной информации 14 (NIPS). С. 1555–1561.
- Сингх, Сатиндер; Майкл Р. Джеймс; Мэтью Р. Рудари (2004). "Предсказательные представления состояний: новая теория моделирования динамических систем" (PDF). Неопределенность в искусственном интеллекте: материалы двадцатой конференции (UAI). С. 512–519.
- Вевиора, Эрик Уолтер (2008), Моделирование распределений вероятностей с помощью прогнозных представлений состояний (PDF)
Этот искусственный интеллект -связанная статья является заглушка. Вы можете помочь Википедии расширяя это. |