Теория термоядерного адаптивного резонанса - Fusion adaptive resonance theory

Теория адаптивного резонанса Fusion (Fusion ART)^[1]^[2]^[3] является обобщением самоорганизации нейронные сети известный как Теория адаптивного резонанса^[4] для изучения категорий распознавания (или когнитивные коды ) по нескольким каналам шаблона.

Fusion ART объединяет ряд моделей нейронных сетей, поддерживает несколько парадигм обучения, в частности обучение без учителя, контролируемое обучение и обучение с подкреплением, и может применяться для базовые знания интеграция, представление памяти,^[5] и моделирование познания высокого уровня.

Обзор

Модели Fusion ART являются естественным продолжением оригинальной теории адаптивного резонанса (ART).^[4]^[6] модели, разработанные Стивен Гроссберг и Гейл А. Карпентер из одного поля шаблона в несколько каналов шаблона. В то время как исходные модели ART выполняют неконтролируемое обучение узлов распознавания в ответ на входящие шаблоны ввода, fusion ART изучает многоканальные сопоставления одновременно по каналам мультимодальных шаблонов в онлайн и добавочный манера.

Модель обучения

Fusion ART использует многоканальную архитектуру (как показано ниже), содержащую поле категории ${ displaystyle F_ {2}}$ подключен к фиксированному количеству (K) каналы шаблона или поля ввода ${ Displaystyle F_ {1} ^ {c1}, dots, F_ {1} ^ {cK}}$ через двунаправленные условные пути. Модель объединяет ряд сетевых проектов, в первую очередь теорию адаптивного резонанса (ART), адаптивную ассоциативную карту резонанса (ARAM).^[7] и Fusion Architecture для обучения и познания (FALCON),^[8] разработаны за последние десятилетия для широкого спектра функций и приложений.

Учитывая набор мультимодальных шаблонов, каждый из которых представлен в канале шаблона, цикл кодирования шаблонов Fusion ART включает пять ключевых этапов, а именно активацию кода, конкуренцию кода, считывание активности, сопоставление шаблонов и обучение шаблонов, как описано ниже.

Активация кода: Учитывая векторы входной активности ${ displaystyle { vec {I}} ^ {ck}}$ , по одному для каждого поля ввода ${ displaystyle F_ {1} ^ {ck}}$ , функция выбора ${ displaystyle T_ {j}}$ каждого ${ displaystyle F_ {2}}$ узел j вычисляется на основе совокупного общего сходства между входными шаблонами и соответствующим весом векторов ${ displaystyle { vec {w}} _ {j} ^ {ck}}$ .
Код соревнования: Процесс кодовой конкуренции следует, в соответствии с которым ${ displaystyle F_ {2}}$ узел с наибольшим значением функции выбора идентифицируется. Победитель индексируется на J куда ${ displaystyle T_ {j}}$ это максимум среди всех ${ displaystyle F_ {2}}$ узлы. Это указывает на стратегию «победитель получает все».
Показания активности: В течение отзыв памяти, избранный ${ displaystyle F_ {2}}$ узел J выполняет считывание своих весовых векторов в поля ввода ${ displaystyle F_ {1} ^ {ck}}$ .
Соответствие шаблонов: До того, как показания активности стабилизируются и узел J может использоваться для обучения, процесс сопоставления шаблонов проверяет, что весовые шаблоны узла J достаточно близки к их соответствующим входным образцам. В частности, резонанс возникает, если для каждого канала k, то функция соответствия выбранного узла J соответствует критерию его бдительности. Если любой из бдительность ограничения нарушаются, происходит сброс рассогласования, при котором значение функция выбора ${ displaystyle T_ {J}}$ установлен в 0 на время представления ввода. Используя отслеживание матчей обрабатывать в начале каждой входной презентации параметр бдительности в каждом канале ск приравнивается к базовой бдительности. Когда происходит сброс рассогласования, бдительность всех каналов шаблона увеличивается одновременно до тех пор, пока один из них не станет немного больше, чем соответствующая функция согласования, вызывая сброс. Затем процесс поиска выбирает другой ${ displaystyle F_ {2}}$ узел J в соответствии с пересмотренным критерием бдительности до достижения резонанса.
Обучение по шаблону: Как только возникает резонанс, для каждого канала ск, весовой вектор ${ displaystyle { vec {w}} _ {J} ^ {ck}}$ изменяется в соответствии с правилом обучения, которое перемещает его в сторону входного шаблона. Когда незафиксированный узел выбирается для обучения, он становится преданный идее и новый незафиксированный узел добавляется в ${ displaystyle F_ {2}}$ поле. Таким образом, Fusion ART динамически расширяет свою сетевую архитектуру в соответствии с входными шаблонами.

Виды фьюжн-АРТ

Описанная выше сетевая динамика может использоваться для поддержки множества обучающих операций. В следующих разделах мы покажем, как fusion ART можно использовать для решения множества традиционно различных учебных задач.

Оригинальные модели ART

Благодаря единому каналу рисунка архитектура fusion ART сводится к исходной модели ART. Используя выбранное значение бдительности $ rho $, модель ART непрерывно изучает набор узлов распознавания в ответ на входящий поток входных шаблонов. Каждый узел распознавания в ${ displaystyle F_ {2}}$ поле учится кодировать шаблон шаблона, представляющий ключевые характеристики набора шаблонов. АРТ широко использовалась в контексте обучение без учителя для обнаружения группировок паттернов.

Ассоциативная карта адаптивного резонанса

К синхронизация кодируя шаблоны по нескольким каналам шаблонов, Fusion ART учится кодировать ассоциативные сопоставления в различных пространствах шаблонов. Конкретный пример слияния ART с двумя каналами шаблонов известен как адаптивная ассоциативная карта резонанса (ARAM), которая изучает многомерные контролируемые сопоставления из одного пространства шаблонов в другое пространство шаблонов. Система ARAM состоит из поля ввода ${ displaystyle F_ {1} ^ {a}}$ , поле вывода ${ displaystyle F_ {1} ^ {b}}$ , и поле категории ${ displaystyle F_ {2}}$ . Учитывая набор векторов признаков, представленных на ${ displaystyle F_ {1} ^ {a}}$ с соответствующими векторами классов, представленными на ${ displaystyle F_ {1} ^ {b}}$ , ARAM изучает прогнозную модель (закодированную узлами распознавания в ${ displaystyle F_ {2}}$ ), который связывает комбинации ключевых функций с соответствующими классами.

Нечеткое ARAM, основанное на нечетких операциях ART, успешно применялось для решения множества задач машинного обучения, включая персональное профилирование,^[9] классификация документов,^[10] персонализированное управление контентом,^[11] и ДНК анализ экспрессии генов.^[12] Во многих тестовых экспериментах ARAM продемонстрировал предсказательную производительность, превосходящую таковую многих современных систем машинного обучения, включая C4.5, нейронную сеть обратного распространения ошибки, K Ближайший сосед, и Машины опорных векторов.

Fusion ART со знанием предметной области

Во время обучения fusion ART формулирует категории распознавания входных шаблонов по нескольким каналам. Знания, которые Fusion ART обнаруживает во время обучения, совместимы с символическим представлением на основе правил. В частности, категории распознавания, изученные ${ displaystyle F_ {2}}$ узлы категорий совместимы с классом правил IF-THEN, которые сопоставляют набор входных атрибутов (антецедентов) в одном канале шаблона с непересекающимся набором выходных атрибутов (последствия ) в другом канале. Благодаря этой совместимости в любой точке постепенное обучение инструкции в форме правил IF-THEN можно легко перевести в категории распознавания системы Fusion ART. Правила являются конъюнктивными в том смысле, что атрибуты в Если да и в предложении THEN есть И отношение. Дополнение fusion ART-сети знаниями предметной области с помощью явных инструкций способствует повышению эффективности обучения и точности прогнозирования.

Стратегия вставки правила fusion ART аналогична стратегии, используемой в Cascade ARTMAP, обобщении ARTMAP, которое выполняет вставку, уточнение и извлечение знаний предметной области.^[13] Для прямой вставки знаний предложения IF и THEN каждой инструкции (правила) транслируются в пару векторов A и B соответственно. Полученные векторные пары затем используются в качестве обучающих шаблонов для вставки в сеть Fusion ART. Во время вставки правила параметры бдительности устанавливаются на 1 с, чтобы гарантировать, что каждое отдельное правило закодировано одним узлом категории.

Архитектура Fusion для обучения и познания (FALCON)

Обучение с подкреплением - это парадигма, в которой автономный система учится корректировать свое поведение на основе сигналов подкрепления, полученных из окружающей среды. Экземпляр Fusion ART, известный как FALCON (архитектура слияния для обучения и познания), изучает сопоставления одновременно через мультимодальные шаблоны ввода, включая состояния, действия и вознаграждения, в онлайн и добавочный манера. По сравнению с другими системами обучения с подкреплением на основе ART, FALCON представляет собой действительно интегрированное решение в том смысле, что отсутствует реализация отдельного модуля обучения с подкреплением или Q-значение стол. Используя конкурентное кодирование в качестве основного принципа вычислений, сетевая динамика охватывает несколько парадигм обучения, включая обучение без учителя, обучение с учителем, а также обучение с подкреплением.

FALCON использует трехканальную архитектуру, включающую поле категории ${ displaystyle F_ {2}}$ и три поля паттернов, а именно сенсорное поле ${ displaystyle F_ {1} ^ {c1}}$ для представления текущих состояний моторное поле ${ displaystyle F_ {1} ^ {c2}}$ для представления действий и поле обратной связи ${ displaystyle F_ {1} ^ {c3}}$ для представления значений вознаграждения. Класс сетей FALCON, известный как TD-FALCON,^[8] включает методы временной разницы (TD) для оценки и изучения функции ценности Q (с, а), что указывает на готовность совершить определенное действие а в данном состоянии s.

Общий смысл - действовать - учиться алгоритм для TD-FALCON. Учитывая текущее состояние s, сеть FALCON используется для прогнозирования ценности выполнения каждого доступного действия. а в наборе действий A на основе соответствующего вектора состояния ${ displaystyle { vec {s}}}$ и вектор действия ${ displaystyle { vec {a}}}$ . Затем функции значений обрабатываются стратегией выбора действия (также известной как политика) для выбора действия. После получения обратной связи (если есть) от среды после выполнения действия, формула TD используется для вычисления новой оценки Q-значения для выполнения выбранного действия в текущем состоянии. Новое значение Q затем используется в качестве обучающего сигнала (представленного как вектор вознаграждения R) для FALCON, чтобы узнать связь текущего состояния и выбранного действия с расчетным значением.