Предиктивное кодирование - Википедия - Predictive coding

Предиктивное кодирование (также известен как прогнозная обработка) - это теория функции мозга, в которой мозг постоянно создает и обновляет ментальную модель окружающей среды. Модель используется для создания прогнозов сенсорного ввода, которые сравниваются с фактическим сенсорным вводом. Это сравнение приводит к ошибкам прогноза, которые затем используются для обновления и пересмотра ментальной модели.

Происхождение

Теоретические предки предиктивного кодирования восходят к 1860 году с концепцией Гельмгольца. бессознательный вывод. Бессознательный вывод относится к идее, что человеческий мозг заполняет визуальную информацию, чтобы понять сцену. Например, если что-то относительно меньше другого объекта в поле зрения, мозг использует эту информацию как вероятный сигнал глубины, так что воспринимающий в конечном итоге (и непроизвольно) ощущает глубину. Понимание восприятия как взаимодействия между сенсорными стимулами (снизу вверх) и концептуальным знанием (сверху вниз) по-прежнему определялось Джером Брунер которые, начиная с 1940-х годов, изучали способы, которыми потребности, мотивации и ожидания влияют на восприятие, исследование, которое стало известно как психология «нового взгляда». В 1981 г. Макклелланд и Румельхарт в их основополагающей статье^[1] исследовали взаимодействие между элементами обработки (линиями и контурами), которые образуют буквы, которые, в свою очередь, образуют слова. Хотя эти особенности предполагают присутствие слова, они обнаружили, что, когда буквы располагались в контексте слова, люди могли идентифицировать их быстрее, чем когда они находились в неслове без семантического контекста. Модель параллельной обработки Макклелланда и Рамелхарта описывает восприятие как встречу нисходящих (концептуальных) и восходящих (сенсорных) элементов.

В конце 1990-х годов идея обработки сверху вниз и снизу вверх была преобразована в вычислительную модель зрения. Рао и Баллард.^[2] Их статья продемонстрировала, что может существовать генеративная модель сцены (нисходящая обработка), которая будет получать обратную связь через сигналы ошибок (насколько визуальный вход отличается от прогноза), что впоследствии приведет к обновлению прогноза. Вычислительная модель смогла воспроизвести хорошо известные эффекты рецептивного поля, а также менее понятные внеклассические эффекты рецептивного поля, такие как конечная остановка. Сегодня области информатики и когнитивной науки включают те же концепции для создания многоуровневых генеративных моделей, лежащих в основе машинного обучения и нейронных сетей.^[3]

Общие рамки

Большая часть исследовательской литературы в этой области посвящена чувственное восприятие, особенно видение, которое легче осмыслить. Однако структура прогнозирующего кодирования также может применяться к различным нейронным системам. Взяв в качестве примера сенсорную систему, мозг решает, казалось бы, неразрешимую проблему моделирования отдаленных причин сенсорного ввода с помощью версии Байесовский вывод. Он делает это путем моделирования предсказаний сенсорных входов более низкого уровня через обратные связи с относительно более высоких уровней корковой иерархии.^[4] Ограниченный статистическими закономерностями внешнего мира (и определенными эволюционно подготовленными предсказаниями), мозг кодирует нисходящие генеративные модели в различных временных и пространственных масштабах, чтобы предсказывать и эффективно подавлять сенсорные сигналы, поднимающиеся с более низких уровней. Сравнение между предсказаниями (априорными) и сенсорным входом (правдоподобие) дает меру различия (например, ошибку предсказания, свободную энергию или неожиданность), которая, если она достаточно велика, превышая уровни ожидаемого статистического шума, приведет к обновлению генеративной модели. так что он лучше предсказывает сенсорную информацию в будущем.

Если вместо этого модель точно предсказывает управляющие сенсорные сигналы, активность на более высоких уровнях нейтрализует активность на более низких уровнях, и апостериорная вероятность модели увеличивается. Таким образом, прогнозирующее кодирование меняет общепринятый взгляд на восприятие как на преимущественно восходящий процесс, предполагая, что оно в значительной степени ограничено предыдущими прогнозами, когда сигналы из внешнего мира только формируют восприятие в той степени, в которой они распространяются вверх по корковой иерархии в форма ошибки прогноза.

Точное взвешивание

Ожидания относительно точности (или обратной дисперсии) входящего сенсорного ввода имеют решающее значение для эффективной минимизации ошибки прогнозирования, поскольку ожидаемая точность данной ошибки прогнозирования может сообщить уверенность в этой ошибке, что влияет на степень взвешивания ошибки при обновлении прогнозов. .^[5] Учитывая, что мир, в котором мы живем, загружен статистический шум ожидания точности должны быть представлены как часть генеративных моделей мозга, и они должны иметь возможность гибко адаптироваться к меняющимся условиям. Например, ожидаемая точность ошибок визуального предсказания, вероятно, варьируется от рассвета до заката, так что ошибкам средь бела дня приписывается большая условная достоверность, чем ошибкам предсказания при наступлении темноты.^[6] Недавно было предложено, что такое взвешивание ошибок прогнозирования пропорционально их предполагаемой точности, по сути, является вниманием,^[7] и что процесс привлечения внимания может быть достигнут нейробиологически с помощью восходящих ретикулярных активирующих систем (ARAS), оптимизирующих «усиление» единиц ошибки предсказания.

Активный вывод

Тот же принцип минимизации ошибок предсказания был использован для объяснения поведения, в котором двигательные действия являются не командами, а нисходящими проприоцептивными предсказаниями. В этой схеме активный вывод классические рефлекторные дуги скоординированы таким образом, чтобы выборочно производить выборку сенсорного ввода способами, которые лучше соответствуют прогнозам, тем самым минимизируя ошибки проприоцептивного прогнозирования.^[7] Действительно, Адамс и др. (2013) рассматривают доказательства, предполагающие, что этот взгляд на иерархическое прогнозирующее кодирование в двигательной системе обеспечивает принципиальную и нервно правдоподобную основу для объяснения агранулярной организации моторной коры.^[8] Эта точка зрения предполагает, что «перцептивные и моторные системы не следует рассматривать как отдельные, а вместо этого как единую активную машину логического вывода, которая пытается предсказать свои сенсорные входы во всех областях: зрительной, слуховой, соматосенсорной, интероцептивной и, в случае моторной системы. , проприоцептивная. "^[8]

Нейронная теория в прогнозирующем кодировании

Оценка эмпирических данных, предлагающих неврологически правдоподобную основу для прогнозирующего кодирования, - это обширная и разнообразная задача. Во-первых, и согласно модели, прогнозирующее кодирование происходит на каждом итеративном шаге в перцептивных и когнитивных процессах; соответственно, проявления прогностического кодирования в мозге включают генетику, специфическую цитоархитектуру клеток, системные сети нейронов и анализ всего мозга. Из-за такого диапазона специфичности были применены различные методы исследования нейронных механизмов прогнозирующего кодирования, где это возможно; В более общем плане, однако, и, по крайней мере, применительно к людям, существуют значительные методологические ограничения для исследования потенциальных доказательств, и большая часть работы основана на компьютерном моделировании микросхем в головном мозге. Тем не менее, была проведена значительная (теоретическая) работа, которая была применена для понимания механизмов прогнозирующего кодирования в мозге. Этот раздел будет сосредоточен на конкретных доказательствах, поскольку они относятся к феномену предсказательного кодирования, а не на аналогах, таких как гомеостаз (которые, тем не менее, являются неотъемлемой частью нашего общего понимания байесовского вывода, но уже сильно поддерживаются; см. Кларк для обзора^[4]).

Большая часть ранних работ, в которых применялась структура прогнозирующего кодирования к нейронным механизмам, исходила от сенсорных нейронов, особенно в зрительной коре.^[2]^[9]

В более общем плане, однако, теория, по-видимому, требует (по крайней мере) двух типов нейронов (на каждом уровне перцепционной иерархии): один набор нейронов, кодирующих входящие сенсорные данные, так называемые проекции с прямой связью; один набор нейронов, которые отправляют прогнозы, так называемые проекции с обратной связью. Важно отметить, что эти нейроны также должны обладать свойствами обнаружения ошибок; какой класс нейронов обладает этими свойствами, все еще обсуждается.^[10]^[11] Такого рода нейроны нашли поддержку в поверхностных и неповерхностных пирамидных нейронах.

На более общем уровне мозга есть доказательства того, что разные корковые слои (также известные как пластинки) могут способствовать интеграции проекций с прямой и обратной связью по иерархиям. Эти корковые слои, разделенные на гранулярные, агранулярные и дисгранулярные, которые содержат субпопуляции нейронов, упомянутых выше, делятся на 6 основных слоев. Цитоархитектура в этих слоях одинакова, но они различаются по слоям. Например, слой 4 зернистой коры содержит гранулярные клетки, которые являются возбуждающими и распределяют таламокортикальные входы в остальную часть коры. По одной модели:

«... предсказывающие нейроны ... в глубоких слоях агранулярной коры управляют активными выводами, посылая сенсорные предсказания через проекции ... в супрагранулярные слои дисгранулярной и зернистой сенсорной коры. Нейроны с ошибкой предсказания… в надгранулярных слоях зернистой коры вычисляют разницу между предсказанным и полученным сенсорным сигналом и посылают сигналы с ошибкой предсказания через проекции… обратно в глубокие слои агранулярных областей коры. Прецизионные ячейки ... динамически настраивают выигрыш от предсказаний и ошибок предсказания, тем самым придавая этим сигналам уменьшенный (или, в некоторых случаях, больший) вес в зависимости от относительной уверенности в убывающих предсказаниях или надежности входящих сенсорных сигналов ».^[12]

В общем, нейронные доказательства все еще находятся в зачаточном состоянии.

Применение предиктивного кодирования

Восприятие

Эмпирические данные о кодировании с предсказаниями наиболее надежны для обработки восприятия. Еще в 1999 году Рао и Баллард предложили иерархическую визуальная обработка модель, в которой зрительная область коры высшего порядка отправляет предсказания, а прямые связи несут остаточные ошибки между предсказаниями и фактическими действиями нижнего уровня.^[2] Согласно этой модели, каждый уровень в сети иерархической модели (кроме самого низкого уровня, который представляет изображение) пытается предсказать ответы на следующем более низком уровне через соединения обратной связи, и сигнал ошибки используется для корректировки оценки входных данных. сигнал на каждом уровне одновременно.^[2] Эмберсон и др. установили модуляцию сверху вниз у младенцев, используя кросс-модальную парадигму аудиовизуального упущения, определив, что даже младенческий мозг ожидает от будущих сенсорных входов, которые передаются вниз по потоку от зрительной коры, и способен к обратной связи, основанной на ожиданиях.^[13] Данные функциональной спектроскопии в ближней инфракрасной области (fNIRS) показали, что младенец затылочная кора ответил на неожиданное визуальное упущение (без ввода визуальной информации), но не на ожидаемое визуальное упущение. Эти результаты показывают, что в иерархически организованной системе восприятия нейроны более высокого порядка посылают предсказания нейронам более низкого порядка, которые, в свою очередь, посылают обратно сигнал ошибки предсказания.

Перехват

Существовало несколько конкурирующих моделей роли предсказательного кодирования в перехват.

В 2013 году Анил Сет предположил, что наши субъективные состояния чувств, также известные как эмоции, генерируются прогностическими моделями, которые активно строятся на основе причинно-следственных интероцептивных оценок.^[11] В отношении того, как мы связываем внутренние состояния других людей с причинами, Саша Ондобака, Джеймс Килнер и Карл Фристон (2015) предположили, что принцип свободной энергии требует, чтобы мозг производил непрерывную серию предсказаний с целью уменьшения количества предсказаний. ошибка, которая проявляется как «свободная энергия».^[14] Эти ошибки затем используются для моделирования предвосхищающей информации о том, каким будет состояние внешнего мира, и атрибуции причин этого мирового состояния, включая понимание причин поведения других. Это особенно необходимо, потому что для создания этих атрибутов наши мультимодальные сенсорные системы нуждаются в интероцептивных предсказаниях для самоорганизации. Поэтому Ондобака утверждает, что прогнозирующее кодирование является ключом к пониманию внутреннего состояния других людей.

В 2015 г. Лиза Фельдман Барретт и W. Kyle Simmons (2015) предложили модель Embodied Predictive Interoception Coding, структуру, которая объединяет байесовские принципы активного вывода с физиологической структурой кортикокортикальных связей. Используя эту модель, они постулировали, что агранулярная висцеромоторная кора отвечает за создание прогнозов интероцепции, тем самым определяя опыт интероцепции.

В 2017 году, вопреки индуктивному представлению о том, что категории эмоций биологически различны, Барретт (2017) предложил теорию сконструированной эмоции, которая представляет собой учет того, что категория биологической эмоции конструируется на основе концептуальной категории - скопления примеров, разделяющих цель. .^[15]^[16] В модели прогнозирующего кодирования Барретт выдвигает гипотезу о том, что при интероцепции наш мозг регулирует наши тела, активируя «воплощенные симуляции» (полные представления сенсорного опыта), чтобы предвидеть то, что наш мозг предсказывает, что внешний мир бросит на нас сенсорно и как мы ответим на это действием. Эти симуляции либо сохраняются, если, основываясь на предсказаниях нашего мозга, они хорошо подготавливают нас к тому, что на самом деле впоследствии происходит во внешнем мире, либо они и наши предсказания корректируются, чтобы компенсировать их ошибку по сравнению с тем, что на самом деле происходит во внешнем мире. мир и насколько хорошо мы были к нему подготовлены. Затем, в процессе корректировки методом проб и ошибок, наши тела находят сходство целей в определенных успешных имитационных симуляторах и группируют их по концептуальным категориям. Каждый раз, когда возникает новый опыт, наш мозг использует эту прошлую историю корректировки методом проб и ошибок, чтобы сопоставить новый опыт с одной из категорий накопленных исправленных симуляций, с которыми он больше всего похож. Затем они применяют исправленную симуляцию этой категории к новому опыту в надежде подготовить наши тела к остальному опыту. Если это не так, прогноз, моделирование и, возможно, границы концептуальной категории пересматриваются в надежде на более высокую точность в следующий раз, и процесс продолжается. Барретт предполагает, что, когда ошибка прогнозирования для определенной категории симуляций для x-подобных переживаний сведена к минимуму, в результате получается симуляция с корректировкой, в которой тело будет воспроизводиться для каждого x-подобного переживания, что приведет к полному представление чувственного опыта - эмоции. В этом смысле Барретт предлагает конструировать наши эмоции, потому что структура концептуальных категорий, которую наш мозг использует для сравнения нового опыта и выбора соответствующей прогностической сенсорной симуляции для активации, строится на ходу.

Вызовы

Как механистическая теория, прогнозирующее кодирование не было нанесено на карту физиологически на нейрональном уровне. Одной из самых больших проблем теории была неточность того, как именно работает минимизация ошибок предсказания.^[17] В некоторых исследованиях увеличение СМЕЛЫЙ signal интерпретируется как сигнал ошибки, в то время как в других он указывает на изменения во входном представлении.^[17] Ключевой вопрос, который необходимо решить, заключается в том, что именно является сигналом ошибки и как он вычисляется на каждом уровне обработки информации.^[18] Еще одна проблема, которая была поставлена, - это вычислительная управляемость прогнозирующего кодирования. По словам Квистхаута и ван Ройя, подвычисления на каждом уровне структуры прогнозного кодирования потенциально скрывают вычислительно трудноразрешимую проблему, которая составляет «непреодолимые препятствия», которые разработчикам вычислительного моделирования еще предстоит преодолеть.^[19] Рэнсом и Фазельпур (2015) указывают «Три проблемы для теории внимания с прогнозирующим кодированием».^[20]

Дальнейшие исследования могут быть сосредоточены на выяснении нейрофизиологического механизма и вычислительной модели предсказательного кодирования.