Оперантное кондиционирование - Википедия - Operant conditioning

Оперантного кондиционирования

Вымирание

Армирование
Повысить поведение

Наказание
Снижение поведения

Положительное подкрепление
Добавьте аппетитный стимул
следуя правильному поведению

Отрицательное подкрепление

Положительное наказание
Добавить вредный стимул
следующее поведение

Отрицательное наказание
Убрать аппетитный стимул
следующее поведение

Побег
Удалите вредный раздражитель
следуя правильному поведению

Активное избегание
Поведение избегает вредных раздражителей

Оперантного кондиционирования (также называемый инструментальная подготовка) представляет собой тип процесса ассоциативного обучения, посредством которого сила поведения изменяется за счет поощрения или наказания. Это также процедура, которая используется для такого обучения.

Хотя оперант и классическое кондиционирование оба связаны с поведением, контролируемым стимулами окружающей среды, они различаются по своей природе. При оперантном обусловливании стимулы присутствуют, когда поведение, которое награждается или наказывается, контролирует это поведение. Например, ребенок может научиться открывать коробку, чтобы положить внутрь сладости, или научиться не прикасаться к горячей плите; в оперантном выражении ящик и печь являются «различительными раздражителями». Оперантное поведение называется «добровольным». Ответы находятся под контролем организма и являются операторами. Например, ребенок может оказаться перед выбором: открыть коробку или погладить щенка.

Напротив, классическая обусловленность включает непроизвольное поведение, основанное на сочетании стимулов с биологически значимыми событиями. Ответы находятся под контролем некоторых стимулов, потому что они являются рефлексами, автоматически вызываемыми соответствующими стимулами. Например, вид сладостей может вызвать у ребенка слюноотделение, или звук хлопка двери может сигнализировать рассерженному родителю, заставляя ребенка дрожать. Слюноотделение и дрожь не действуют; они не подкрепляются своими последствиями, и они не «выбираются» добровольно.

Однако оба вида обучения могут влиять на поведение. Классически обусловленные стимулы - например, изображение конфет на коробке - могут усилить оперантную обусловленность, побуждая ребенка подойти и открыть коробку. Исследования показали, что это благоприятное явление в случаях, когда оперантное поведение подвержено ошибкам.^[1]

В изучении обучения животных в 20-м веке доминировал анализ этих двух видов обучения:^[2] и они по-прежнему лежат в основе анализа поведения. Они также были применены для изучения социальная психология, помогая прояснить определенные явления, такие как эффект ложного консенсуса.^[1]

Историческая справка

Эдвард Ли Торндайк в 1912 г.

Закон действия Торндайка

Оперантное кондиционирование, иногда называемое инструментальное обучение, был впервые всесторонне изучен Эдвард Л. Торндайк (1874–1949), наблюдавший за поведением кошек, пытающихся вырваться из самодельных коробок-головоломок.^[3] Кошка могла выбраться из ящика простым ответом, например, потянув за шнур или толкнув шест, но когда ее сначала сдерживали, кошкам требовалось много времени, чтобы выбраться. При повторных испытаниях неэффективные ответы возникали реже, а успешные - чаще, поэтому кошки убегали все быстрее и быстрее.^[3] Торндайк обобщил этот вывод в своей закон силы, в котором говорится, что поведение, за которым следуют удовлетворительные последствия, как правило, повторяется, а поведение, которое приводит к неприятным последствиям, с меньшей вероятностью повторяется. Короче, некоторые последствия усилить поведение и некоторые последствия ослабить поведение. Построив график времени побега против номера испытания, Торндайк произвел первое известное животное. кривые обучения через эту процедуру.^[4]

Похоже, что люди учатся многим простым формам поведения посредством процесса, изученного Торндайком, который теперь называется оперантным условием. То есть ответы сохраняются, когда они приводят к успешному результату, и отбрасываются, когда они этого не делают, или когда они вызывают отвращение. Обычно это происходит без планирования какого-либо «учителя», но оперантное обусловливание использовалось родителями в обучении своих детей на протяжении тысяч лет.^[5]

Б. Ф. Скиннер

Б.Ф. Скиннер на факультете психологии Гарварда, около 1950 г.

Б.Ф. Скиннер (1904–1990) упоминается как отец оперантной обусловленности, и его работы часто цитируются в связи с этой темой. Его книга 1938 года «Поведение организмов: экспериментальный анализ»,^[6] начал свое пожизненное исследование оперантного обусловливания и его применения к поведению человека и животных. Следуя идеям Эрнст Мах Скиннер отверг ссылку Торндайка на ненаблюдаемые психические состояния, такие как удовлетворение, построив свой анализ на наблюдаемом поведении и его столь же наблюдаемых последствиях.^[7]

Скиннер считал, что классическая обусловленность слишком упрощена, чтобы ее можно было использовать для описания чего-то столь сложного, как человеческое поведение. По его мнению, оперантное кондиционирование лучше описывает человеческое поведение, поскольку оно исследует причины и следствия преднамеренного поведения.

Чтобы реализовать свой эмпирический подход, Скиннер изобрел рабочая камера кондиционирования, или же "Коробка Скиннера", в котором такие субъекты, как голуби и крысы, были изолированы и могли подвергаться тщательно контролируемым раздражителям. В отличие от коробки-головоломки Торндайка, такое расположение позволяло субъекту давать один или два простых повторяемых ответа, и частота таких ответов стала основным для Скиннера. поведенческая мера.^[8] Другое изобретение, кумулятивный регистратор, дает графическую запись, по которой можно оценить эти показатели отклика. Эти записи были первичными данными, которые Скиннер и его коллеги использовали для изучения влияния различных схем подкрепления на скорость реакции.^[9] График подкрепления можно определить как «любую процедуру, которая доставляет подкрепление организму в соответствии с каким-то четко определенным правилом».^[10] Эффекты расписания стали, в свою очередь, основными выводами, на основе которых Скиннер разработал свою концепцию оперантного обусловливания. Он также опирался на многие менее формальные наблюдения за поведением людей и животных.^[11]

Многие работы Скиннера посвящены применению оперантной обусловленности к человеческому поведению.^[12] В 1948 году он опубликовал Уолден Два, вымышленный рассказ о мирном, счастливом, продуктивном сообществе, организованном вокруг его принципов кондиционирования.^[13] В 1957 г. Скиннер опубликовано Вербальное поведение,^[14] который распространил принципы оперантного обусловливания на язык, форму человеческого поведения, которая ранее совершенно иначе анализировалась лингвистами и другими. Скиннер определил новые функциональные отношения, такие как «мандаты» и «такты», чтобы уловить некоторые основы языка, но он не ввел никаких новых принципов, рассматривая вербальное поведение, как любое другое поведение, контролируемое его последствиями, которые включают реакции аудитории говорящего.

Концепции и процедуры

Истоки оперантного поведения: оперантная изменчивость

Оперантное поведение называется «испускаемым»; то есть изначально он не вызывается каким-либо конкретным стимулом. Таким образом, можно спросить, почему это вообще происходит. Ответ на этот вопрос подобен ответу Дарвина на вопрос о происхождении «новой» телесной структуры, а именно вариации и отбора. Точно так же поведение человека меняется от момента к моменту, в таких аспектах, как конкретные участвующие движения, величина приложенной силы или время реакции. Вариации, которые приводят к подкреплению, усиливаются, и если подкрепление постоянное, поведение, как правило, остается стабильным. Однако изменчивость поведения может быть изменена путем манипулирования определенными переменными.^[15]

Изменение оперантного поведения: подкрепление и наказание

Подкрепление и наказание - это основные инструменты, с помощью которых модифицируется оперантное поведение. Эти термины определяются по их влиянию на поведение. Либо может быть положительным, либо отрицательным.

Положительное подкрепление и отрицательное подкрепление увеличивают вероятность поведения, которому они следуют, в то время как положительное наказание и отрицательное наказание уменьшить вероятность поведения, которому они следуют.

Другая процедура называется «угасание».

Вымирание возникает, когда ранее подкрепленное поведение больше не подкрепляется положительным или отрицательным подкреплением. Во время вымирания такое поведение становится менее вероятным. Случайное подкрепление может привести к еще более длительной задержке до исчезновения поведения из-за фактора обучения, состоящего в том, что для получения подкрепления становится необходим фактор повторения, по сравнению с подкреплением, предоставляемым при каждой возможности перед исчезновением.^[16]

Всего существует пять последствий.

Положительное подкрепление происходит, когда поведение (ответ) награждение или за поведением следует другой стимулирующий стимул, который увеличивает частоту такого поведения.^[17] Например, если крыса в Коробка Скиннера получает пищу, когда нажимает на рычаг, скорость его нажатия возрастает. Эта процедура обычно называется просто подкрепление.
Отрицательное подкрепление (a.k.a. escape) происходит, когда за поведением (ответом) следует удаление аверсивный стимул, тем самым увеличивая частоту исходного поведения. В эксперименте с ящиком Скиннера отвращающим стимулом может быть непрерывный громкий шум внутри ящика; отрицательное подкрепление произойдет, когда крыса нажмет на рычаг, чтобы выключить шум.
Положительное наказание (также называемое «наказанием условной стимуляцией») происходит, когда за поведением (реакцией) следует отвращающий стимул. Пример: боль от порка, что часто приводит к снижению этого поведения. Положительное наказание термин сбивает с толку, поэтому процедуру обычно называют «наказанием».
Отрицательное наказание (штраф) (также называемый «наказанием условным отказом») происходит, когда за поведением (реакцией) следует устранение стимула. Пример: забрать игрушку у ребенка из-за нежелательного поведения ребенка, что приведет к уменьшению нежелательного поведения.
Вымирание возникает, когда ранее подкрепленное поведение (реакция) больше не действует. Пример: крысе сначала дают еду много раз за нажатие на рычаг, пока экспериментатор не перестанет выдавать еду в качестве награды. Крыса обычно нажимала на рычаг реже и затем останавливалась. Тогда нажатие на рычаг будет «погашено».

Важно отметить, что об акторах (например, о крысе) не говорят как о подкреплении, наказании или подавлении; это действия которые усилены, наказаны или погашены. Подкрепление, наказание и исчезновение - это не термины, использование которых ограничено лабораторией. Естественно возникающие последствия также могут усиливать, наказывать или подавлять поведение и не всегда планируются или реализуются намеренно.

Графики армирования

Графики армирования - это правила, контролирующие доставку арматуры. Правила определяют либо время, когда подкрепление должно быть доступно, или количество ответов, которые необходимо сделать, либо и то, и другое. Возможно множество правил, но следующие являются наиболее основными и часто используемыми.^[18]^[9]

График с фиксированным интервалом: подкрепление происходит после первого ответа по истечении фиксированного времени после предыдущего подкрепления. Этот график дает образец ответа «остановка бега»; то есть после тренировки по этому графику организм обычно делает паузу после подкрепления, а затем начинает быстро реагировать, когда приближается время для следующего подкрепления.
График с переменным интервалом: подкрепление происходит после первого ответа по истечении переменного времени с момента предыдущего подкрепления. Этот график обычно дает относительно стабильную скорость реакции, которая зависит от среднего времени между подкреплениями.
График с фиксированным соотношением: подкрепление происходит после того, как с момента предыдущего подкрепления было отправлено фиксированное количество ответов. Организм, тренированный по этому графику, обычно делает паузу на некоторое время после подкрепления, а затем реагирует с высокой скоростью. Если требование ответа низкое, паузы может не быть; если потребность в реакции высока, организм может вообще перестать отвечать.
График с переменным соотношением: подкрепление происходит после того, как с момента предыдущего подкрепления было получено переменное количество ответов. Этот график обычно дает очень высокую и постоянную скорость ответа.
Непрерывное подкрепление: подкрепление происходит после каждого ответа. Организмы обычно реагируют настолько быстро, насколько это возможно, учитывая время, необходимое для получения и потребления подкрепления, до тех пор, пока они не насытятся.

Факторы, влияющие на эффективность подкрепления и наказания

Эффективность подкрепления и наказания можно изменить.

Сытость / депривация: Эффективность положительного или «аппетитного» стимула будет снижена, если человек получил достаточно этого стимула, чтобы удовлетворить его / ее аппетит. Противоположный эффект произойдет, если человек лишится этого стимула: тогда эффективность последствий возрастет. Человек с полным желудком не будет чувствовать себя таким мотивированным, как голодный.^[19]
Непосредственность: Немедленное последствие более эффективно, чем отсроченное. Если дать собаке угощение для сидения в течение пяти секунд, собака научится быстрее, чем если бы угощение было дано через тридцать секунд.^[20]
Непредвиденные обстоятельства: Чтобы быть наиболее эффективным, подкрепление должно происходить постоянно после ответов, а не в другое время. Обучение может быть медленнее, если подкрепление носит прерывистый характер, то есть следует только за некоторыми экземплярами одного и того же ответа. Периодически подкрепляемые ответы обычно гаснут медленнее, чем ответы, которые всегда подкреплялись.^[19]
Размер: Размер или количество стимула часто влияет на его силу в качестве подкрепления. Люди и животные занимаются анализом затрат и выгод. Если рычажный пресс приносит десять пищевых гранул, нажатию рычага можно научиться быстрее, чем если пресс дает только одну гранулу. Куча четвертей из игрового автомата может заставить игрока тянуть за рычаг дольше одной четверти.

Большинство этих факторов выполняют биологические функции. Например, процесс насыщения помогает организму поддерживать стабильную внутреннюю среду (гомеостаз ). Например, когда организм лишен сахара, вкус сахара является эффективным усилителем. Когда организм содержание сахара в крови достигает или превышает оптимальный уровень, вкус сахара становится менее эффективным или даже неприятным.

Формирование

Формирование - это метод кондиционирования, который часто используется при дрессировке животных и в обучении невербальных людей. Это зависит от оперантной изменчивости и подкрепления, как описано выше. Тренер начинает с определения желаемого конечного (или «целевого») поведения. Затем дрессировщик выбирает поведение, которое животное или человек уже издает с некоторой вероятностью. Затем форма этого поведения постепенно изменяется в ходе последовательных испытаний за счет усиления поведения, которое все больше и больше приближается к целевому поведению. Когда целевое поведение, наконец, проявляется, его можно усилить и поддерживать, используя график подкрепления.

Безусловное подкрепление

Неконтролируемое подкрепление - это доставка подкрепляющих стимулов независимо от поведения организма. Неконтролируемое подкрепление может использоваться в попытке уменьшить нежелательное целевое поведение путем усиления множества альтернативных ответов при одновременном подавлении целевого ответа.^[21] Поскольку никакое измеряемое поведение не идентифицируется как подкрепляемое, существует разногласие по поводу использования термина «непредвиденное« подкрепление ».^[22]

Стимул-контроль оперантного поведения

Хотя изначально оперантное поведение излучается без идентифицированной ссылки на конкретный стимул, во время оперантного обусловливания операнты попадают под контроль стимулов, которые присутствуют при подкреплении поведения. Такие стимулы называются «различительными стимулами». Так называемый "трехсрочное непредвиденное обстоятельство "- результат. То есть различительные стимулы создают повод для реакций, которые производят вознаграждение или наказание. Пример: крысу можно обучить нажимать на рычаг только тогда, когда загорается свет; собака бросается на кухню, когда слышит погремушку пакета с едой; ребенок тянется за конфетой, когда видит ее на столе.

Дискриминация, обобщение и контекст

Большая часть поведения находится под контролем стимулов. Можно выделить несколько аспектов этого:

Дискриминация обычно возникает, когда реакция усиливается только при наличии определенного стимула. Например, голубя можно кормить за то, что он клюет на красный свет, а не на зеленый; как следствие, он клюет красный и перестает клевать зеленый. Было изучено множество сложных комбинаций раздражителей и других условий; например, организм может быть усилен по интервальному графику при наличии одного стимула и по графику соотношения при наличии другого.
Обобщение это тенденция реагировать на раздражители, похожие на ранее обученный различительный раздражитель. Например, обученный клевать «красный» голубь может также клевать «розовый», но обычно менее сильно.
Контекст относится к стимулам, которые постоянно присутствуют в ситуации, например, в стенах, столах, стульях и т. д. в комнате или внутри камеры оперантного кондиционирования. Контекстные стимулы могут управлять поведением так же, как и дискриминационные стимулы, хотя обычно более слабые. Поведение, усвоенное в одном контексте, может отсутствовать или изменяться в другом. Это может вызвать трудности для поведенческой терапии, поскольку поведение, усвоенное в терапевтических условиях, может не проявляться в других ситуациях.

Поведенческие последовательности: условное подкрепление и цепочка

Большую часть поведения нелегко описать в терминах индивидуальных реакций, подкрепляемых один за другим. Объем оперантного анализа расширяется за счет идеи поведенческих цепочек, которые представляют собой последовательности ответов, связанных вместе трехчленными условностями, определенными выше. Цепочка основана на экспериментально продемонстрированном факте, что различительный стимул не только создает повод для последующего поведения, но также может усилить поведение, которое ему предшествует. То есть различительный раздражитель также является «условным подкреплением». Например, свет, который задает повод для нажатия рычага, можно использовать для усиления «поворота» в присутствии шума. В результате получается последовательность «шум - разворот - свет - нажатие рычага - еда». Можно построить гораздо более длинные цепочки, добавив больше стимулов и ответов.

Побег и избегание

При обучении избеганию поведение прекращает (отталкивающий) стимул. Например, защита глаз от солнечного света прекращает (отталкивающую) стимуляцию яркого света в глазах. (Это пример негативного подкрепления, определенного выше.) Поведение, которое поддерживается за счет предотвращения стимула, называется «избеганием», как, например, надевание солнцезащитных очков перед выходом на улицу. Поведение избегания порождает так называемый «парадокс избегания», ибо, может быть, спросят, как отсутствие стимула может служить подкреплением? К этому вопросу обращаются несколько теорий избегания (см. Ниже).

Обычно используются два типа экспериментальных настроек: дискриминированное обучение и обучение свободному избеганию.

Дискриминационное обучение избеганию

Эксперимент дискриминированного избегания включает в себя серию испытаний, в которых за нейтральным стимулом, таким как свет, следует отталкивающий стимул, такой как шок. После появления нейтрального стимула оперантный ответ, такой как нажатие на рычаг, предотвращает или прекращает отвращение к стимулу. В ранних испытаниях субъект не реагирует до тех пор, пока не сработает отталкивающий стимул, поэтому эти ранние испытания называются испытаниями «побега». По мере обучения субъект начинает реагировать на нейтральный стимул и, таким образом, предотвращает возникновение отталкивающего стимула. Такие испытания называются «испытаниями избегания». Говорят, что этот эксперимент включает классическое обусловливание, потому что нейтральный CS (условный стимул) сочетается с отталкивающим US (безусловный стимул); эта идея лежит в основе двухфакторной теории обучения избеганию, описанной ниже.

Обучение избеганию свободных оперантов

При свободном оперантном избегании субъект периодически получает отвращающий стимул (часто электрический шок), если не будет оперантного ответа; ответ задерживает начало шока. В этой ситуации, в отличие от дискриминированного избегания, никакой предшествующий стимул не сигнализирует о шоке. Два важных временных интервала определяют скорость обучения избеганию. Это первый интервал S-S (шок-шок). Это время между последовательными ударами при отсутствии реакции. Второй интервал - это интервал R-S (ответ-шок). Это определяет время, на которое оперантный ответ задерживает начало следующего разряда. Обратите внимание, что каждый раз, когда субъект выполняет оперантный ответ, интервал R-S без шока начинается заново.

Двухпроцессная теория избегания

Эта теория была первоначально предложена для объяснения различенного обучения избеганию, при котором организм учится избегать отталкивающего стимула, избегая сигнала для этого стимула. Здесь задействованы два процесса: классическое кондиционирование сигнала с последующим оперантным кондиционированием реакции ухода:

а) Классическая обусловленность страха. Первоначально организм испытывает сочетание CS с аверсивным УЗИ. Теория предполагает, что это соединение создает ассоциацию между CS и США посредством классической обусловленности, и из-за отталкивающей природы США CS вызывает условную эмоциональную реакцию (CER) - «страх». б) Усиление оперантной реакции снижением страха. В результате первого процесса CS теперь сигнализирует о страхе; эта неприятная эмоциональная реакция служит для мотивации оперантных ответов, а ответы, завершающие CS, подкрепляются прекращением страха. Обратите внимание, что в теории не говорится, что организм «избегает» США в смысле ожидания их, а скорее, что организм «избегает» отвращающего внутреннего состояния, вызванного CS. Некоторые экспериментальные результаты, похоже, противоречат двум -факторная теория. Например, поведение избегания часто гаснет очень медленно, даже когда первоначальное соединение CS-US больше не возникает, поэтому можно ожидать, что реакция страха исчезнет (см. Классическое кондиционирование ). Кроме того, животные, которые научились избегать, часто демонстрируют мало признаков страха, предполагая, что бегство от страха не является необходимым для сохранения поведения избегания.^[23]

Оперантная или "однофакторная" теория

Некоторые теоретики предполагают, что поведение избегания может быть просто особым случаем оперантного поведения, поддерживаемого его последствиями. С этой точки зрения идея «последствий» расширена, чтобы включить чувствительность к структуре событий. Таким образом, при избегании следствием реакции является снижение скорости аверсивной стимуляции. Действительно, экспериментальные данные свидетельствуют о том, что «пропущенный шок» воспринимается как стимул и может действовать как подкрепление. Когнитивные теории избегания продвигают эту идею на шаг вперед. Например, крыса начинает «ожидать» шока, если она не может нажать на рычаг, и «не ожидать шока», если нажимает на него, и поведение избегания усиливается, если эти ожидания подтверждаются.^[23]

Оперантное накопление

Оперантное накопление относится к наблюдению, что крысы, усиленные определенным образом, могут позволить пищевым гранулам накапливаться в пищевом лотке вместо того, чтобы извлекать эти гранулы. В этой процедуре извлечение гранул всегда требовало одноминутного периода. вымирание во время которого не было дополнительных пищевых гранул, но можно было употребить те, которые были накоплены ранее. Этот вывод, по-видимому, противоречит обычному выводу о том, что крысы ведут себя импульсивно в ситуациях, когда есть выбор между меньшим пищевым объектом сразу и большим пищевым объектом после некоторой задержки. Видеть графики армирования.^[24]

Нейробиологические корреляты

Первые научные исследования, определяющие нейроны которые реагировали таким образом, что предполагали, что они кодируют условные стимулы, пришли из работы Махлона деЛонга^[25]^[26] и Р.Т. Ричардсон.^[26] Они показали, что базальное ядро нейроны, которые выделяют ацетилхолин в целом кора головного мозга, активируются вскоре после условного стимула или после основного вознаграждения, если условного стимула нет. Эти нейроны одинаково активны в отношении положительных и отрицательных подкреплений, и было показано, что они связаны с нейропластичность во многих корковый регионы.^[27] Также существуют доказательства того, что дофамин активируется в аналогичное время. Существует множество доказательств того, что дофамин участвует как в подкрепляющем, так и в аверсивном обучении.^[28] Дофаминовые пути гораздо более плотно проецируются на лобная кора регионы. Холинергический выступы, напротив, плотные даже в задних отделах коры, таких как первичная зрительная кора. Исследование пациентов с болезнь Паркинсона состояние, приписываемое недостаточному действию дофамина, дополнительно иллюстрирует роль дофамина в положительном подкреплении.^[29] Исследование показало, что пациенты, не принимавшие лекарства, с большей готовностью учились с неприятными последствиями, чем с положительным подкреплением. Пациенты, которые принимали лекарства, показали обратное: положительное подкрепление оказалось более эффективной формой обучения при высокой активности дофамина.

Предполагается, что в основе подкрепления лежит нейрохимический процесс с участием дофамина. Когда организм испытывает усиливающий раздражитель, дофамин активируются проводящие пути в мозге. Эта сеть путей "выпускает короткий импульс дофамина на многих людей. дендриты, таким образом транслируя глобальный сигнал подкрепления постсинаптические нейроны."^[30] Это позволяет недавно активированным синапсам повысить свою чувствительность к эфферентным (проводящим наружу) сигналам, тем самым увеличивая вероятность возникновения недавних реакций, предшествовавших подкреплению. Эти реакции статистически наиболее вероятно были поведением, ответственным за успешное достижение подкрепления. Но когда применение подкрепления либо менее немедленное, либо менее случайное (менее последовательное), способность дофамина воздействовать на соответствующие синапсы снижается.

Вопросы о законе действия

Ряд наблюдений, кажется, показывает, что оперантное поведение может быть установлено без подкрепления в смысле, определенном выше. Чаще всего упоминается феномен автоформирование (иногда называемое «отслеживанием знаков»), при котором за стимулом постоянно следует подкрепление, и, как следствие, животное начинает реагировать на стимул. Например, загорается клавиша ответа, а затем предлагается еда. Когда это повторяется несколько раз, голубь начинает клевать ключ, даже если еда приходит независимо от того, клюет птица или нет. Точно так же крысы начинают брать в руки небольшие предметы, например рычаг, когда пища оказывается поблизости.^[31]^[32] Поразительно, но голуби и крысы сохраняют такое поведение даже тогда, когда клевание клавиши или нажатие на рычаг приводит к уменьшению количества пищи (тренировка бездействия).^[33]^[34] Еще одно очевидное оперантное поведение, которое проявляется без подкрепления, - это контразагрузка.

Эти и другие наблюдения, по-видимому, противоречат закон силы, и они побудили некоторых исследователей предложить новые концепции оперантного подкрепления (например,^[35]^[36]^[37]) Более общий взгляд состоит в том, что автофигурка является примером классическое кондиционирование; Фактически процедура автоформирования стала одним из наиболее распространенных способов измерения классической обусловленности. С этой точки зрения, на многие формы поведения могут влиять как классические случайности (стимул-реакция), так и оперантные случайности (реакция-подкрепление), и задача экспериментатора состоит в том, чтобы выяснить, как они взаимодействуют.^[38]

Приложения

Подкрепление и наказание повсеместно используются в человеческих социальных взаимодействиях, и было предложено и реализовано очень много приложений оперантных принципов. Ниже приведены некоторые примеры.

Зависимость и зависимость

Положительное и отрицательное подкрепление играет центральную роль в развитии и поддержании зависимость и лекарственная зависимость. Наркотик, вызывающий привыкание, - это по сути вознаграждение; то есть он функционирует как первичное положительное подкрепление употребления наркотиков. Система вознаграждения мозга назначает это стимулирующая значимость (т. е. "желаемый" или "желаемый"),^[39]^[40]^[41] поэтому по мере развития зависимости лишение наркотика приводит к влечению. Кроме того, стимулы, связанные с употреблением наркотиков - например, вид шприца и место использования - становятся связанными с интенсивным подкреплением, вызываемым наркотиком.^[39]^[40]^[41] Эти ранее нейтральные стимулы приобретают несколько свойств: их появление может вызывать тягу, и они могут стать условные положительные подкрепления продолжения использования.^[39]^[40]^[41] Таким образом, если зависимый человек сталкивается с одним из этих наркотических сигналов, тяга к соответствующему наркотику может появиться снова. Например, агентства по борьбе с наркотиками ранее использовали плакаты с изображением принадлежности для наркотиков как попытка показать опасность употребления наркотиков. Однако такие плакаты больше не используются из-за эффекта стимулирования рецидив при виде стимулов, изображенных на плакатах.

У наркозависимых людей отрицательное подкрепление возникает, когда самоуправляемый чтобы облегчить или «избежать» симптомов физическая зависимость (например., тремор и потливость) и / или психологическая зависимость (например., ангедония, беспокойство, раздражительность и беспокойство), возникающие во время состояния отмена наркотиков.^[39]

Дрессировка животных

Дрессировщики и владельцы домашних животных применяли принципы и практики оперантного кондиционирования задолго до того, как эти идеи были названы и изучены, и дрессировка животных до сих пор является одним из самых ярких и убедительных примеров оперантного контроля. Из концепций и процедур, описанных в этой статье, наиболее заметными являются следующие: (а) наличие первичного подкрепления (например, мешок собачьих вкусняшек); (б) использование вторичного подкрепления (например, щелчок кликера сразу после желаемого ответа, а затем вкуснятина); (c) случайность, гарантирующая, что подкрепление (например, кликер) следует желаемому поведению, а не чему-то еще; (г) формирование, например, при постепенном обучении собаки прыгать все выше и выше; (д) периодическое подкрепление, например, при постепенном уменьшении частоты подкрепления, чтобы вызвать стойкое поведение без насыщения; (е) сцепление, когда сложное поведение постепенно строится из более мелких единиц.^[42]

Пример дрессировки животных из Seaworld, связанный с оперантной обусловленностью ^[43]

Дрессировка животных влияет на положительное и отрицательное подкрепление. График подкреплений может сыграть большую роль в дрессировке животных.

Прикладной анализ поведения

Прикладной анализ поведения - дисциплина, начатая Б. Ф. Скиннер который применяет принципы обусловливания к модификации социально значимого человеческого поведения. В нем используются основные концепции теории кондиционирования, включая условный раздражитель (С.^C), дискриминантный стимул (S^d), ответ (R) и подкрепляющий стимул (S^{сдерживать} или S^р для арматуры, иногда S^аве для аверсивных раздражителей).^[23] Условный стимул контролирует поведение, развиваемое респондентом (классическое), например, эмоциональные реакции. Три других термина вместе образуют «трехчленную случайность» Скиннера: различительный стимул дает повод для реакций, которые приводят к подкреплению. Исследователи обнаружили, что следующий протокол является эффективным, когда они используют инструменты оперантной обусловленности для изменения человеческого поведения:^{[нужна цитата ]}

Государственная цель Уточните, какие именно изменения должны быть внесены. Например, «снизить вес на 30 фунтов».
Мониторинг поведения Следите за поведением, чтобы можно было видеть, происходят ли желаемые эффекты. Например, ведите таблицу ежедневных весов.
Подкрепляйте желаемое поведение Например, поздравьте человека с потерей веса. У людей запись поведения может служить подкреплением. Например, когда участник видит закономерность потери веса, это может способствовать продолжению поведенческой программы похудания. Однако люди могут воспринимать подкрепление, которое должно быть положительным, как отрицательное и наоборот. Например, запись о потере веса может действовать как отрицательное подкрепление, если она напоминает человеку, насколько он на самом деле тяжел. В токен экономика, является система обмена, в которой токены выдаются в качестве награды за желаемое поведение. Позже токены можно обменять на желаемый приз или награды, такие как власть, престиж, товары или услуги.
Уменьшать стимулы совершать нежелательное поведение Например, уберите с кухонных полок конфеты и жирные закуски.

Практики прикладного анализа поведения (ABA) используют эти процедуры, а также их множество вариаций и усовершенствований для решения множества социально значимых форм поведения и проблем. Во многих случаях практикующие врачи используют оперантные методы для выработки конструктивного, социально приемлемого поведения, которое заменяет аберрантное поведение. Методы ABA эффективно применяются в таких областях, как ранние интенсивные поведенческие вмешательства для детей с расстройство аутистического спектра (ASD)^[44] исследование принципов, влияющих преступное поведение, Профилактика ВИЧ,^[45] сохранение природных ресурсов,^[46] образование,^[47] геронтология,^[48] здоровье и упражнения,^[49] промышленная безопасность,^[50] овладение языком,^[51] мусор^[52] медицинские процедуры,^[53] воспитание,^[54] психотерапия,^{[нужна цитата ]} использование ремня безопасности,^[55] тяжелые психические расстройства,^[56] спортивный,^[57] злоупотребление алкоголем или наркотиками, фобии, педиатрические нарушения питания и зоопарк и уход за животными.^[58] Некоторые из этих приложений описаны ниже.

Поведение ребенка - обучение родителей управлению

Обеспечение положительного подкрепления правильного поведения ребенка является одним из основных направлений обучения родителей управлению. Как правило, родители учатся поощрять соответствующее поведение с помощью социальных поощрений (например, похвалы, улыбки и объятия), а также конкретных поощрений (например, наклеек или указателей на более крупное вознаграждение в рамках системы стимулов, созданной совместно с ребенком).^[59] Кроме того, родители учатся выбирать простое поведение в качестве первоначального акцента и вознаграждают за каждый из маленьких шагов, которые их ребенок делает для достижения большей цели (эта концепция называется «последовательные приближения»).^[59]^[60]

Экономика

И психологи, и экономисты заинтересовались применением оперантных концепций и открытий к поведению людей на рынке. Примером может служить анализ потребительского спроса, индексированного по количеству приобретенного товара. В экономике степень влияния цены на потребление называется «ценовой эластичностью спроса». Некоторые товары более эластичны, чем другие; например, изменение цен на определенные продукты питания может иметь большое влияние на покупаемое количество, в то время как бензин и другие повседневные предметы потребления могут быть менее подвержены влиянию изменений цен. С точки зрения оперантного анализа такие эффекты можно интерпретировать с точки зрения мотивации потребителей и относительной ценности товаров как подкрепляющих факторов.^[61]

Азартные игры - расписание с переменным соотношением

Как указывалось ранее в этой статье, график с переменным соотношением дает подкрепление после выдачи непредсказуемого количества ответов. Этот график обычно обеспечивает быстрое и настойчивое реагирование. Игровые автоматы окупаются по графике соотношения переменного, и они производят именно такого рода упорного рычага таскания поведения игроков. Выплаты с переменным соотношением от игровых автоматов и других форм азартных игр часто упоминаются как фактор, лежащий в основе игровой зависимости.^[62]

Военная психология

Человеческие существа обладают врожденным сопротивлением убийству и не хотят действовать прямым агрессивным образом по отношению к представителям своего собственного вида, даже ради спасения жизни. Это сопротивление убийству сделало пехоту чрезвычайно неэффективной на протяжении всей истории военных действий.^[63]

Этот феномен не был понят до тех пор, пока S.L.A. Маршалл (Бригадный генерал и военный историк) провел интервью с пехотой Второй мировой войны сразу после боевого столкновения. В известной и противоречивой книге Маршалла «Люди против огня» говорится, что только 15% солдат стреляли из винтовок с целью убить в бою.^[64] После принятия исследований Маршалла армией США в 1946 году, Управление исследований кадровых ресурсов армии США начало внедрять новые протоколы обучения, которые напоминают методы оперантного кондиционирования. Последующее применение таких методов увеличило процент солдат, способных убивать, примерно до 50% в Корее и более 90% во Вьетнаме.^[63] Революции в обучении включали замену традиционных всплывающих стрельбищ трехмерными всплывающими целями в форме человека, которые разрушались при попадании. Это обеспечило немедленную обратную связь и послужило положительным подкреплением для поведения солдата.^[65] Другие улучшения в методах военной подготовки включали курс стрельбы по времени; более реалистичное обучение; частые повторы; похвала начальства; награды за меткую стрельбу; и групповое признание. Отрицательное подкрепление включает подотчетность сверстников или требование пересдать курсы. Современные условия военной подготовки средний мозг реакция на боевое давление путем точного моделирования реального боя, в основном с использованием павловских классическое кондиционирование и Скиннер оперантное обусловливание (обе формы бихевиоризм ).^[63]

Современное обучение меткой стрельбе является настолько прекрасным примером бихевиоризма, что оно годами использовалось во вводном курсе психологии, преподаваемом всем курсантам в Военной академии США в Вест-Пойнте, как классический пример оперантной обусловленности. В 1980-х годах во время визита в Вест-Пойнт Б.Ф. Скиннер определил современную военную стрельбу как почти идеальное применение оперантной обусловленности.^[65]

Подполковник Дэйв Гроссман В отношении оперантной обусловленности и военной подготовки США говорится, что:

Вполне возможно, что никто намеренно не использовал методы оперантного кондиционирования или модификации поведения для обучения солдат в этой области ... Но с точки зрения психолога, который также является историком и кадровым военным, для меня становится все более очевидным, что это именно то, что было достигнуто.^[63]

Теория подталкивания

Теория подталкивания (или подталкивания) - это концепция в поведенческая наука, политическая теория и экономика который утверждает, что косвенные внушения попытаться добиться ненасильственного согласие может влияние мотивы, стимулы и принимать решение групп и отдельных лиц, по крайней мере так же эффективно, если не более эффективно, чем прямое указание, законодательство или правоприменение.

Хвалить

Концепция похвалы как средства поощрения поведения уходит корнями в модель оперантного обусловливания Б.Ф. Скиннера. Через эту призму похвала рассматривается как средство положительного подкрепления, при котором наблюдаемое поведение повышается за счет случайной похвалы за такое поведение.^[66] Сотни исследований продемонстрировали эффективность похвалы в поощрении позитивного поведения, в частности в исследовании того, как учителя и родители используют похвалу в отношении ребенка для улучшения поведения и успеваемости.^[67]^[68] но и при изучении производительности труда.^[69] Также было продемонстрировано, что похвала усиливает позитивное поведение у соседних людей, которых не хвалят (например, у одноклассника получателя похвалы) через косвенное подкрепление.^[70] Похвала может быть более или менее эффективной в изменении поведения в зависимости от ее формы, содержания и подачи. Для того чтобы похвала повлияла на позитивное изменение поведения, она должна зависеть от позитивного поведения (т. Е. Вводиться только после того, как целевое поведение реализовано), должна указывать особенности поведения, которое должно быть усилено, и должна быть искренней и искренней. достоверно.^[71]

Признавая эффект похвалы как позитивной стратегии подкрепления, многочисленные поведенческие и когнитивные поведенческие вмешательства включили в свои протоколы использование похвалы.^[72]^[73] Стратегическое использование похвалы признано доказательной практикой как в управлении классом, так и в классе.^[72] и программы обучения родителей,^[68] хотя в исследованиях вмешательства похвала часто относят к более широкой категории положительного подкрепления, которая включает такие стратегии, как стратегическое внимание и поведенческие вознаграждения.

Было проведено несколько исследований влияния когнитивно-поведенческой терапии и оперантно-поведенческой терапии на различные медицинские состояния. Когда пациенты разработали когнитивные и поведенческие методы, которые изменили их поведение, отношения и эмоции; их болевой синдром уменьшился. Результаты этих исследований показали влияние когнитивных функций на восприятие боли, а представленное воздействие объяснило общую эффективность когнитивно-поведенческой терапии (КПТ) и оперантно-поведенческой терапии (ОБТ).

Психологическая манипуляция

Брайкер выделил следующие способы, которыми манипуляторы контроль их жертвы:^[74]

Положительное подкрепление: включает похвалу, поверхностное очарование, поверхностный сочувствие (крокодиловы слезы ), чрезмерные извинения, деньги, одобрение, подарки, внимание, выражения лица, такие как вынужденный смех или улыбка, и общественное признание.
Отрицательное подкрепление: может включать устранение одного из негативных ситуаций
Прерывистое или частичное армирование: Частичное или периодическое отрицательное подкрепление может создать эффективное климат страха и сомневаюсь. Частичное или периодическое положительное подкрепление может побудить жертву упорствовать - например, в большинстве форм азартных игр игрок, вероятно, будет выигрывать время от времени, но в целом все равно теряет деньги.
Наказание: включает нытье кричать, спокойное обращение, запугивание, угрозы, ругань, эмоциональный шантаж, то чувство вины, дуться, плакать и играя жертву.
Травматичное однократное обучение: использование словесные оскорбления взрывной гнев или другое запугивающее поведение для установления господства или превосходства; даже один случай такого поведения может условие или научите жертв избегать того, чтобы расстраивать, противостоять манипулятору или противоречить ему.

Травматическое соединение

Травматическая связь возникает в результате постоянного циклы злоупотреблений в котором периодическое усиление вознаграждения и наказание создает сильные эмоциональные связи, устойчивые к изменениям.^[75]^[76]

Другой источник указал, что ^[77]«Необходимые условия для травмирующей связи заключаются в том, что один человек должен доминировать над другим, и что уровень жестокого обращения постоянно увеличивается, а затем спадает. Отношения характеризуются периодами снисходительного, сострадательного и даже ласкового поведения доминирующего человека, перемежающихся периодическими эпизодами жестокого обращения. Чтобы сохранить преимущество, жертва манипулирует поведением жертвы и ограничивает возможности жертвы, чтобы сохранить дисбаланс сил. Любая угроза равновесию доминирования и подчинения может быть встречена нарастающим циклом наказания, начиная от бурного запугивания и заканчивая вспышками насилия. Виктимизатор также изолирует жертву от других источников поддержки, что снижает вероятность обнаружения и вмешательства, снижает способность жертвы получать уравновешивающую обратную связь с самореферентной реакцией и усиливает чувство односторонней зависимости ... Травматические последствия этих оскорбительных отношений может включать в себя нарушение способности жертвы к точной самооценке, ведущее к чувству личной неадекватности и подчиненному чувству зависимости от доминирующего человека. Жертвы также могут столкнуться с различными неприятными социальными и правовыми последствиями своей эмоциональной и поведенческой связи с кем-то, кто совершил агрессивные действия, даже если они сами были реципиентами агрессии. '.

Видеоигры

Большинство^{[нужна цитата ]} из видеоигры разработаны вокруг петля принуждения, добавляя тип положительного подкрепления через график с переменной скоростью, чтобы игрок продолжал играть. Это может привести к патологии зависимость от видеоигр.^[78]

В рамках тенденции в монетизация видеоигр в течение 2010-х годов некоторые игры предлагали ящики для добычи в качестве награды или предметов, приобретаемых за реальные деньги. Ящики содержат случайный набор игровых предметов. Эта практика была привязана к тем же методам, которые используются в игровых автоматах и других игровых устройствах для выплаты вознаграждений, поскольку она следует графику с переменной ставкой. В то время как общее мнение, что лутбоксы являются формой азартных игр, такая практика классифицируется только в некоторых странах. Однако методы использования этих элементов как виртуальная валюта за азартные игры онлайн или торговля за реальные деньги создала азартные игры рынок, который проходит правовую оценку.^[79]

Культура страха на рабочем месте

Эшфорт обсудил потенциально деструктивные стороны лидерство и определил то, что он назвал мелкие тираны: руководители, которые придерживаются тиранического стиля управления, что создает атмосферу страха на рабочем месте.^[80] Частичный или прерывистый отрицательное подкрепление может создать эффективную атмосферу страха и сомневаться.^[74] Когда у сотрудников возникает ощущение, что с хулиганами можно мириться, в результате может возникнуть атмосфера страха.^[81]

Индивидуальные различия в чувствительности к награда, наказание, и мотивация были изучены в помещениях теория чувствительности к подкреплению а также были применяется к производительности на рабочем месте.

Одна из многих причин высоких затрат, связанных с здравоохранением, - это практика защитной медицины. Прабху рассматривает статью Коула и обсуждает, как реакции двух групп нейрохирургов являются классическим оперантным поведением. Одна группа практикует в штате с ограничениями по медицинским искам, а другая группа без ограничений. Группа нейрохирургов была анонимно опрошена об их образцах практики. Врачи изменили свою практику в ответ на отрицательный отзыв (страх судебного разбирательства) в группе, которая практиковала в штате без ограничений по медицинским искам.^[82]

Смотрите также

Злоупотребление властью и контролем
Тестирование животных
Поведенческий контраст
Бихевиоризм (раздел психологии, относящийся к методологическому и радикальному бихевиоризму)
Модификация поведения (старое выражение для ABA; изменяет поведение либо за счет последствий без включения контроля стимулов, либо включает использование наводнение - также называется терапия длительного воздействия )
Морковь и палка
Уход за детьми
Когнитивизм (психология) (теория внутренних механизмов без ссылки на поведение)
Тесты потребительского спроса (животные)
Образовательная психология
Образовательные технологии
Экспериментальный анализ поведения (экспериментальное исследование принципы в оперантной и респондентной обусловленности)
Экспозиционная терапия (также называется десенсибилизацией)
Ступенчатая экспозиционная терапия (также называемый систематическая десенсибилизация )
Привыкание
Ежи Конорски
Выученное трудолюбие
Закон соответствия
Отрицательный (положительный) контрастный эффект
Радикальный бихевиоризм (концептуальная теория анализа поведения, которая расширяет бихевиоризм, чтобы также частные мероприятия (мысли и чувства) как формы поведения)
Армирование
Павловско-инструментальный перевод
Тесты предпочтений (животные)
Принцип Премака
Сенсибилизация
Социальная обусловленность
Общество количественного анализа поведения
Спонтанное выздоровление

внешняя ссылка

[:3-1] а ^б Тарантола, Тор; Кумаран, Дхаршан; Даян, Питерс; Де Мартино, Бенедетто (10 октября 2017 г.). «Предыдущие предпочтения благотворно влияют на социальное и несоциальное обучение». Nature Communications. 8 (1): 817. Дои:10.1038 / s41467-017-00826-8. ISSN 2041-1723. ЧВК 5635122. PMID 29018195.

[2] Дженкинс, Х. М. "Обучение животных и теория поведения" гл. 5 в Hearst, E. "Первый век экспериментальной психологии" Hillsdale N.J., Earlbaum, 1979

[:0-3] а ^б Торндайк, Э. (1901). «Животный интеллект: экспериментальное исследование ассоциативных процессов у животных». Приложение к психологическому обзору к монографии. 2: 1–109.

[4] Мильтенбергер, Р. Г. «Поведенческая модификация: принципы и процедуры». Томсон / Уодсворт, 2008. с. 9.

[parenting-5] Мильтенбергер, Р. Г., и Кросланд, К. А. (2014). Воспитание. Руководство Wiley Blackwell по оперантному и классическому обусловливанию. (стр. 509–531) Wiley-Blackwell. Дои:10.1002 / 9781118468135.ch20

[6] Скиннер, Б. Ф. "Поведение организмов: экспериментальный анализ", 1938 г. Нью-Йорк: Appleton-Century-Crofts

[7] Скиннер, Б. Ф. (1950). «Нужны ли теории обучения?». Психологический обзор. 57 (4): 193–216. Дои:10,1037 / ч0054367. PMID 15440996. S2CID 17811847.

[8] Шактер, Дэниел Л., Дэниел Т. Гилберт и Дэниел М. Вегнер. "Б. Ф. Скиннер: роль подкрепления и наказания", подраздел в: Психология; Второе издание. Нью-Йорк: Worth, Incorporated, 2011, 278–288.

[ReferenceA-9] а ^б Ферстер, К. Б. и Скиннер, Б. Ф. «Графики подкрепления», 1957 г. Нью-Йорк: Appleton-Century-Crofts

[10] Staddon, J. E. R; Д. Т. Черутти (февраль 2003 г.). "Оперантного кондиционирования". Ежегодный обзор психологии. 54 (1): 115–144. Дои:10.1146 / annurev.psych.54.101601.145124. ЧВК 1473025. PMID 12415075.

[11] Мекка Кьеза (2004) Радикальный бихевиоризм: философия и наука

[12] Скиннер, Б. Ф. "Наука и поведение человека", 1953. Нью-Йорк: Макмиллан.

[13] Скиннер, Б.Ф. (1948). Уолден Два. Индианаполис: Хакетт

[14] Скиннер, Б. Ф. «Вербальное поведение», 1957. Нью-Йорк: Appleton-Century-Crofts.

[15] Neuringer, A (2002). «Оперантная изменчивость: доказательства, функции и теория». Психономический бюллетень и обзор. 9 (4): 672–705. Дои:10.3758 / bf03196324. PMID 12613672.

[16] Скиннер, Б.Ф. (2014). Наука и поведение человека (PDF). Кембридж, Массачусетс: Фонд Б.Ф. Скиннера. п. 70. Получено 13 марта 2019.

[Schultz-17] Шульц В. (2015). «Нейронное вознаграждение и сигналы принятия решений: от теорий к данным». Физиологические обзоры. 95 (3): 853–951. Дои:10.1152 / Physrev.00023.2014. ЧВК 4491543. PMID 26109341. Вознаграждения в оперантном обусловливании - это положительные подкрепления. ... Оперантное поведение дает хорошее определение вознаграждения. Все, что заставляет человека возвращаться за большим, является положительным подкреплением и, следовательно, наградой. Хотя это дает хорошее определение, положительное подкрепление - лишь одна из нескольких функций вознаграждения. ... Награды привлекательны. Они мотивируют и заставляют прилагать усилия. ... Награды побуждают подходящее поведение, также называемое аппетитным или подготовительным поведением, и завершающееся поведение. ... Таким образом, любой стимул, объект, событие, действие или ситуация, которые могут заставить нас приблизиться и поглотить их, по определению являются наградой.

[18] Schacter et al., 2011 Психология 2-е изд. стр.280–284 Ссылка на весь раздел Принципы, версия 130317

[Miltenberger84-19] а ^б Мильтенбергер, Р. Г. «Поведенческая модификация: принципы и процедуры». Томсон / Уодсворт, 2008. с. 84.

[20] Мильтенбергер, Р. Г. «Поведенческая модификация: принципы и процедуры». Томсон / Уодсворт, 2008. с. 86.

[21] Tucker, M .; Sigafoos, J .; Бушелл, Х. (1998). «Использование неконтролируемого подкрепления в лечении вызывающего поведения». Модификация поведения. 22 (4): 529–547. Дои:10.1177/01454455980224005. PMID 9755650. S2CID 21542125.

[22] Poling, A .; Норманд, М. (1999). «Неконтролируемое подкрепление: несоответствующее описание расписания, основанного на времени, которое снижает поведение». Журнал прикладного анализа поведения. 32 (2): 237–238. Дои:10.1901 / jaba.1999.32-237. ЧВК 1284187.

[Pierce_2004-23] а ^б ^c Пирс и Чейни (2004) Анализ поведения и обучение

[24] Коул, М.Р. (1990). «Оперантное накопительство: новая парадигма изучения самоконтроля». Журнал экспериментального анализа поведения. 53 (2): 247–262. Дои:10.1901 / jeab.1990.53-247. ЧВК 1323010. PMID 2324665.

[25] «Активность паллидных нейронов при движении», М.Р. ДеЛонг, J. Neurophysiol., 34:414–27, 1971

[RTR&MRD-26] а ^б Ричардсон Р. Т., Делонг М. Р. (1991): Электрофизиологические исследования функции базального ядра у приматов. В Napier TC, Kalivas P, Hamin I (eds), Базальный передний мозг: анатомия и функционирование (Достижения экспериментальной медицины и биологии), т. 295. New York, Plenum, стр. 232–252.

[27] PNAS 93: 11219-24 1996, Science 279: 1714-8 1998

[28] Neuron 63: 244–253, 2009 г., Frontiers in Behavioral Neuroscience, 3: Статья 13, 2009 г.

[29] Майкл Дж. Франк, Лорен С. Сибергер и Рэндалл С. О'Рейли (2004) «Кэррот или палкой: когнитивное обучение с подкреплением при паркинсонизме», Наука 4 ноября 2004 г.

[30] Шульц, Вольфрам (1998). «Прогнозирующий сигнал вознаграждения дофаминовых нейронов». Журнал нейрофизиологии. 80 (1): 1–27. Дои:10.1152 / jn.1998.80.1.1. PMID 9658025.

[31] Тимберлейк, Вт (1983). «Реакция крыс на движущийся объект, связанный с едой или водой: анализ поведенческих систем». Обучение и поведение животных. 11 (3): 309–320. Дои:10.3758 / bf03199781.

[32] Нойрингер, А.Дж. (1969). «Животные отзываются о еде при наличии бесплатной еды». Наука. 166 (3903): 399–401. Bibcode:1969Sci ... 166..399N. Дои:10.1126 / science.166.3903.399. PMID 5812041. S2CID 35969740.

[33] Уильямс, Д.Р .; Уильямс, Х. (1969). «Автоматическое обслуживание голубя: продолжительное клевание, несмотря на случайное отсутствие подкрепления». Журнал экспериментального анализа поведения. 12 (4): 511–520. Дои:10.1901 / jeab.1969.12-511. ЧВК 1338642. PMID 16811370.

[34] Peden, B.F .; Brown, M.P .; Херст, Э. (1977). «Настойчивые подходы к сигналу о еде, несмотря на отсутствие еды для приближения». Журнал экспериментальной психологии: процессы поведения животных. 3 (4): 377–399. Дои:10.1037/0097-7403.3.4.377.

[35] Gardner, R.A .; Гарднер, Б. (1988). «Прямая связь против обратной связи: этологическая альтернатива закону эффекта». Поведенческие науки и науки о мозге. 11 (3): 429–447. Дои:10.1017 / с0140525x00058258.

[36] Гарднер, Р. А. и Гарднер Б. Т. (1998) Структура обучения от жестовых стимулов к жестовому языку. Махва, штат Нью-Джерси: Лоуренс Эрлбаум Ассошиэйтс.

[37] Баум, В. М. (2012). «Переосмысление подкрепления: распределение, индукция и непредвиденные обстоятельства». Журнал экспериментального анализа поведения. 97 (1): 101–124. Дои:10.1901 / jeab.2012.97-101. ЧВК 3266735. PMID 22287807.

[38] Локурто, К. М., Террас, Х. С., и Гиббон, Дж. (1981) Теория автоформирования и кондиционирования. Нью-Йорк: Academic Press.

[Reinforcement_in_addiction-39] а ^б ^c ^d Эдвардс S (2016). «Принципы усиления наркологической медицины; от употребления наркотиков до психических расстройств». Неврология в медицине наркологии: от профилактики к реабилитации - конструкции и лекарства. Прог. Brain Res. Прогресс в исследованиях мозга. 223. С. 63–76. Дои:10.1016 / bs.pbr.2015.07.005. ISBN 9780444635457. PMID 26806771. Злоупотребляемые вещества (от алкоголя до психостимуляторов) изначально попадают в организм регулярно в соответствии с их положительными укрепляющими свойствами. Важно отметить, что повторное воздействие полезных веществ запускает цепочку вторичных подкрепляющих событий, в результате чего сигналы и контексты, связанные с употреблением наркотиков, могут сами стать подкрепляющими и, таким образом, способствовать продолжающемуся употреблению и возможному злоупотреблению выбранными веществами. ...
Важным аспектом подкрепления, имеющим большое значение для процесса зависимости (и особенно рецидива), является вторичное подкрепление (Stewart, 1992). Вторичные подкрепления (во многих случаях также рассматриваемые как условные подкрепления), вероятно, управляют большинством процессов подкрепления у людей. В конкретном случае [наркомании] сигналы и контексты, которые тесно и неоднократно связаны с употреблением наркотиков, часто сами становятся подкрепляющими ...Фундаментальная часть теории стимуляции-сенсибилизации зависимости Робинсона и Берриджа утверждает, что стимулирующая ценность или привлекательный характер таких процессов вторичного подкрепления, в дополнение к самим основным подкрепляющим элементам, может сохраняться и даже становиться сенсибилизированной со временем в союзе с развитием наркотиков зависимость (Робинсон и Берридж, 1993). ...
Отрицательное подкрепление - это особое состояние, связанное с усилением поведенческих реакций, которые прекращают действие некоторого продолжающегося (предположительно отталкивающего) стимула. В этом случае мы можем определить отрицательное подкрепление как мотивационный стимул, усиливающий такую реакцию «бегства». Исторически в отношении наркозависимости этот феномен постоянно наблюдался у людей, когда наркотики вводились самостоятельно, чтобы утолить мотивационную потребность в состоянии отмены (Wikler, 1952).

[Incentive_salience_and_motivation_review-40] а ^б ^c Berridge KC (апрель 2012 г.). «От ошибки прогноза к значимости стимула: мезолимбическое вычисление мотивации вознаграждения». Евро. J. Neurosci. 35 (7): 1124–1143. Дои:10.1111 / j.1460-9568.2012.07990.x. ЧВК 3325516. PMID 22487042. Когда Павловской CS + приписывается значимость стимула, она не только вызывает «желание» для ее UCS, но часто сама реплика становится очень привлекательной - даже в иррациональной степени. Эта привлекательность реплики - еще одна отличительная черта значимости стимула. На CS становится трудно не смотреть (Wiers & Stacy, 2006; Hickey et al., 2010a; Piech et al., 2010; Anderson et al., 2011). CS даже приобретает некоторые стимулирующие свойства, подобные его UCS. Привлекательный CS часто вызывает поведенчески мотивированный подход, и иногда человек может даже попытаться «потребить» CS как свою UCS (например, есть, пить, курить, заниматься сексом, принимать как наркотик). «Желание» CS может также превратить ранее нейтральный стимул в инструментальное условное подкрепление, так что человек будет работать, чтобы получить сигнал (однако, существуют и альтернативные психологические механизмы для условного подкрепления).

[Pleasure_system_-_incentive_sensitization-41] а ^б ^c Берридж К.С., Крингельбах М.Л. (май 2015 г.). «Системы удовольствия в мозгу». Нейрон. 86 (3): 646–664. Дои:10.1016 / j.neuron.2015.02.018. ЧВК 4425246. PMID 25950633. Важной целью в будущем нейробиологии наркологии является понимание того, как интенсивная мотивация становится узко сфокусированной на конкретной цели. Было высказано предположение, что зависимость отчасти объясняется чрезмерной значимостью стимулов, создаваемой сенсибилизированными или гиперреактивными дофаминовыми системами, которые вызывают сильное «желание» (Робинсон и Берридж, 1993). Но почему одна цель становится более «востребованной», чем все остальные, полностью не объяснено. У наркоманов или пациентов, стимулированных агонистами, повторение дофаминовой стимуляции значимости стимулов объясняется конкретными индивидуализированными занятиями, такими как прием вызывающего привыкание препарата или определенных компульсий. В павловских ситуациях вознаграждения некоторые сигналы к вознаграждению становятся более «желанными», чем другие, в качестве мощных мотивационных магнитов, что у разных людей различается (Robinson et al., 2014b; Saunders and Robinson, 2013). ... Однако гедонистические эффекты могут со временем измениться. Поскольку препарат принимался повторно, мезолимбическая дофаминергическая сенсибилизация могла, следовательно, происходить у восприимчивых людей, усиливая `` желание '' (Leyton and Vezina, 2013; Lodge and Grace, 2011; Wolf and Ferrario, 2010), даже если опиоидные гедонические механизмы подверглись подавлению из-за постоянной лекарственной стимуляции, вызывающей толерантность "симпатии". Стимулирующая сенсибилизация вызывает зависимость, избирательно усиливая вызванное сигналом «желание» снова принять наркотик, и так сильно вызывает мотивацию, даже если наркотик становится менее приятным (Робинсон и Берридж, 1993).

[42] МакГриви, П и Боукс, Р. «Кнут и пряник: принципы дрессировки животных» (Сидней: «Sydney University Press», 2011).

[43] "Все о дрессировке животных - основы | Парки и развлечения SeaWorld". Основы дрессировки животных. Парки морского мира.

[As-in-ABA-44] Dillenburger, K .; Кинан, М. (2009). «Ни один из букв ABA не означает аутизм: развенчание мифов». J Intellect Dev Disabil. 34 (2): 193–95. Дои:10.1080/13668250902845244. PMID 19404840. S2CID 1818966.

[45] DeVries, J.E .; Burnette, M.M .; Редмон, В.К. (1991). «Профилактика СПИДа: улучшение соблюдения медсестрами правил ношения перчаток посредством обратной связи». Журнал прикладного анализа поведения. 24 (4): 705–11. Дои:10.1901 / jaba.1991.24-705. ЧВК 1279627. PMID 1797773.

[46] Brothers, K.J .; Krantz, P.J .; McClannahan, L.E. (1994). «Переработка офисной бумаги: функция близости контейнера». Журнал прикладного анализа поведения. 27 (1): 153–60. Дои:10.1901 / jaba.1994.27-153. ЧВК 1297784. PMID 16795821.

[47] Dardig, Jill C .; Хьюард, Уильям Л .; Heron, Timothy E .; Нэнси А. Ниф; Петерсон, Стефани; Дайан М. Сайнато; Картледж, Гвендолин; Гарднер, Ральф; Peterson, Lloyd R .; Сьюзан Б. Херш (2005). Сосредоточьтесь на анализе поведения в образовании: достижения, проблемы и возможности. Река Аппер Сэдл, штат Нью-Джерси: Пирсон / Меррилл / Прентис-Холл. ISBN 978-0-13-111339-8.

[48] Gallagher, S.M .; Кинан М. (2000). «Самостоятельное использование материалов для занятий пожилыми людьми в жилых помещениях». Журнал прикладного анализа поведения. 33 (3): 325–28. Дои:10.1901 / jaba.2000.33-325. ЧВК 1284256. PMID 11051575.

[49] De Luca, R.V .; Холборн, С. (1992). «Влияние схемы подкрепления с переменным соотношением и изменяющимися критериями на упражнения у тучных и не тучных мальчиков». Журнал прикладного анализа поведения. 25 (3): 671–79. Дои:10.1901 / jaba.1992.25-671. ЧВК 1279749. PMID 1429319.

[50] Fox, D.K .; Hopkins, B.L .; Гнев, W.K. (1987). «Долгосрочное влияние экономики токена на показатели безопасности при добыче открытым способом». Журнал прикладного анализа поведения. 20 (3): 215–24. Дои:10.1901 / jaba.1987.20-215. ЧВК 1286011. PMID 3667473.

[51] Drasgow, E .; Halle, J.W .; Остроский, М. (1998). «Влияние дифференциального подкрепления на генерализацию замещающего мандата у трех детей с серьезной задержкой речевого развития». Журнал прикладного анализа поведения. 31 (3): 357–74. Дои:10.1901 / jaba.1998.31-357. ЧВК 1284128. PMID 9757580.

[52] Пауэрс, R.B .; Osborne, J.G .; Андерсон, Э. (1973). «Положительное усиление удаления мусора в естественной среде». Журнал прикладного анализа поведения. 6 (4): 579–86. Дои:10.1901 / jaba.1973.6-579. ЧВК 1310876. PMID 16795442.

[53] Hagopian, L.P .; Томпсон, Р.Х. (1999). «Укрепление соблюдения режима респираторной терапии у ребенка с муковисцидозом». Журнал прикладного анализа поведения. 32 (2): 233–36. Дои:10.1901 / jaba.1999.32-233. ЧВК 1284184. PMID 10396778.

[54] Kuhn, S.A.C .; Лерман, округ Колумбия; Ворндран, К. (2003). «Пирамидальный тренинг для семей с детьми с проблемным поведением». Журнал прикладного анализа поведения. 36 (1): 77–88. Дои:10.1901 / jaba.2003.36-77. ЧВК 1284418. PMID 12723868.

[55] Van Houten, R .; Malenfant, J.E.L .; Austin, J .; Леббон, А. (2005). Воллмер, Тимоти (ред.). «Влияние предупреждения о задержке переключения передач с помощью ремня безопасности на использование ремня безопасности автомобилистами, которые не пристегиваются регулярно». Журнал прикладного анализа поведения. 38 (2): 195–203. Дои:10.1901 / jaba.2005.48-04. ЧВК 1226155. PMID 16033166.

[56] Wong, S.E .; Martinez-Diaz, J.A .; Массель, Х.К .; Edelstein, B.A .; Wiegand, W .; Bowen, L .; Либерман, Р.П. (1993). «Тренировка разговорных навыков с больными шизофренией в стационаре: исследование обобщения в разных условиях и беседующих». Поведенческая терапия. 24 (2): 285–304. Дои:10.1016 / S0005-7894 (05) 80270-9.

[57] Brobst, B .; Уорд, П. (2002). «Влияние публичных публикаций, постановки целей и устных отзывов на навыки футболисток». Журнал прикладного анализа поведения. 35 (3): 247–57. Дои:10.1901 / jaba.2002.35-247. ЧВК 1284383. PMID 12365738.

[58] Forthman, D.L .; Огден, Дж. Дж. (1992). «Роль прикладного анализа поведения в управлении зоопарком: сегодня и завтра». Журнал прикладного анализа поведения. 25 (3): 647–52. Дои:10.1901 / jaba.1992.25-647. ЧВК 1279745. PMID 16795790.

[Kazdin2010-59] а ^б Каздин А.Е. (2010). Обучение навыкам решения проблем и обучение родителей управлению оппозиционным вызывающим расстройством и расстройством поведения. Доказательная психотерапия для детей и подростков (2-е изд.), 211–226. Нью-Йорк: Guilford Press.

[PMTO-60] Форгатч М.С., Паттерсон Г.Р. (2010). Тренинг по управлению родителями - модель штата Орегон: вмешательство в антиобщественное поведение детей и подростков. Доказательная психотерапия для детей и подростков (2-е изд.), 159–78. Нью-Йорк: Guilford Press.

[61] Домян, М. (2009). Принципы обучения и поведения. Издательская компания Wadsworth. 6-е издание. страницы 244–249.

[62] Бледа, Мигель Анхель Перес; Ньето, Хосе Эктор Лозано (2012). «Импульсивность, разведка и различение непредвиденных обстоятельств подкрепления в фиксированном соотношении 3». Испанский журнал психологии. 3 (15): 922–929. Дои:10.5209 / rev_SJOP.2012.v15.n3.39384. PMID 23156902. ProQuest 1439791203.

[:1-63] а ^б ^c ^d Гроссман, Дэйв (1995). Об убийстве: психологическая цена обучения убивать на войне и в обществе. Бостон: Маленький Браун. ISBN 978-0316040938.

[64] Маршалл, С.Л.А. (1947). Люди против огня: проблема боевого командования в будущей войне. Вашингтон: Пехотный журнал. ISBN 978-0-8061-3280-8.

[:2-65] а ^б Мюррей, К.А., Гроссман, Д., и Кентридж, Р.В. (21 октября 2018 г.). «Поведенческая психология». killology.com/behavioral-psychology.CS1 maint: несколько имен: список авторов (связь)

[66] Каздин, Алан (1978). История модификации поведения: экспериментальные основы современных исследований. Балтимор: University Park Press.

[67] Strain, Phillip S .; Lambert, Deborah L .; Керр, Мэри Маргарет; Стэгг, Воган; Ленкнер, Донна А. (1983). «Натуралистическая оценка соответствия детей требованиям учителей и последствия их выполнения». Журнал прикладного анализа поведения. 16 (2): 243–249. Дои:10.1901 / jaba.1983.16-243. ЧВК 1307879. PMID 16795665.

[Garland_et_al._2008-68] а ^б Гарленд, Энн Ф .; Хоули, Кристин М .; Брукман-Фрейзи, Лорен; Херлберт, Майкл С. (май 2008 г.). «Выявление общих элементов доказательных психосоциальных методов лечения проблем детского деструктивного поведения». Журнал Американской академии детской и подростковой психиатрии. 47 (5): 505–514. Дои:10.1097 / CHI.0b013e31816765c2. PMID 18356768.

[69] Crowell, Charles R .; Андерсон, Д. Крис; Abel, Dawn M .; Серджио, Джозеф П. (1988). «Разъяснение задач, отзывы о производительности и социальная похвала: процедуры для улучшения обслуживания клиентов банковских кассиров». Журнал прикладного анализа поведения. 21 (1): 65–71. Дои:10.1901 / jaba.1988.21-65. ЧВК 1286094. PMID 16795713.

[Kazdin,_1973-70] Каздин, Алан Э. (1973). «Влияние косвенного подкрепления на внимательное поведение в классе». Журнал прикладного анализа поведения. 6 (1): 71–78. Дои:10.1901 / jaba.1973.6-71. ЧВК 1310808. PMID 16795397.

[Brophy,_1981-71] Брофи, Джер (1981). «Эффективно хвалить». Журнал начальной школы. 81 (5): 269–278. Дои:10.1086/461229. JSTOR 1001606.

[Simonsen_et_al_2008-72] а ^б Симонсен, Брэнди; Фэрбенкс, Сара; Бриеш, Эми; Майерс, Дайан; Сугай, Джордж (2008). «Доказательная практика в управлении классом: от исследований к практике». Воспитание и обращение с детьми. 31 (1): 351–380. Дои:10.1353 / и т.д.0.0007. S2CID 145087451.

[Weisz_&_Kazdin,_2010-73] Weisz, John R .; Каздин, Алан Э. (2010). Доказательная психотерапия для детей и подростков. Guilford Press.

[braiker-74] а ^б Брайкер, Харриет Б. (2004). Кто дергает за ниточки? Как разорвать цикл манипуляций. ISBN 978-0-07-144672-3.

[75] Даттон; Художник (1981). «Травматическая связь: развитие эмоциональной привязанности у женщин, подвергшихся побоям, и других отношений периодического насилия». Виктимология: международный журнал (7).

[Sanderson2008-76] Крисси Сандерсон. Консультации пострадавших от домашнего насилия. Издательство Джессики Кингсли; 15 июня 2008 г. ISBN 978-1-84642-811-1. п. 84.

[77] "Травматическая связь | Encyclopedia.com". www.encyclopedia.com.

[78] Джон Хопсон: Поведенческий игровой дизайн, Гамасутра, 27 апреля 2001 г.

[eg_pegi-79] Худ, Вик (12 октября 2017 г.). "Коробки с добычей - азартные игры?". Eurogamer. Получено 12 октября 2017.

[ashforth-80] Мелкая тирания в организациях, Эшфорт, Блейк, Человеческие отношения, Vol. 47, № 7, 755–778 (1994)

[Organisational-81] Helge H, Sheehan MJ, Cooper CL, Einarsen S «Организационные последствия издевательств на рабочем месте» в издании «Запугивание и домогательства на рабочем месте: достижения в теории, исследованиях и практике» (2010)

[82] Оперантное кондиционирование и практика защитной медицины. Викрам К. Прабху Всемирная нейрохирургия, 2016-07-01, том 91, страницы 603–605

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[55]

[56]

[57]

[58]

[59]

[60]

[61]

[62]

[63]

[64]

[65]

[66]

[67]

[68]

[69]

[70]

[71]

[72]

[73]

[74]

[75]

[76]

[77]

[78]

[79]

[80]

[81]

[82]

Учусь
Простой неассоциативное обучение	Привыкание Сенсибилизация
Ассоциативное обучение	Оперантного кондиционирования Классическое кондиционирование Печать Наблюдательное обучение
Инсайт обучение	Дедуктивное мышление Индуктивное мышление Абдуктивное рассуждение

Психологическая манипуляция
Награждение: приятный (положительное подкрепление )	Внимание Взяточничество Уход за детьми Лесть Дары Заискивание Любовная бомбежка Подталкивание Хвалить Соблазнение Улыбается Поверхностное очарование Поверхностная симпатия
Аверсивный: неприятно (положительное наказание )	Злость Убийство персонажа Плач Эмоциональный шантаж Боязнь Хмурый Вопиющий Чувство вины Невнимательность Запугивание Ворчание Клеветническая критика Пассивная агрессия Реляционная агрессия Садизм Позор Спокойное обращение Социальное неприятие Ругань Угрозы Обвинение жертвы Жертва играет Кричать
Прерывистый или частичный отрицательное подкрепление	Климат страха Травматическое соединение
Другие техники	Наживка и переключение Обман Отрицание Деплатформинг Депрограммирование Дезинформация Искажение Отвлечение Разделяй и властвуй Двойной переплет Ловушка Уклонение Преувеличение Газлайтинг Хороший полицейский / плохой полицейский Воспитание Низкий балл Врущий Минимизация Перемещение стоек Гордость и эго вниз Рационализация Техника Рейда Настройка на провал троянский конь Ты либо с нами, либо против нас
Контексты	Злоупотреблять Злоупотребление властью и контролем Реклама Издевательства Католическая вина Уловка уверенности Культура вины Допрос Стереотип еврейской матери Моральная паника Манипуляции со СМИ Контроль над разумом Игры разума Моббинг Пропаганда Торговля Козла отпущения Культура стыда Клеветническая кампания Социальная инженерия (бэггинг) Вращение Внушаемость Шепчущая кампания
похожие темы	Антисоциальное расстройство личности Напористость Обвинять Пограничное расстройство личности Морковь и палка Тупой вниз Включение Заблуждение Роковая женщина Игра в систему Легковерность Истерическое расстройство личности Управление впечатлениями Макиавеллизм Нарциссизм Нарциссическое расстройство личности Личные границы Убеждение Популярность Проекция Психопатия Спектр культур: чувство вины-стыда-страха