Бихевиоризм скиннера: Бихевиоризм — Википедия – Бихевиоризм Скиннера

Автор: | 26.03.2020

ОПЕРАНТНЫЙ БИХЕВИОРИЗМ СКИННЕРА

Отдельную линию в развитии бихевиоризма представляет система взглядов Б. Скиннера. Беррес Фредерик Скиннер (1904-1990) выдвинултеорию оперантного бихевиоризма,

Основываясь на экспериментальных исследованиях и теоретическом анализе поведения животных, он сформулировал положение о трех видах поведения: безусловно-рефлекторном, условно-рефлекторном иоперантном. Последнее и составляет специфику учения Б. Скиннера.

Первые два вида вызываются стимулами (5) и называютсяреспондентным, отвечающим поведением. Это реакции обусловливания типа S. Они составляют определенную часть репертуара поведения, но ими одними не обеспечивается адаптация к реальной среде обитания. Реально процесс приспособления строится на основе активных проб — воздействий организма на окружающий мир. Некоторые из них случайно могут приводить к полезному результату, который в силу этого закрепляется. Часть из таких реакций (R), не вызываемых стимулом, а выделяемых («испускаемых») организмом, оказывается правильными и подкрепляются. Их Скиннер и назвал оперантными. Это реакции типа R.

Оперантное поведение предполагает, что организм активно воздействует на окружение и в зависимости от результатов этих активных действий они закрепляются или отвергаются. По Скиннеру, именно эти реакции — преобладающие в адаптации животного: они являются формой произвольного поведения. Катание на роликовой доске, игра на фортепиано, обучение письму — это все примеры оперантных действий человека, контролируемых их последствиями. Если последние благоприятны для организма, тогда вероятность повторения оперантной реакции усиливается.

Проанализировав поведение, Скиннер сформулировал свою теорию научения. Главным средством формирования нового поведения выступает подкрепление. Вся процедура научения у животных получила название «последовательного наведения на нужную реакцию».

Скиннер выделяет четыре режима подкрепления:

1. Режим подкрепления с постоянным соотношением, когда уровень положительного подкрепления зависит от количества правильно выполненных действий. (Например, работнику платят пропорционально количеству произведенной продукции, т. е. чем чаще возникает правильная реакция организма, тем больше подкреплений он получает.)

2. Режим подкрепления с постоянным интервалом, когда организм получает подкрепление после того, как пройдет строго фиксированное время с момента предыдущего подкрепления. (Например, работнику платят зарплату через каждый месяц или у студента сессия через каждые четыре месяца, при этом скорость реагирования ухудшается сразу после получения подкрепления — ведь следующая зарплата или сессия будет еще не скоро.)

3. Режим подкрепления с вариативным соотношением. (Например, выигрыш-подкрепление в азартной игре бывает непредсказуем, непостоянен, человек не знает, когда и каким будет следующее подкрепление, но всякий раз надеется на выигрыш — такой режим значимо воздействует на поведение человека.)

4. Режим подкрепления с вариативным интервалом. (Через неопределенные интервалы времени человек получает подкрепления или знания студента контролируют с помощью «неожиданных контрольных» через случайные промежутки времени, что побуждает соблюдать более высокий уровень прилежания и реагирования в отличие от подкрепления с «постоянным интервалом».)

Скиннер выделял «первичные подкрепления» (пища, вода, физический комфорт, секс) и вторичные, или условные (деньги, внимание, хорошие оценки, привязанность и т. п.). Вторичные подкрепления генерализуются, объединяются со многими первичными: например, деньги являются средством для получения множества удовольствий. Еще более сильным генерализованным условным подкреплением является социальное одобрение: ради его получения со стороны родителей, окружающих человек стремится хорошо себя вести, соблюдать социальные нормы, прилежно учиться, делать карьеру, красиво выглядеть и т. п.

Ученый полагал, что условные подкрепляющие стимулы очень важны в контроле поведения человека, а аверсивные (болевые или неприятные) стимулы, наказание — это наиболее общий метод контроля над поведением. Скиннер выделял позитивные и негативные подкрепления, а также позитивные и негативные наказания (табл. 5.2).

Таблица 5.2

Теория Б. Скиннера

Позитивное

Негативное

Подкрепление

Предъявление положительного подкрепления (удовольствие)

Удаление аверсивного (болевого) стимула

Наказание

Предъявление аверсивного стимула (ругают, бьют, исключают из школы, сажают в тюрьму и т. п.)

Удаление положительного стимула (запрещают смотреть телевизор, гулять и т. п.)

Скиннер боролся против того, чтобы использовать наказание для контроля над поведением, потому что это вызывает отрицательные эмоциональные и социальные побочные эффекты (страх, тревогу, антисоциальные действия, ложь, потерю самоуважения и уверенности). Кроме того, оно всего лишь на время подавляет нежелательное поведение, которое вновь проявится, если уменьшится вероятность наказания.

Вместо аверсивного контроля Скиннер рекомендует позитивное подкрепление как наиболее эффективный метод для устранения нежелательных и поощрения желательных реакций. «Метод успешного приближения или формирования поведения» заключается в положительном подкреплении тех действий, которые наиболее близки к ожидаемому оперантному поведению. К этому приближаются шаг за шагом: одна реакция закрепляется, а затем заменяется другой, более близкой к предпочтительной (так формируют речь, трудовые навыки и т. п.).

Данные, полученные при изучении поведения животных, Скиннер перенес на поведение людей, что привело к биологизаторской трактовке. Так, возник скиннеровский вариант программированного обучения. Его принципиальная ограниченность состоит в сведении обучения к набору внешних актов поведения и подкреплению правильных из них. При этом игнорируется внутренняя познавательная деятельность человека, следовательно, нет обучения как сознательного процесса. Вслед за установкой уотсоновского бихевиоризма Скиннер исключает внутренний мир человека, его сознание из поведения и производит бихевиоризацию психики. Мышление, память, мотивы и тому подобные психические процессы он описывает в терминах реакции и подкрепления, а человека — как реактивное существо, подвергающееся воздействиям внешних обстоятельств.

Биологизация мира людей, характерная для бихевиоризма в целом, принципиально не проводящего различий между человеком и животным, достигает у Скиннера своих пределов. Культурные явления оказываются в его трактовке «хитроумно придуманными подкреплениями».

Для разрешения социальных проблем современного общества Б. Скиннер выдвинул задачу создания технологии поведения, которая призвана осуществлять контроль одних людей над другими. Поскольку намерения, желания, самосознание человека не принимаются во внимание, управление поведением не связано с сознанием. Таким средством выступает контроль за режимом подкреплений, позволяющий манипулировать людьми. Для наибольшей эффективности необходимо учитывать, какое подкрепление наиболее важно, значимо, ценно в данный момент (закон субъективной ценности подкрепления),

 а затем предоставлять такое

субъективно ценное подкрепление в случае правильного поведения человека или угрожать его лишением в случае неправильного поведения. Подобный механизм и позволит управлять поведением.

Скиннер сформулировал закон оперантного обусловливания:«поведение живых существ полностью определяется последствиями, к которым оно приводит. В зависимости от того, будут ли эти последствия приятными, безразличными или неприятными, живой организм проявит тенденцию повторять данный поведенческий акт, не придавать ему никакого значения или же избегать его повторения в дальнейшем». Человек способен предвидеть возможные последствия своего поведения и избегать тех действий и ситуаций, которые приведут к негативным для него последствиям. Он субъективно оценивает вероятность их наступления: чем больше возможность негативных последствий, тем сильнее это влияет на поведение человека (

закон субъективной оценки вероятности последствий). Эта субъективная оценка может не совпадать с объективной вероятностью последствий, но на поведение влияет именно она. Поэтому один из способов воздействовать на поведение человека — «нагнетание обстановки», «запугивание», «преувеличение вероятности негативных последствий». Если человеку кажется, что последняя, вытекающая из какой-либо его реакции, незначительна, он готов «рискнуть» и прибегнуть к данному действию.

Бихевиоризм Скиннера

Оперантное поведение возникает без воздействия каких — либо внешних наблюдаемых раздражителей. Реакция организма кажется спонтанной в том смысле, что внешне она никак не связана с каким — либо наблюдаемым раздражителем. Это вовсе не означает, что стимула, вызывающего ту или иную реакцию, не существует; это значит, что при возникновении данной реакции ни один стимул не является наблюдаемым. С экспериментальной же точки зрения, если стимул отсутствует, то это значит, что он нс применялся, а потому и не наблюдается.

Другим различием между респондентным и оперантным поведением является то, что оперантное поведение воздействует на окружающую организм среду, в то время как респондентное поведение этого не делает. Подопытная собака в лаборатории Павлова, закованная в сбрую, не может сделать ничего иного, как только реагировать (например, пускать слюну), когда экспериментатор предлагает ей какие — либо стимулы. Собака сама по себе ничего не может сделать, чтобы достать стимул (пищу).

Оперантное поведение крысы в коробке Скиннера, напротив, является инструментальным в том смысле, что крыса достигает своего стимула (пищи). Когда крыса нажимает на рычаг, она получает пищу; а если не нажимает на рычаг, то не получает пищи. Таким образом крыса воздействует на окружающую среду. (Скиннер очень не любил термин «скиннеровский ящик», впервые введенный Халлом в 1933 году. Он сам называл это оборудование аппаратом оперантного формирования условных рефлексов. Однако термин «скиннеровский ящик» стал столь популярным, что вошел во все справочники и в настоящее время является в психологии общепринятым.)

Скиннер считал, что оперантное поведение характерно для повседневного научения. Поскольку поведение, как правило, носит оперантный характер, то наиболее эффективным подходом к науке о поведении является изучение обусловливания и угасания оперантпого поведения.

Классическая экспериментальная демонстрация заключалась в нажатии на рычаг в скиннеровском ящике. В этом эксперименте крыса, лишенная пищи, помещалась в ящик и получала полную возможность исследовать его. В ходе исследований она неизбежно должна была задеть рычажок, который приводил в действие механизм, выдвигающий полочку с пищей. После получения нескольких порций пищи, которые должны были служить подкреплением, у крысы довольно быстро формировался условный рефлекс. Обратите внимание, что поведение крысы (нажатие на рычаг) оказывает воздействие па окружающую среду и является инструментом приобретения пищи. Зависимая переменная в этом эксперименте проста и понятна: это скорость реакции.

На основании этого эксперимента Скиннер сформулировал свой закон приобретения 93, который гласит, что сила оперантного поведения возрастает, если поведение сопровождается подкрепляющим стимулом. Несмотря на то, что для формирования быстрой реакции нажатия на рычажок требуется практика, ключевым параметром все — таки является подкрепление. Практика сама по себе ничего не дает: она только предоставляет возможность возникновения дополнительного подкрепления.

Закон приобретения Скиннера отличается от положений о научении у Торндайка и у Халла. Скиннер вообще не касался таких последствий подкрепления, как боль — приятное ощущение или удовольствие — неудовлетворение, как это делал Торндайк. Скиннер так же не пытался интерпретировать подкрепление в терминах снижения воздействия побуждений, как это делал Кларк Халл. Системы Торндайка и Халла были объясняющими; система Скиннера является строго описательной.

Скиннер и его последователи провели огромную исследовательскую работу по проблемам научения — таким, как роль наказания в приобретении навыков, воздействие различных систем подкрепления, мера угасания оперантного обусловливания, наличие вторичного подкрепления и т. д.

Кроме крыс они работали и с другими подопытными животными, и с людьми, используя в качестве основного подхода тот же самый принцип <скиннеровского ящика>. Если в качестве подопытных животных использовались голуби, то они должны были клюнуть в определенную точку или пятно; подкреплением являлась пища. Оперантное поведение людей включало такие аспекты, как решение задач, подкрепленное похвалой или осознанием того, что был дан правильный ответ.

Скиннер сообщал, что в качестве подкрепления для своей трехлетней дочери он использовал поглаживание по спине. Однако этот эксперимент обернулся неожиданным образом. Однажды он укладывал девочку спать, гладил ее по спинке и вдруг решил проверить, насколько это является поощряющим подкреплением. «Я подождал, — написал Скиннер, — чтобы она подняла ногу, и тогда погладил ее. Почти сразу же она снова подняла ногу, и я снова погладил ее. Она засмеялась. «Ты над чем смеешься?» — спросил я, и она ответила: «Стоит мне поднять ногу, как ты начинаешь меня гладить!»» (Skinner. 1987. P. 179).

Схема подкрепления

Уже первые исследования в <скиннеровском ящике> с нажатием рычага продемонстрировали значение подкрепления для оперантного поведения. В этой ситуации поведение крысы при каждом нажатии на рычаг получало подкрепление. То есть всякий раз, выполнив правильное действие, крыса получала пищу. Скиннер отмечал, что хотя в реальной жизни подкрепление далеко не всегда бывает последовательным или непрерывным, тем не менее, научение все — таки происходит и поведение сохраняется, даже если подкрепление было случайным или редким.

Не всегда, отправляясь кататься на коньках или на лыжах, мы попадаем на хороший лед или снег… Не всегда, приходя в ресторан, мы получаем хорошую пишу. потому что повара непредсказуемы. Звоня друзьям по телефону. мы не всегда получаем ответ, потому что друзья могут отсутствовать. …Подкрепляющие характеристики деятельности и обучения почти всегда являются прерывистыми. так как просто не имеет смысла контролировать подкреплением каждую реакцию. (Skinner. 1953. P. 99.)

Даже если вы проводите исследования постоянно, вы не при каждом эксперименте получаете реакцию А. На работе вас не каждый день хвалят и не каждый день повышают заработную плату. Каким образом на поведении сказывается такое непостоянное подкрепление? Является ли та или иной режим подкрепления 94лучшим, чем остальные, с точки зрения ее воздействия на поведение? Скиннер и его коллеги посвятили годы исследованию этих вопросов (Ferster & Skinner 1857; Skinner.1969).

Потребность в этих исследованиях возникла не из — за чисто научного любопытства, но на основе практической целесообразности — что, кстати, иллюстрирует тот факт, что наука нередко существенно отличается от той идеализированной модели, которая представляется в некоторых учебниках. Как — то раз в субботу вечером Скиннер обнаружил, что у него почти закончился запас корма. В то время (тридцатые годы) еще нельзя было купить корм у специальных компаний по снабжению исследовательских лабораторий; экспериментатор должен был делать шарики вручную, что являлось достаточно длительным и трудоемким процессом.

Вместо того, чтобы потратить свои выходные на изготовление кормовых шариков, Скиннер задал себе вопрос: что произойдет, если он будет давать подкрепление своим крысам один раз в минуту, независимо от того, какое будет количество ответных реакций? При таком подходе ему потребуется намного меньше корма, и на выходные дни должно хватить. Скиннер решил провести длительную серию экспериментов, чтобы проверить различные варианты системы подкреплений.

В одном таком исследовании Скиннер сравнил частоту реакции у животных, которые получали подкрепление при каждой реакции, с частотой реакций тех животных, которые получали подкрепление только по истечении некоторого интервала времени. Последнее условие получило название схемы подкрепления с фиксированным интервалом. Подкрепление могло выдаваться, например, один раз в минуту или каждые четыре минуты. Важным моментом в данном случае является то, что подопытное животное получало подкрепление только по истечении определенного отрезка времени. (Например, работа, когда деньги выплачиваются раз в неделю или раз в месяц, представляет собой схему подкрепления с фиксированным интервалом; работники получают заработную плату не за количество произведенной продукции — то есть не за количество обусловленных реакций — а за количество прошедших дней недели.) Исследование Скиннера показало, что чем короче интервал между подкреплениями, тем чаще животное проявляет обусловленную реакцию. И наоборот, по мере того, как увеличивается интервал между подкреплениями, частота реакции снижается.

Частота подкрепления также оказывает влияние на угасание условной реакции. Проявление условной реакции угасает с большей скоростью, если имело место непрерывное подкрепление, которое затем резко было прекращено, чем в том случае, когда подкрепление выдавалось с перерывами. Некоторые голуби демонстрировали до десяти тысяч реакций без подкрепления, если исходно у них был сформирован условный рефлекс па основе периодичного, прерывистого подкрепления.

Скиннер исследовал также схему подкрепления с фиксированной частотой. В этом случае подкрепление выдается не по истечении определенного отрезка времени, а после выполнения определенного количества условных реакций. Само поведение животного определяет, насколько часто будет выдаваться подкрепление. Например, требуется совершить десять или двадцать обусловленных ответных реакций, чтобы получить новое подкрепление. Животные, получающие поощрение по схеме с фиксированной частотой, реагируют намного интенсивнее, чем те, которые получают подкрепление по схеме с фиксированным интервалом. Ведь очевидно, что высокая частота реагирования при схеме с фиксированным интервалом не приводит к получению дополнительного подкрепления; животное может нажать на рычаг пять раз или пятьдесят, но подкрепление появится только тогда, когда истечет заданный отрезок времени.

Самые высокие показатели реагирования при схеме подкрепления с фиксированной частотой наблюдались и у крыс, и у голубей, и у людей. Пример тому: сдельная оплата труда, когда заработок работника на его рабочем месте зависит от количества произведенной продукции, а комиссионные зависят от количества продаж. Правда, такая схема подкрепления успешно работает только тогда, когда требуемый уровень обусловленной реакции не слишком высок (так, нормы дневной выработки должны быть реальными) и если ожидаемое подкрепление стоит затраченных усилий.

Бихевиоризм Скиннера

Оперантное поведение возникает без воздействия каких — либо внешних наблюдаемых раздражителей. Реакция организма кажется спонтанной в том смысле, что внешне она никак не связана с каким — либо наблюдаемым раздражителем. Это вовсе не означает, что стимула, вызывающего ту или иную реакцию, не существует; это значит, что при возникновении данной реакции ни один стимул не является наблюдаемым. С экспериментальной же точки зрения, если стимул отсутствует, то это значит, что он нс применялся, а потому и не наблюдается.

Другим различием между респондентным и оперантным поведением является то, что оперантное поведение воздействует на окружающую организм среду, в то время как респондентное поведение этого не делает. Подопытная собака в лаборатории Павлова, закованная в сбрую, не может сделать ничего иного, как только реагировать (например, пускать слюну), когда экспериментатор предлагает ей какие — либо стимулы. Собака сама по себе ничего не может сделать, чтобы достать стимул (пищу).

Оперантное поведение крысы в коробке Скиннера, напротив, является инструментальным в том смысле, что крыса достигает своего стимула (пищи). Когда крыса нажимает на рычаг, она получает пищу; а если не нажимает на рычаг, то не получает пищи. Таким образом крыса воздействует на окружающую среду. (Скиннер очень не любил термин «скиннеровский ящик», впервые введенный Халлом в 1933 году. Он сам называл это оборудование аппаратом оперантного формирования условных рефлексов. Однако термин «скиннеровский ящик» стал столь популярным, что вошел во все справочники и в настоящее время является в психологии общепринятым.)

Скиннер считал, что оперантное поведение характерно для повседневного научения. Поскольку поведение, как правило, носит оперантный характер, то наиболее эффективным подходом к науке о поведении является изучение обусловливания и угасания оперантпого поведения.

Классическая экспериментальная демонстрация заключалась в нажатии на рычаг в скиннеровском ящике. В этом эксперименте крыса, лишенная пищи, помещалась в ящик и получала полную возможность исследовать его. В ходе исследований она неизбежно должна была задеть рычажок, который приводил в действие механизм, выдвигающий полочку с пищей. После получения нескольких порций пищи, которые должны были служить подкреплением, у крысы довольно быстро формировался условный рефлекс. Обратите внимание, что поведение крысы (нажатие на рычаг) оказывает воздействие па окружающую среду и является инструментом приобретения пищи. Зависимая переменная в этом эксперименте проста и понятна: это скорость реакции.

На основании этого эксперимента Скиннер сформулировал свой закон приобретения 93, который гласит, что сила оперантного поведения возрастает, если поведение сопровождается подкрепляющим стимулом. Несмотря на то, что для формирования быстрой реакции нажатия на рычажок требуется практика, ключевым параметром все — таки является подкрепление. Практика сама по себе ничего не дает: она только предоставляет возможность возникновения дополнительного подкрепления.

Закон приобретения Скиннера отличается от положений о научении у Торндайка и у Халла. Скиннер вообще не касался таких последствий подкрепления, как боль — приятное ощущение или удовольствие — неудовлетворение, как это делал Торндайк. Скиннер так же не пытался интерпретировать подкрепление в терминах снижения воздействия побуждений, как это делал Кларк Халл. Системы Торндайка и Халла были объясняющими; система Скиннера является строго описательной.

Скиннер и его последователи провели огромную исследовательскую работу по проблемам научения — таким, как роль наказания в приобретении навыков, воздействие различных систем подкрепления, мера угасания оперантного обусловливания, наличие вторичного подкрепления и т. д.

Кроме крыс они работали и с другими подопытными животными, и с людьми, используя в качестве основного подхода тот же самый принцип <скиннеровского ящика>. Если в качестве подопытных животных использовались голуби, то они должны были клюнуть в определенную точку или пятно; подкреплением являлась пища. Оперантное поведение людей включало такие аспекты, как решение задач, подкрепленное похвалой или осознанием того, что был дан правильный ответ.

Скиннер сообщал, что в качестве подкрепления для своей трехлетней дочери он использовал поглаживание по спине. Однако этот эксперимент обернулся неожиданным образом. Однажды он укладывал девочку спать, гладил ее по спинке и вдруг решил проверить, насколько это является поощряющим подкреплением. «Я подождал, — написал Скиннер, — чтобы она подняла ногу, и тогда погладил ее. Почти сразу же она снова подняла ногу, и я снова погладил ее. Она засмеялась. «Ты над чем смеешься?» — спросил я, и она ответила: «Стоит мне поднять ногу, как ты начинаешь меня гладить!»» (Skinner. 1987. P. 179).

Схема подкрепления

Уже первые исследования в <скиннеровском ящике> с нажатием рычага продемонстрировали значение подкрепления для оперантного поведения. В этой ситуации поведение крысы при каждом нажатии на рычаг получало подкрепление. То есть всякий раз, выполнив правильное действие, крыса получала пищу. Скиннер отмечал, что хотя в реальной жизни подкрепление далеко не всегда бывает последовательным или непрерывным, тем не менее, научение все — таки происходит и поведение сохраняется, даже если подкрепление было случайным или редким.

Не всегда, отправляясь кататься на коньках или на лыжах, мы попадаем на хороший лед или снег… Не всегда, приходя в ресторан, мы получаем хорошую пишу. потому что повара непредсказуемы. Звоня друзьям по телефону. мы не всегда получаем ответ, потому что друзья могут отсутствовать. …Подкрепляющие характеристики деятельности и обучения почти всегда являются прерывистыми. так как просто не имеет смысла контролировать подкреплением каждую реакцию. (Skinner. 1953. P. 99.)

Даже если вы проводите исследования постоянно, вы не при каждом эксперименте получаете реакцию А. На работе вас не каждый день хвалят и не каждый день повышают заработную плату. Каким образом на поведении сказывается такое непостоянное подкрепление? Является ли та или иной режим подкрепления 94лучшим, чем остальные, с точки зрения ее воздействия на поведение? Скиннер и его коллеги посвятили годы исследованию этих вопросов (Ferster & Skinner 1857; Skinner.1969).

Потребность в этих исследованиях возникла не из — за чисто научного любопытства, но на основе практической целесообразности — что, кстати, иллюстрирует тот факт, что наука нередко существенно отличается от той идеализированной модели, которая представляется в некоторых учебниках. Как — то раз в субботу вечером Скиннер обнаружил, что у него почти закончился запас корма. В то время (тридцатые годы) еще нельзя было купить корм у специальных компаний по снабжению исследовательских лабораторий; экспериментатор должен был делать шарики вручную, что являлось достаточно длительным и трудоемким процессом.

Вместо того, чтобы потратить свои выходные на изготовление кормовых шариков, Скиннер задал себе вопрос: что произойдет, если он будет давать подкрепление своим крысам один раз в минуту, независимо от того, какое будет количество ответных реакций? При таком подходе ему потребуется намного меньше корма, и на выходные дни должно хватить. Скиннер решил провести длительную серию экспериментов, чтобы проверить различные варианты системы подкреплений.

В одном таком исследовании Скиннер сравнил частоту реакции у животных, которые получали подкрепление при каждой реакции, с частотой реакций тех животных, которые получали подкрепление только по истечении некоторого интервала времени. Последнее условие получило название схемы подкрепления с фиксированным интервалом. Подкрепление могло выдаваться, например, один раз в минуту или каждые четыре минуты. Важным моментом в данном случае является то, что подопытное животное получало подкрепление только по истечении определенного отрезка времени. (Например, работа, когда деньги выплачиваются раз в неделю или раз в месяц, представляет собой схему подкрепления с фиксированным интервалом; работники получают заработную плату не за количество произведенной продукции — то есть не за количество обусловленных реакций — а за количество прошедших дней недели.) Исследование Скиннера показало, что чем короче интервал между подкреплениями, тем чаще животное проявляет обусловленную реакцию. И наоборот, по мере того, как увеличивается интервал между подкреплениями, частота реакции снижается.

Частота подкрепления также оказывает влияние на угасание условной реакции. Проявление условной реакции угасает с большей скоростью, если имело место непрерывное подкрепление, которое затем резко было прекращено, чем в том случае, когда подкрепление выдавалось с перерывами. Некоторые голуби демонстрировали до десяти тысяч реакций без подкрепления, если исходно у них был сформирован условный рефлекс па основе периодичного, прерывистого подкрепления.

Скиннер исследовал также схему подкрепления с фиксированной частотой. В этом случае подкрепление выдается не по истечении определенного отрезка времени, а после выполнения определенного количества условных реакций. Само поведение животного определяет, насколько часто будет выдаваться подкрепление. Например, требуется совершить десять или двадцать обусловленных ответных реакций, чтобы получить новое подкрепление. Животные, получающие поощрение по схеме с фиксированной частотой, реагируют намного интенсивнее, чем те, которые получают подкрепление по схеме с фиксированным интервалом. Ведь очевидно, что высокая частота реагирования при схеме с фиксированным интервалом не приводит к получению дополнительного подкрепления; животное может нажать на рычаг пять раз или пятьдесят, но подкрепление появится только тогда, когда истечет заданный отрезок времени.

Самые высокие показатели реагирования при схеме подкрепления с фиксированной частотой наблюдались и у крыс, и у голубей, и у людей. Пример тому: сдельная оплата труда, когда заработок работника на его рабочем месте зависит от количества произведенной продукции, а комиссионные зависят от количества продаж. Правда, такая схема подкрепления успешно работает только тогда, когда требуемый уровень обусловленной реакции не слишком высок (так, нормы дневной выработки должны быть реальными) и если ожидаемое подкрепление стоит затраченных усилий.

Теория оперантного бихевиоризма б. Скиннера

Эти проблемы решались в трудах других ученых, и прежде всего в работах Б.Ф. Скиннера (1904– 1990), которого без преувеличения можно назвать центральной, культовой фигурой бихевиористического направления. По мнению некоторых ученых, он является самым выдающимся американским психологом XX в.

Стремясь переработать классический бихевиоризм, Скиннер исходил из необходимости систематического подхода к пониманию человеческого поведения. При этом он считал необходимым исключить из исследования все фикции, к которым прибегают психологи для объяснения вещей, причин которых они не знают. К таким фикциям Скиннер относит многие понятия психологии личности, например понятие самости, автономии, свободы, творчества. С его точки зрения, невозможно говорить о реальной свободе человека, т.к. он никогда реально сам не управляет своим поведением, которое детерминировано внешней средой. В книге “Поведение организма” (1938) он доказывал, что невозможность выявить причинные связи между психическими феноменами и воздействием среды диктует необходимость не объяснять, но скорее описывать систему организм – окружающая среда.

Одной из центральных идей Скиннера является стремление понять причины поведения и научиться им управлять. В этом плане он полностью разделяет разработанные Уотсоном и Торндайком взгляды на социогенетическую природу психического развития, т.е. исходит из того, что развитие есть научение, которое обусловливается внешними стимулами. Однако от констатации Скиннер переходит к разработке методов целенаправленного обучения и управления поведением, а потому в психологию он вошел в первую очередь как теоретик обучения с разработанными им различными программами обучения и коррекции поведения, изложенными в работах “Наука и человеческое поведение” (1953), “Технология обучения” (1968).

Исходя из представления о том, что не только умения, но и знания представляют собой вариации поведения, Скиннер разрабатывает его особый вид – оперантное поведение. В принципе он исходит из того, что психика человека основана на рефлексах разного рода и разной степени сложности. Однако, сравнивая свой подход к формированию рефлексов с подходом Павлова, он подчеркивает существенные различия между ними. Условный рефлекс, формируемый в экспериментах Павлова, он называет стимульным поведением, т.к. его формирование связано с ассоциацией между разными стимулами и не зависит от собственной активности субъекта. Так, собаке по звонку всегда дается мясо, независимо от того, что она в этот момент делает. Таким образом, происходит ассоциация между мясом и звонком, в ответ на который наблюдается слюноотделение. Однако, подчеркивал Скиннер, такая реакция быстро формируется, но и быстро исчезает без подкрепления, она не может быть основой постоянного поведения субъекта.

В противовес этому подходу при оперантном обучении подкрепляется не стимул, но поведение, операции, которые совершает субъект в данный момент и которые приводят к нужному результату. Большое значение имеет тот факт, что сложная реакция при этом разбивается на ряд простых, следующих друг за другом и приводящих к нужной цели. Так, при обучении голубя сложной реакции – выходу из клетки при помощи нажатия клювом на рычаг, Скиннер подкреплял каждое движение голубя в нужном направлении, добиваясь того, что, в конце концов, он безошибочно выполнял эту сложную операцию. Этот подход к формированию нужной реакции имел большие преимущества по сравнению с традиционным. Прежде всего, это поведение было намного устойчивей, оно очень медленно угасало даже при отсутствии подкрепления. Скиннер обратил внимание на то, что даже одноразовое подкрепление может иметь значительный эффект, т.к. при этом устанавливается, пусть и случайная, связь между реакцией и появлением стимула. Если стимул был значимым для индивида, он будет пытаться повторить реакцию, которая принесла ему успех. Такое поведение Скиннер называл “суеверным”, указывая на его значительную распространенность.

Не меньшее значение имеет тот факт, что обучение при оперантном обусловливании идет быстрее и проще. Это связано с тем, что экспериментатор имеет возможность наблюдать не только за конечным результатом (продуктом), но и за процессом выполнения действия (ведь оно разложено на составляющие, реализуемые в заданной последовательности). Фактически происходит экстериоризация (переход во внешний план) не только исполнения, но и ориентировки и контроля за действием. Особенно важно, что такой подход возможен при обучении не только определенным навыкам, но и знаниям. Разработанный Скиннером метод программного обучения давал возможность оптимизировать учебный процесс, разработать корректирующие программы для неуспевающих и умственно отсталых детей. Кроме того, эффективность и безошибочность выполнения повышали мотивацию учения, активность учащихся. Наблюдение за процессом решения также давало возможность индивидуализировать процесс обучения в зависимости от темпа усвоения знания.

Оперантным научением в своей книге “Вербальное поведение” (1957) объяснял Скиннер и развитие речи. Он доказывал, что человеческая речь также является поведением, его особой формой – вербальной, и, следовательно, подчиняется тем же законам, что и другие формы поведения. Против теории вербального поведения выступил известный американский лингвист Н. Хомски. Отрицая отождествление языка с поведением, Хомски выдвинут свою теорию, ключевым понятием которой стало представление о порождающей грамматике. Изучая, каким образом человек способен производить и понимать уникальные грамматические конструкции, Хомски пришел к выводу о том, что человек обладает неким доопытным механизмом усвоения языка, который детерминирует процесс формирования речи. Этим и объясняется тот факт, что дети во всем мире осваивают язык с одинаковой скоростью, демонстрируя при этом сходные последовательности этапов.

В последующие годы Скиннер обращается к проблеме социализации человека, разрабатывая вопросы о возможности обучения “нормативному поведению”. Разработанный им метод бихевиоральной терапии, также основан на научении методом “проб и ошибок”. Однако при этом Скиннер основывался не только на идеях оперантного подхода, но и на взглядах Фрейда, убежденный в том, что его главным открытием являлись не комплексы вины, а сохранение моделей поведения, усвоенных в детстве. Изложению позиции ученого по этим вопросам посвящены книги “По ту сторону свободы и достоинства” (1971), “Размышления о бихевиоризме и обществе” (1978).

Если программы обучения детей, разработанные Скиннером, были встречены с энтузиазмом и получили повсеместное распространение, то его подход к программированию поведения подвергся обоснованной критике. Прежде всего, речь шла о недопустимости тотального контроля за поведением, без которого невозможно применение его программ, о этических и культурных нормах, ограничивающих выбор подкрепления и наказания социально желательного/нежелательного поведения. Однако, несмотря на эти недостатки, подход Скиннера дал реальную возможность корректировать и направлять процесс обучения, процесс формирования новых форм проведения. Он оказал огромное влияние на психологию и в современной американской науке. Скиннер является одним из наиболее влиятельных авторитетов, превзойдя по количеству цитирования и сторонников даже Фрейда. При этом наибольшее влияние его теория оперантного поведения оказала на практику, дав возможность пересмотреть процесс научения и разработать новые подходы и новые программы обучения.

Критика бихевиоризма Скиннера

Более всего возражений против бихевиоризма Скиннера вызвали его крайний позитивизм и отрицание всех теорий. Оппоненты Скинне — ра утверждают, что свести к нулю все теоретические построения невозможно. Поскольку детали эксперимента должны быть запланированы заранее, то уже это само по себе является свидетельством построения хотя бы простейшей теории. Отмечалось также, что принятие Скинне — ром базовых принципов формирования условных рефлексов в качестве основы для своей работы также является до некоторой степени теоретизированием.

Сложившаяся система взглядов придавала Скиннеру уверенности в экономических, социальных, политических и религиозных вопросах. В 1986 году он написал статью с многообещающим названием <Что неправильно в западном образе жизни?> (What is Vrong with Life in the Western World?) В этой статье он утверждал, что <поведение жителей Запада ухудшилось, но его можно улучшить посредством применения принципов, выведенных на основании экспериментального анализа поведения> (Skinner. 1986. P. 568). Критики обвинили Скинне — ра в том, что его готовность экстраполировать на основании опытных данных является несовместимым с его антитеоретическими установками и демонстрирует тот факт, что в своем стремлении представить собственный проект переустройства общества он выходит за рамки строго наблюдаемых данных.

Узкий диапазон исследований поведения в скиннеровских лабораториях (нажать на рычаг или клюнуть ключ) также не избежал критики. Противники теории Скиннера утверждали, что такой подход попросту игнорирует многие аспекты поведения. Утверждение Скиннера о том, что любое поведение является заученным, было оспорено его бывшим студентом, который обучил более шести тысяч животных 38 видов выступать в телевизионных программах, аттракционах и на ярмарках (Breland & Breland. 1961). Свиньи, куры, хомяки, дельфины, киты, коровы и прочие животные демонстрировали тенденцию к инстинктивному поведению. Это значит, что они замещали инстинктивным поведением то, которое получало подкрепление, даже если это инстинктивное поведение мешало им получить пищу. Таким образом, подкрепление оказалось не столь всемогущим, как утверждал Скиннер.

Позиция Скиннера в вопросах вербального поведения — в частности, его объяснение того, каким образом дети учатся говорить, — оспаривалось на том основании, что определенные виды поведения должны быть наследственными. Критики утверждали, что младенец не изучает язык слово за словом благодаря подкреплению, получаемому за каждое правильно произнесенное слово, — ребенок осваивает грамматические правила, необходимые для того, чтобы строить предложения. А вот потенциал для формирования таких правил, утверждают противники Скиннера, является наследственным, а не заученным (Chomsky.1959,1972).

Значение бихевиоризма Скиннера

Несмотря на эту критику, Скиннер оставался бесспорным лидером и героем бихевиоральпой психологии — по крайней мере, в течение трех десятилетий американская психология формировалась под влиянием работ Скиннера в большей степени, нежели работ какого — либо другого психолога.

В 1958 году Американская психологическая ассоциация вручила Скиннеру премию «За выдающийся вклад в развитие науки>, отмечая, что <мало кто из американских психологов оказал такое глубокое влияние на развитие психологии и воспитание многообещающих молодых ученых». В 1968 году Скиннер получил национальную медаль, что является высшей наградой, которой правительство Соединенных Штатов удостаивает за вклад в науку. В 1971 году Американский психологический фонд представил Скиннера к награждению золотой медалью; его фотография появилась на обложке журнала «Тайм». А в 1990 году он был отмечен занесением на доску почета Американской психологической ассоциации за большой вклад в психологию.

Очень важно понять, что основной целью Скиннера являлось улучшение жизни отдельных людей и общества в целом. Несмотря на механистическую природу его системы, он по сути был гуманистом. Это качество ярко проявилось в его усилиях модифицировать поведение людей в реальных условиях семей, школ, предприятий и больниц. Он надеялся, что его технология поведения облегчит страдания людей, и потому чувствовал все возрастающее разочарование, понимая, что, несмотря на всю свою популярность и влияние, его система не получает широкого распространения.

К старости Скиннер стал более пессимистически настроен в отношении надежд, что наука способна на своевременное преобразование общества. Его отчаяние по поводу будущею мира росло. (Bjork. 1993. P. 226.)

Не подлежит сомнению тот факт, что радикальный бихевиоризм Скиннера завоевал и до сих пор удерживает за собой сильные позиции в психологии. «Журнал экспериментального анализа поведения» и «Журнал прикладного анализа поведения» (Journal of the Experimental Analysis of Behavior и Journal Applied Behavior Analysis ) продолжают процветать, равно как и Отделение экспериментального анализа поведения при Американской психологической ассоциации. Применение принципов Скиннера — в особенности модификации поведения — остается популярным, а результаты этой деятельности подтверждают правильность подхода Скиннера. По всем меркам профессионального и общественного признания бихевиоризм Скиннера определенно затмил все прочие виды бихевиоральной психологии.

38.Особенности оперантного бихевиоризма б.Ф. Скиннера.

Беррес Фредерик Скиннер (1904-1990) американский психолог, изобретатель, писатель, представитель бихевиоризма.

Интересно знать:

— Когда ему было 14 лет, он на основе скрупулезного анализа шекспировских пьес выдвинул собственную гипотезу об их авторстве, которое приписал Френсису Бэкону.

— Во время учебы на психологическом отделении Гарвардского университета он установил для себя очень строгий режим учебных занятий,

так, на внеучебные занятия он отводил 15 мин в сутки. Уже после трех лет такого напряженного труда Скиннер получил докторскую степень.

-11 ноября 1953 г Скиннер посетил урок арифметики в школе, где училась его дочь. Это впечатлило его настолько, что он стал пытаться применить свою теорию подкрепления к улучшению преподавания школьных предметов.

— В 1972 г. Американская психологическая ассоциация назвала самых

выдающихся психологов XX столетия. По их почти единодушному мнению,

этот почетный список возглавил Б. Ф. Скиннер, опередив даже Фрейда (тот

был назван вторым),

* *

В своих экспериментах Скиннер явно отдавал предпочтение экспериментированию над животными, преимущественно голубями и крысами, считая, что отличие человека от животных на самом деле совсем не принципиально.

Радикальный бихевиоризм Скиннера опирался на разработки эволюционных теорий, связывая поведение людей с событиями среды. Он считал, что природа отбирает внешние видовые признаки, способствующие выживанию, аналогично обстоит дело и с поведением. Человек не свободен, так как сам никогда не управляет своим поседением, которое детерминировано внешней средой. Человеком отбираются и сохраняются только те виды поведения, которые получают подкрепление.

Скиннер видел задачу психологии в том, чтобы определить однозначное соответсвие между событиями внешней среды и специфическим поведением. Ситуацией, в которой можно проконтролировать все воздействующие факторы, может быть только экспериментальная (ввел метод экспериментального анализа поведения).

Все факторы, влияющие на поведение, получили названия независимых переменных, ответные поведенческие реакции — зависимых переменных.

Скиннер отрицал воздействие на человека личностных свойств,, убеждений, морали и т.д. Личность понимается как набор поведенческих шаблонов «ситуация – реакция», причем последняя зависит от предыдущего опыта и генетической истории.

Поведение можно разделить на три вида:

— безусловно-рефлекторное

— условно-рефлекторное,

— оперантное.

Первые два вида поведения были описаны Павловым и получили у Скиннера название респондентное поведение. Оперантное поведение играет решающую роль в адаптации организма к внешним условиям. Оперантное поведение (научение) — спонтанное, добровольное поведение, которое нельзя вызвать искусственно, но вероятность его можно повысить, если за ним последует подкрепляющее событие или положительный стимул.

Главной характеристикой оперантного поведения является его зависимость от прошлого опыта, или последнего стимула, получившего название подкрепления. Поведение усиливается или ослабляется в зависимости от подкрепления, которое может быть положительным, отрицательным и нейтральным, однако положительное подкрепление наиболее эффективно в формировании желательного поведения. Процесс подкрепления за совершенное действие называется обусловливание.

На основе подкрепления можно построить всю систему обучения

(программированное обучение) и воспитания человека.

Современное применение принципов оперантного обучения Скиннера широко. Его теория и практические результаты исследований получили широкое применение в педагогике (обучение навыкам общения) и медицине (биологическая обратная связь), в мире бизнеса и в рекламной практике (принцип небольших подарков и накопленных бонусов).

теория «оперантного бихевиоризма» Скиннера и «промежуточных переменных» э. Толмена

К началу 30-х гг. стало очевидно, что нельзя объяснить ни поведение животных, ни поведение человека одним сочетанием наличных стимулов. Эксперименты показали, что в ответ на воздействие одного и того же стимула могут следовать разные реакции, одна и та же реакция пробуждается различными стимулами.

Возникло предположение, что есть нечто определяющее реакцию помимо стимула, точнее во взаимодействии с ним, возникло учение необихевиоризма. Ярким представителем необихевиоризма был датский ученый Эдвард Толмен (1886—1959). Развивая идеи Д. Уотсона, Э. Толмен предложил ввести в рассуждение еще одну инстанцию, обозначаемую понятием «промежуточная переменная (V)», под которой понимались внутренние процессы, которые опосредуют действия стимула, т. е. влияют на внешнее поведение. К ним относятся такие образования, как «намерения», «цели» и т. д. Таким образом, обновленная схема стала выглядеть следующим образом: S — V — R.

Поведенческая концепция рассматривает личность как систему реакций на различные стимулы (Б. Скнннер, Дж. Хоманс и др.). Отдельную линию в развитии бихевиоризма представляет система взглядов Б. Скиннера. Скнннер выдвинул теорию оперантного бихевиоризма. Его механистическая концепция поведения и разработанная на ее основе технология поведения, используемая в качестве орудия управления поведением людей, получили широкое распространение в США и оказывают влияние и в других странах, в частности в странах Латинской Америки, как инструмент идеологии и политики.

Скиннер формулирует положение о трех видах поведения: безусловнорефлекторном, условно-рефлекторном и оперантном. Последнее и составляет специфику учения Б. Скиннера.

Безусловнорефлекторный и условно-рефлекторный виды поведения вызываются стимулами и называются респондентным, отвечающим поведением. Это реакция типа S. Они составляют определенную часть репертуара поведения, но только ими не обеспечивается адаптация к реальной среде обитания. Реально процесс приспособления строится на основе активных проб — воздействий животного на окружающий мир. Некоторые из них случайно могут приводить к полезному результату, который в силу этого закрепляется. Такие реакции (R), которые не вызываются стимулом, а выделяются («испускаются») организмом, некоторые из которых оказываются правильными и подкрепляются, Скиннер назвал оперантными. Это реакции типа R. По Скиннеру, именно эти реакции являются преобладающими в адаптивном поведении животного: они являются формой произвольного поведения.

На основе анализа поведения Скиннер формулирует свою теорию научения. Главным средством формирования нового поведения выступает подкрепление. Вся процедура научения у животных получила название «последовательного наведения на нужную реакцию».

Данные, полученные при изучении поведения животных, Скиннер переносит на человеческое поведение, что приводит к крайне биологизаторской трактовке человека. Так, на основе результатов научения у животных возник скиннеровский вариант программированного обучения.

Скиннер сформулировал принцип оперантного обусловливания — «поведение живых существ полностью определяется последствиями, к которым оно приводит. В зависимости от того, будут ли эти последствия приятными, безразличными или неприятными — живой организм проявит тенденцию повторять данный поведенческий акт, не придавать ему никакого значения или же избегать его повторения в дальнейшем». Человек способен предвидеть возможные последствия своего поведения и избегать тех действий и ситуаций, которые могут привести к негативным для него последствиям.

Отправить ответ

avatar
  Подписаться  
Уведомление о