Глава 10 Образование связи между процессами, протекающими в мозгу: научение

  Большинство сенсорных механизмов, будучи врожденными, в течение всей жизни индивидуума служат его приспособлению к среде одним и тем же способом. Действует ли на роговицу глаза струя воздуха или прикосновение постороннего тела, мигательный рефлекс одинаково вызывается импульсами, возникающими в болевых рецепторах роговицы. Такие формы приспособления определены генетически, и у всех представителей данного вида (например, у всех людей) возникают одни и те же рефлексы. Такие рефлексы называются безусловными.
Безусловные и условные стимулы. Сенсорный путь участвует также в приобретенной рефлекторной активности, которая формируется у индивидуума в течение жизни. В процессе филогенеза фиксированная система врожденных, неизменных рефлексов оказалась недостаточной для выживания в изменяющейся среде. Животному, например, поздно начинать защищаться, когда враг уже схватил его. Поэтому развились такие поведенческие функции — более пластичные, чем безусловные рефлексы,— которые позволили животному приспосабливаться к непрерывным изменениям среды. Такие рефлексы вырабатываются, когда импульсы поступают в головной мозг по разным путям более или менее одновременно: условные рефлексы — это результат образования связи между процессами, происходящими в мозгу. Разного рода стимулы, сами по себе несущественные (шумы, запахи, тени и т. п.), могут вызывать ощущения, которые ассоциируются с другими, например с возникающими при нападении врага. В дальнейшем эти ассоциированные «сигналы» тоже будут вызывать оборонительное поведение.
Результат условнорефлекторного научения, часто входящий в сложные поведенческие акты в качестве скрытого, едва заметного компонента, может принадлежать к одному из следующих двух типов (оба они воспроизводимы в лабораторных условиях): первый тип — это павловский классический условный рефлекс, а второй — оперантная реакция.
Тип I. Научение путем выработки классического условного рефлекса
При описании роли рефлексов в поведении лучше всего следовать за ходом мысли Павлова. У детенышей в течение некоторого времени после рождения слюноотделение (в данном случае безусловнорефлекторное) можно вызвать, только положив животному пищу в рот, т. е. химически стимулируя вкусовые луковицы. В дальнейшем сами по себе несущественные стимулы, например цвет или запах мяса, сделаются сигналами безусловных (например, существенных химических) раздражителей, и животное будет отвечать слюноотделением на разные сочетающиеся с безусловными зрительные или обонятельные стимулы. Это уже Не врожденная реакция (она никогда не возникает у животных, вскормленных молоком) — животное должно ей обучиться.
Условный стимул как сигнал. Импульсы, вызываемые безусловным стимулом (например, химическим раздражением от мяса), могут дойти до специфических нейронов в головном мозгу одновременно с импульсами, вызванными другим, ранее несущественным стимулом (например, запахом мяса); несколько таких совпадений превратят нейтральный стимул в сигнал, способный самостоятельно вызвать автоматическую реакцию (например, слюноотделение).
Естественные условные рефлексы, например такие, как описанный выше, формируются в течение жизни животного. В то же время в лабораторных условиях с помощью специального оборудования можно вырабатывать искусственные условные реакции. При простейшей форме выработки животному одновременно дают пищу и включают звуковой стимул. После нескольких сочетаний один лишь звук начинает вызывать слюноотделение.
Необходимость сочетания стимулов. В такого рода экспериментах одновременно активируются две сенсорные системы животного: в подкорковые и корковые слуховые области приходит возбуждение от звукового раздражителя, а представительствам в продолговатом мозгу, таламусе и коре адресуется химический (вкусовой) стимул. Оба они сами по себе могут действовать как безусловные раздражители, так как каждый может вызывать автоматическую реакцию. Пища вызывает движение или слюноотделение, а звук — ориентировочный рефлекс (поворот головы к источнику звука).
Если импульсы, вызываемые двумя безусловными стимулами, несколько раз придут в центральные структуры одновременно, то между двумя центрами образуется особого рода связь. Направлена она будет в сторону биологически более важного, т. е. более сильного рефлекса. Для указанного выше
сочетания стимулов эту связь можно представить следующим образом:
Кортиев Слуховой Слуховой Двигательный ^Мышцы (ориен- орган              путь              центр              центр              тировочный
рефлекс)
Вкусовой Сенсорный Сенсорный Центр слюно- Слюнная же- рецептор путь для вкуса" центр вкуса              отделения              леза (слюно
отделение)
Биологически менее важный ориентировочный рефлекс исчезает (привыкание), а звуковой стимул вызывает более сильную реакцию, связанную с приемом пищи. Для вновь образованного рефлекса используется эфферентная ветвь автоматической, врожденной рефлекторной дуги. Сущность механизма приобретенного рефлекса состоит в связи между центральными структурами, участвующими в обоих видах реакций. Но, как мы увидим, связь эта временная.
Новый рефлекс удовлетворяет условию сочетания стимулов: он образуется в результате одновременного прихода двух разных серий импульсов в высшие центры. Биологически менее важный стимул приобретает роль сигнала и становится условным стимулом, способным передать информацию, которая содержится в более сильном безусловном стимуле; если связь стала прочной, этот последний перестает быть необходимым.
Тип П. Инструментальное (оперантное) научение
С этой формой условнорефлекторного научения можно познакомиться на другом хорошо известном примере. Выработка рефлекса происходит без сочетания стимулов и без применения условного стимула. Принцип эксперимента состоит в том, что животное получает или награду (пищу), или наказание (боль) в зависимости от того, нажало оно или не нажало на рычаг. В нескольких первых пробах нажатие на рычаг осуществляется в результате спонтанной беспорядочной активности животного. При первом таком случайном нажатии животное получает пищу. Это подкрепление будет приводить к повторению удачной реакции: животное будет снова нажимать на рычаг в надежде получить пищу. Частота двигательных реакций зависит от самого животного: когда оно захочет получить корм, оно будет нажимать на рычаг. Наклон кривой, приведенной на рис. 49, отражает частоту осуществления выработанной реакции.
Важное значение подкрепления. Инструментальный (или опе- рантный, по терминологии Скиннера) условный рефлекс всегда представляет собой активную двигательную реакцию, для которой подкрепление служит самым важным фактором. На эту реакцию можно влиять, изменяя частоту подкрепления.
Рис. 49. А. Схема экспериментальной установки для выработки классических условных рефлексов.
Рис. 49. А. Схема экспериментальной установки для выработки классических условных рефлексов. Б. Аппарат, применяемый для выработки инструментальных условных рефлексов. Животное не может двигаться, в его головной мозг вживлены электроды, а внутренние органы можно стимулировать через введенные в них трубки. Животное получает пищу при нажиме на рычаг. В. Кривая научения, показывающая частоту нажимов. В горизонтальных промежутках между двумя стрелками пищевое подкрепление не подается.
Оперантное научение очевидным образом отличается от описанного выше опыта с выработкой классического условного рефлекса. Этот тип научения впервые в 1913 г. описал Торндайк (Thorndike); он объяснил свои результаты явлением, которое он назвал законом эффекта. Согласно этому закону, двигательная реакция усиливается положительным результатом (например, получением пищи), к которому приводит случайная активность животного. Эта теория согласуется с представлением Дарвина, что только такое поведение прочно закрепляется, которое су
щественно для выживания индивидуума и вида. Следует подчеркнуть, что в отличие от павловского условного рефлекса двигательная реакция в этом случае не вызывается внешним стимулом или сигналом, а вырабатывается на основе подкрепления, которое следует за определенным движением. Сложные стимулы, связанные с обстановкой, служат фоном и приобретают значение только в случае дифференцировки, когда, скажем, нажатие на рычаг подкрепляется при наличии одного стимула (например, шума машины) и не подкрепляется при другом стимуле (например, свистке).
Снова совмещение во времени. Что касается мозгового механизма инструментального научения, то и здесь, как и при павловском условном рефлексе, следует предполагать образование временной связи между двумя функциональными системами. При ориентировочной двигательной активности импульсы обратной аффереитации активируют нейроны пропрноцептивного представительства в головном мозгу. За этим следует возбуждение, вызванное пищевым подкреплением. В результате в обеих центральных областях происходит специфическое повышение возбудимости. По мнению большинства исследователей, предпосылки для выработки условных реакций того и другого типа одни и те же: требуется более или менее одновременное возбуждение двух разных областей мозга (рис. 50).
Развитие оперантных условных рефлексов скорее всего связано с удовлетворением какой-нибудь физиологической потребности (например, голода) в процессе подкрепления. Согласно Халлу (Hull), для того чтобы поведение прочно закрепилось, в его основе должно лежать стремление удовлетворить какую- то насущную потребность. Двигательная реакция, достигающая этой цели, тем самым ослабляет побуждение. К этому вопросу мы вернемся позже.
Программированное обучение: игральные автоматы. На основе работы Скиннера оперантное научение используется во многих областях человеческой деятельности. Созданные в последнее время теории программированного обучения тоже содержат элементы этих рефлексов, поскольку обратная связь у обучающегося используется для подкрепления. Программы с подкреплением используются также при конструировании различных игральных автоматов: время от времени играющий получает награду (подкрепление), чтобы он не потерял интерес к игре, но нажатие на рычаг (или вкладывание монеты) должно быть достаточно частым, чтобы владелец автомата получал прибыль.
Ошибочное научение; суеверия. Скиннер исследовал также биологическую основу суеверий и нашел, что у животных можно обнаружить формы поведения, сходные с различными суевериями у человека. Он установил, что в их основе лежит
образование какой-то «ошибочной» связи в головном мозгу, т. е. выработка неадекватного поведения.
«Заблуждающиеся» голуби. Неоправданное, случайное подкрепление (награда) в опытах с животными может вызывать у них «заблуждения». Примером такого случайного процесса может служить следующая экспериментальная ситуация. Голубя помещают в скиннеровский ящик, на одной из стенок которого
Тип!              Тип              II
Нлассичесное              Инструментальное
научение              научение
Рис. 50. Как классическое условнорефлекторнсе, так и инструментальное научение может быть объяснено теорией одновременного возбуждения.
Рис. 50. Как классическое условнорефлекторнсе, так и инструментальное научение может быть объяснено теорией одновременного возбуждения.
расположены освещенные разноцветные кружки. В этой же стенке проделано отверстие, через которое голубь получает пищу каждый раз, когда он клюнет, скажем, красный кружок. После нескольких проб голубь начинает клевать его все чаще, и таким образом вырабатывается оперантный условный рефлекс. Корм подается после определенного числа ударов клювом, например после 20 или 50, и птица приспосабливается к такой частоте подкрепления. Клевание оказывается довольно регулярным и прекращается только на время получения пищи, а затем возобновляется. Такая форма поведения может сохраняться в течение нескольких дней. Если из-за какой-то неисправности автоматической кормушки голубь неожиданно получит пищевое подкрепление, например после случайного движения правой ноги, он будет снова и снова повторять это движение, так как в высших центрах между этой двигательной реак
цией и ее результатом (получением пищи) уже образовалась связь. Такова вкратце экспериментальная модель ошибочного поведения.
Мы также наблюдали ошибочное поведение у подопытных обезьян. Животное должно было нажать на рычаг 25 раз, чтобы получить конфету из металлической трубки, укрепленной на расстоянии около 10 см от рта. Однажды, когда обезьяна случайно коснулась трубки ртом, конфета выпала перед ней тогда, когда она не должна была ее получить, если бы автоматическая кормушка не была испорчена, так как это не было 25-е нажатие на рычаг. Случайное подкрепление побудило обезьяну стараться прикоснуться ртом к трубке, и мы еще долго могли наблюдать такое поведение.
Аналогия с человеком? Аналогия с действиями человека, основанными на суевериях, очевидна. Учителя и психологи часто наблюдают такие действия у детей, особенно в период полового созревания, когда научение идет особенно интенсивно. В развитии таких явлений у человека (и, возможно, у животных) участвует эмоциональное состояние тревоги. Известно, что ошибочные ассоциации возникают на фоне страха или тревоги и имеют целью избавление от страха. Суеверия, основанные на ошибочных заключениях о причинных связях, передаются из поколения в поколение и при сходных обстоятельствах возникают снова и снова. К безобидным проявлениям такой воображаемой причинной связи относится, например, ношение талисманов или надевание одной и той же одежды на экзамены. 

Источник: Адам Д., «Восприятие, сознание, память. Размышления биолога» 1983

А так же в разделе «  Глава 10 Образование связи между процессами, протекающими в мозгу: научение »