Karen Pryor
DON’T SHOOT THE DOG!: THE NEW ART OF TEACHING AND TRAINING
© Новикова Т. О., перевод на русский язык, 2014
© Оформление. ООО «Издательство «Э», 2016
«Эта великолепная, доступная и чрезвычайно полезная книга предназначена для тех, кто хочет понять или изменить поведение животного – идет ли речь о постоянно лающей собаке, шумном соседе, злобном коте – или свое собственное и свои дурные привычки».
Кэрол Тэврис, автор книги «Гнев»
«Карен Прайор объясняет, почему наказание и насильственные попытки заставить людей измениться так часто заканчиваются полным провалом. Она описывает конкретные методы, которые действительно работают. Эта книга в гораздо большей степени связана с человеческими отношениями, чем все проникнутые добрыми побуждениями, но абсолютно неопределенные призывы любить вредных соседей или становиться лучше. Прайор показывает, как можно перейти от намерений к результатам».
Кэрол Тэврис, автор книги «Гнев»
«Карен Прайор была пионером… Каждый, кто хочет более эффективно воспитывать детей, изменить собственное поведение или учить других, сочтет ее книгу очень полезной».
Б. Ф. Скиннер
«Книга «Не рычите на собаку!» открыла мне глаза. Я всем сердцем понял, как нужно общаться с моими собаками, а также с клиентами и учениками».
Ли Ливингуд, руководитель центра дрессировки
«Карен обладает уникальным даром. Она научила нас пользоваться положительным подкреплением не только для дрессировки наших животных, но и в обычной, повседневной жизни».
Тереза Лойя, директор центра подготовки собак-компаньонов
«Эта книга оказала огромнейшее влияние на то, как я общаюсь со своими учениками – и людьми, и собаками, не говоря уже о друзьях, коллегах и собственном муже».
Элизабет Тесель, профессиональный дрессировщик и консультант по литературной подготовке
Посвящается моей матери, Салли Ондек, моей мачехе, Рикки Уайли, и Уинифрид Старли, моей наставнице и подруге
ПСИХОЛОГИЧЕСКИЕ БЕСТСЕЛЛЕРЫ
Начни с главного! 1 удивительно простой закон феноменального успеха
Бестселлер «Начни с главного!..» заменит все книги по тайм-менеджменту и покажет вам кратчайший путь к достижению своих целей. Вы узнаете о том, как дисциплина и списки задач на самом деле влияют на работу, а также познакомитесь с 4 ворами вашей продуктивности. И самое главное – применение всего лишь одного удивительно простого закона, который лежит в основе любого успеха, поможет вам достигать выдающихся результатов один за другим.
Хватит быть хорошим! Как прекратить подстраиваться под других и стать счастливым
Боитесь говорить «нет»? Хватит игнорировать собственные потребности! Все беды от того, что мы так и норовим перекроить себя под ожидания окружающих, считает Тома Д’Ансембур. Эта книга научит вас улучшать отношения с окружающими, оставаясь самим собой.
Ругаться нельзя мириться. Как прекращать и предотвращать конфликты
Что мешает нам избегать взаимных претензий и ссор? Можно ли улучшить уже испорченные отношения? И что для этого нужно сделать? В своей книге Дэвид Бернс отвечает на эти и многие другие вопросы. Известый американский психолог предлагает методику, которая помогла сохранить отношения миллионам людей по всему миру, вырваться из заколдованного круга бесконечных скандалов, научиться проявлять нежность и уважение друг к другу. Это отличное практическое руководство для всех, кто хочет радоваться общению и жить в гармонии.
Договориться не проблема. Как добиваться своего без конфликтов и ненужных уступок
Эта книга – потрясающе увлекательное и одновременно простое руководство по любым переговорам. Не важно, идет ли речь о покупке международной корпорации или ремонте стиральной машинки: 9 методов Криса Восса, выдающегося специалиста ФБР по спасению заложников, работают во всех случаях. При любых условиях. При любых раскладах. Без необходимости идти на компромисс.
Предисловие
Эта книга о том, как научить любого – человека или животное, молодого или старого, себя или других – делать то, что можно и нужно. Как отучить кошку прыгать на кухонный стол и как заставить бабушку перестать пилить всех вокруг. Как повлиять на поведение детей, начальников, друзей и домашних животных. Как научиться хорошо играть в теннис или гольф и как улучшить математические способности и память. Всего этого можно добиться с помощью принципов подкрепления.
Эти принципы – настоящие законы. Они ничем не отличаются от законов физики. Эти законы описывают все ситуации обучения точно так же, как падение яблока описывается законом всемирного тяготения. Когда бы мы ни пытались изменить поведение – собственное или другого человека, – мы всегда используем эти законы, даже если сами этого не осознаем.
Обычно мы пользуемся этими законами неправильно. Мы угрожаем, спорим, принуждаем, лишаем чего-либо. Мы набрасываемся на окружающих, когда ситуация складывается не так, как нам хотелось бы, и упускаем возможность похвалить за правильные действия. Мы грубы и нетерпеливы с собственными детьми, друг с другом и даже с самими собой. Но наши грубость и нетерпение вызывают в нас чувство вины. Мы догадываемся, что с помощью других методов можно достичь желанной цели гораздо быстрее и без неприятностей. Но мы ничего не знаем об этих методах. Мы просто не владеем теми методами, которыми пользуются современные дрессировщики, отлично осознающие силу положительного подкрепления.
Какова бы ни была задача дрессировки – нужно ли вам заставить четырехлетнего малыша вести себя на людях прилично, утихомирить веселого щенка, сплотить команду или выучить наизусть стихотворение, – с помощью положительного подкрепления вы добьетесь ее быстрее, лучше и даже веселее.
Законы подкрепления просты: вы можете написать их на доске за десять минут и выучить за час. Гораздо сложнее применять эти законы на практике. Обучение с помощью подкрепления подобно игре, а результат зависит от скорости мышления.
Дрессировщиком и учителем может стать любой. Некоторые добиваются успеха с самого начала. И для этого не требуется особого терпения, или силы характера, или умения общаться с животными и детьми, или того, что цирковой дрессировщик Фрэнк Бак называл «силой человеческого взгляда». Нужно просто понимать, что вы делаете.
Всегда были люди, обладающие интуитивным пониманием того, как следует применять законы тренировки. Их мы называем одаренными учителями, блестящими командующими, великолепными тренерами чемпионов, гениальными дрессировщиками. Я наблюдала за рядом театральных режиссеров и дирижеров симфонических оркестров. Эти люди великолепно использовали прием подкрепления. Им не нужны были книги, где рассказывалось бы о преимуществах этих законов. Но для остальных людей, тех, кто никак не может справиться с неуправляемым щенком или постоянно конфликтует с коллегой или сыном, знание законов подкрепления может стать настоящим даром небес.
Подкрепление – это не система наград и наказаний. Современные специалисты вообще не используют подобных слов. Концепция награды и наказания несет в себе огромный груз эмоциональных ассоциаций и интерпретаций – желание, страх, вина, долг, запрет. Например, мы вознаграждаем других за то, что сделали сами, – мы покупаем мороженое ребенку, чтобы помириться с ним после сердитого выговора. Мы думаем, что знаем, какой должна быть награда: мороженое или похвала. Но некоторые не любят мороженое, а похвала в неподходящий момент или от неподходящего человека может больно ранить. В некоторых случаях учительская похвала обязательно вызывает неприязнь со стороны других учеников.
Мы рассчитываем на то, что люди будут поступать правильно и без награды. Дочь-подросток должна мыть посуду, потому что это ее домашняя обязанность. Мы злимся, когда дети или коллеги что-то ломают, воруют, опаздывают, грубят и т. п., потому что эти люди должны были знать, что такое поведение недопустимо. Мы наказываем спустя длительное время после нежелательного поступка – великолепным примером этого может служить судебный приговор за преступление. И такое событие может не оказать никакого влияния на будущее поведение, а остаться обычным возмездием. Тем не менее мы рассматриваем подобные наказания как средство обучения. Люди часто говорят: «Я дал ему урок».
Современная дрессировка с помощью подкрепления основывается вовсе не на «всеобщих убеждениях», а на законах поведенческой науки.
Научно говоря, подкрепление – это событие, которое (а) происходит во время или сразу по завершении желательного поведения и (б) повышает вероятность повторения подобного поведения в будущем. Здесь можно выделить два ключевых элемента: два события связаны в реальном времени – поведение порождает подкрепление, – после чего желательное поведение повторяется гораздо чаще.
Подкрепление может быть положительным (то есть тем, что нравится ученику и чего он хочет: улыбка, поглаживание) или отрицательным (тем, чего ученик стремится избежать: рывок поводка или нахмуренное выражение лица). Самое важное – это временная связь между событиями: проявляется поведение, проявляется и подкрепление. Благодаря этому желательное поведение повторяется гораздо чаще, а нежелательное исчезает быстрее. Такой прием работает в обоих направлениях, как петля обратной связи.
Если поведение не повторяется, значит, подкрепление произошло слишком рано или слишком поздно, а может быть, выбранный вами стимул не является подкреплением для данного субъекта.
Кроме того, хочу сказать, что между теорией подкрепления и практикой подкрепления существует серьезное различие. Исследования показывают, что приятные последствия любого поступка повышают вероятность его повторения. Это действительно так. Но на практике для того, чтобы достичь сенсационных результатов, которых ожидают тренеры и дрессировщики, подкрепление должно происходить абсолютно синхронно с поведением. Бинго! Сейчас! В реальном времени ученик должен точно понимать, что именно этот конкретный его поступок и вызвал подкрепление.
Современные дрессировщики разработали прекрасные приемы одновременного подкрепления: они используют сигнал-маркер для идентификации поведения. В новом издании книги «Не рычите на собаку!» я расскажу о законах подкрепления, некоторых практических способах применения этих законов в реальном мире и о стихийном движении, которое (по крайней мере, сейчас) называется «кликер-тренингом» и которое использует данные приемы в совершенно новой, неисследованной сфере.
Впервые я узнала о дрессировке с помощью положительных подкреплений на Гавайях. В 1963 году я работала тренером дельфинов в океанариуме «Си Лайф Парк». Собак и лошадей я тренировала с помощью традиционных методов, но работа с дельфинами оказалась совершенно иным делом. Тут нельзя было использовать поводок, уздечку или даже кулаки. Дельфины просто уплывали прочь. Положительное подкрепление – обычно корзина с рыбой – оставалось нашим единственным средством.
Психологи объяснили мне принципы обучения с помощью подкрепления. Искусству применения этих принципов на практике я научилась, работая с дельфинами. По образованию я была биологом. Меня всегда интересовало поведение животных. И теперь я была невероятно увлечена не столько самими дельфинами, сколько нашим общением – моим с дельфинами и дельфинов со мной – в процессе такого рода тренировки. То, чему меня научили дельфины, я применила в дрессировке других животных. И я начала замечать, что использую некоторые приемы в своей повседневной жизни.
Я, к примеру, перестала кричать на детей, потому что заметила, что крик не работает. Замечая желательное поведение и подкрепляя его в этот самый момент, я добивалась гораздо больших результатов и сохраняла мир в семье.
Под уроками, которые я получила в дельфинарии, скрывается реальная научная основа. В этой книге мы выйдем за пределы теории. Я отлично знаю, что ученые почти не рассказывают, а зачастую неправильно понимают правила применения научных теорий. Но фундаментальные законы существуют, и во время тренировки их следует учитывать.
Эту теорию называют модификацией поведения, теорией подкрепления, оперантным обусловливанием, бихевиоризмом, или бихевиористской психологией[1]. Данная отрасль психологии многим обязана профессору Б. Ф. Скиннеру[2].
Я не знаю ни одной другой современной отрасли науки, которую бы так чернили, так неправильно понимали и истолковывали, применяли и использовали. Само имя Скиннера вызывает гнев у тех, кто пропагандирует «свободу воли» как основное качество, отличающее человека от животных. Для тех, кто воспитан в гуманистических традициях, манипуляция человеческим поведением с помощью определенных сознательных приемов кажется абсолютным злом, несмотря на тот очевидный факт, что все вокруг постоянно пытаются манипулировать поведением друг друга, прибегая при этом к любым средствам.
Пока гуманисты набрасывались на бихевиоризм и Скиннера с пылом, который сделал бы честь любому религиозному фанатику, бихевиоризм развился в серьезную отрасль психологии. Эта наука вошла в программу университетов, клиническую практику, о ней пишут в профессиональных журналах, проводят международные конгрессы, она стала основой доктрин и учений, ей посвящено огромное множество книг.
И это очень хорошо. Некоторые расстройства – например, аутизм – лечатся с помощью теории подкрепления гораздо лучше, чем другими способами. Многие психотерапевты добиваются больших успехов в решении эмоциональных проблем своих пациентов с помощью положительного подкрепления. Эффективность (по крайней мере, в определенных обстоятельствах) обычного изменения поведения без погружения в причины его появления привела к появлению новой отрасли семейной терапии. В рамках такой терапии рассматривается поведение каждого члена семьи, а не только лишь того, кто испытывает самые очевидные проблемы. И в таком подходе есть здравый смысл.
Обучающие машины и программируемые учебники, созданные на основе теории Скиннера, стали первыми попытками формализовать процесс обучения шаг за шагом и использовать положительное подкрепление при правильной реакции ученика. Первые механизмы были несовершенными, но именно благодаря им была создана система компьютеризованного обучения. Эта система очень занимательна в силу необычной природы подкреплений (фейерверки, танцующие роботы) и высокоэффективна благодаря тому, что компьютер очень точно выбирает время. Программы подкрепления с использованием жетонов или фишек, которые можно накапливать, а потом обменивать на сладости, сигареты или привилегии, успешно применяются в психиатрических больницах и других подобных заведениях. Подкрепление эффективно применяется в программах аутотренинга по снижению веса и избавлению от вредных привычек. Эффективные образовательные системы, основанные на принципах подкрепления, успешно используются в наших школах. Интересный способ применения подкрепления для выработки физиологических реакций – биологическая обратная связь.
Ученые изучили самые тонкие аспекты обусловливания. Одно исследование, к примеру, показало, что, сделав таблицу для контроля собственного прогресса в рамках определенной программы, вы с большей вероятностью усвоите новые привычки, если будете каждый день полностью закрашивать квадратик таблицы, а не просто ставить в нем какую-то отметку.
Внимание к деталям имеет важные психологические обоснования, но человек не часто находит в этом пользу для тренинга. Тренинг – это «петля обратной связи», двустороннее общение, при котором событие на одном конце «петли» меняет события на другом конце. Типичная кибернетическая система обратной связи. Однако многие психологи по-прежнему рассматривают свою работу как нечто такое, что они делают по отношению к субъекту, а не вместе с субъектом.
Для настоящего тренера своеобразные и неожиданные реакции любого субъекта являются самыми интересными и самыми полезными событиями процесса обучения, но почти любая экспериментальная работа направлена на игнорирование и минимизирование индивидуальных реакций. Разработка методов того, что Скиннер называл «формированием», то есть постепенным изменением поведения, и применение этих методов является творческим процессом. Но в психологической литературе мы находим множество абсолютно прозаичных, если не сказать неуклюжих, программ формирования. На мой взгляд, все они основаны на жестоких и необычных наказаниях. Недавно я прочла в одном из журналов статью о том, как отучить ребенка мочиться в постель. Родителям предлагалось не только установить датчики влажности в постели ребенка, но еще пригласить специалиста, чтобы тот провел с ребенком ночь! Авторы заметили, что такой подход обойдется семье довольно дорого. А чем он обернется для психики ребенка? Такое «поведенческое» решение равносильно тому, чтобы бить мух лопатой.
Шопенгауэр однажды сказал, что любую оригинальную идею сначала высмеивают, потом жестоко критикуют и, наконец, воспринимают как должное. Насколько я понимаю, теория подкрепления не составила исключения. Скиннера много лет высмеивали за то, что он демонстрировал формирование поведения на примере пары голубей, игравших в настольный теннис. Теплую, комфортную, самоочищающуюся и веселую колыбельку, которую он построил для своих маленьких дочерей, называли бесчеловечной «коробкой для младенцев», вещью аморальной и еретической. До сих пор ходят слухи о том, что его дочери сошли с ума, хотя обе они достигли больших успехов в своей профессии и стали замечательными людьми.
Сегодня многие образованные люди относятся к теории подкрепления как к чему-то такому, что все и так давно знают и понимают. На самом же деле большинство людей этого вовсе не понимает, иначе они не вели бы себя по отношению к окружающим так ужасно.
За годы, прошедшие со времени моей работы с дельфинами, я читала лекции и писала статьи о законах подкрепления в академических и профессиональных журналах, а также выступала перед широкой публикой. Я преподавала эти законы в старших классах, колледжах и магистратуре, рассказывала о них домохозяйкам и владельцам зоопарков, родным и друзьям. Я проводила семинары для тысяч владельцев собак и дрессировщиков, для ковбоев и тренеров. Я заметила, что принципы теории подкрепления постепенно проникают в общественное сознание. Голливудские дрессировщики называют использование положительного подкрепления «аффективной тренировкой» и применяют эти приемы для того, чтобы добиться результатов, которых невозможно добиться силой. Вспомните хотя бы поведение свиней и других животных в фильме «Бейб». Сегодня многие олимпийские тренеры используют положительное подкрепление и формирование, вместо того чтобы полагаться на старомодное запугивание. И новые приемы приносят ощутимые результаты.
Однако никто еще не писал о правилах теории подкрепления так, чтобы ими можно было пользоваться в повседневной жизни, в обычных практических ситуациях. Поэтому я решила написать книгу о том, как я понимаю эти принципы, как они правильно и неправильно применяются в реальной жизни.
Теория подкрепления не решает всех проблем. С ее помощью не увеличить банковский счет, не спасти разрушающийся брак, не победить серьезное личностное расстройство. Если у вас плачет ребенок – это не проблема тренировки. Она требует иного решения. Некоторые виды поведения (и человека, и животных) имеют генетические компоненты, модифицировать которые трудно, а то и невозможно. Некоторые проблемы не стоят потраченного на них времени…
Но очень многие жизненные сложности, задачи и неприятности можно решить, правильно применив законы подкрепления.
Использование положительного подкрепления в одной ситуации может помочь вам эффективно применить тот же прием в другой. Когда я работала с дельфинами, один исследователь едко заметил: «Людям нельзя позволять заводить детей, пока они не сумеют выдрессировать цыпленка». Он хотел сказать, что очень сложно добиться успеха с существом, к которому нельзя применить силу. В воспитании детей наказаний быть не должно. Жизненный опыт подскажет вам, как можно использовать подкрепление для выработки желательного поведения у ребенка.
Я заметила, что большинство тех, кто работал с дельфинами, кто привык применять положительное подкрепление в повседневной работе, так же хорошо ладили и с детьми. Дети этих людей были очень доброжелательными, вежливыми и спокойными. Я не гарантирую того, что и ваши дети станут такими же. Я не обещаю, что вы сразу добьетесь сногсшибательных результатов или овладеете за три дня конкретными навыками. Вы просто поймете фундаментальный принцип, лежащий в основе любого обучения, и научитесь творчески применять его в различных ситуациях. Скорее всего вам удастся исправить то, что мучило вас уже очень давно, или продвинуться в какой-то желанной области. И если вы захотите, то сможете выдрессировать цыпленка.
В системе подкреплений должен быть естественный порядок. Главы моей книги расположены в том же порядке, в каком идет процесс обучения. Мы пойдем от простого к сложному. Именно в таком порядке люди обучаются проще всего и становятся хорошими тренерами и учителями. Я стремилась к тому, чтобы вы правильно поняли систему обучения с помощью положительного подкрепления. Но применение этих принципов должно быть практическим. В каждой главе вы найдете примеры из реальной жизни. Не считайте описанные методы догмой, раз и навсегда определенными инструкциями. Относитесь к ним творчески.
1. Подкрепление: Лучше чем вознаграждение
Что такое положительное подкрепление?
Подкрепление – это нечто такое, что, происходя одновременно с поступком, ведет к повышению вероятности повторения этого поступка в будущем.
Запомните это утверждение. В этом заключается секрет успешной тренировки. Чтобы вы лучше его запомнили, повторю его еще раз.
Подкрепление – это нечто такое, что, происходя одновременно с поступком, ведет к повышению вероятности повторения этого поступка в будущем.
Существует два вида подкрепления: положительное и отрицательное. Положительное подкрепление – это нечто желанное для субъекта, то есть пища, ласка или похвала. Отрицательное подкрепление – это то, чего субъект хочет избежать, то есть удар, хмурое выражение лица, неприятный звук. (Звуковой сигнал в машине, который говорит о том, что вы не пристегнули ремень безопасности, является отрицательным подкреплением.)
Поведение, которое уже проявляется, пусть даже нерегулярно, всегда можно закрепить с помощью положительного подкрепления.
Если вы позвали щенка, он пришел, и вы его приласкали, в будущем щенок будет подходить к вам с большим желанием. И для этого не потребуется дополнительной тренировки. Предположим, вы хотите, чтобы вам кто-то позвонил – ребенок, родитель, любимый человек. Если он не звонит, вы ничего не можете сделать. Запомните, что подкрепить поведение, которое не проявляется, невозможно. Если же во время желанного звонка вы проявляете радость и удовольствие, то тем самым положительно подкрепляете поведение звонящего и повышаете вероятность повторного звонка. (Разумеется, отрицательное подкрепление – «Почему ты мне никогда не звонишь? Почему я всегда должен звонить тебе сам?» – создает ситуацию, которой звонящий всеми силами постарается избежать в будущем. Своим поведением вы сами подталкиваете человека к тому, чтобы он перестал вам звонить.)
Простое положительное подкрепление поведения является самой элементарной частью такого рода тренинга. В научной литературе часто можно встретить выражения «использовались поведенческие методы» или «проблема была решена с помощью бихевиористского подхода». Все это, как правило, означает, что психологи отказались от ранее использованного метода и применили положительное подкрепление. Это не значит, что они применили все приемы, описанные в моей книге. Они могли о них даже не знать.
Порой оказывается, что достаточно всего лишь перейти к положительному подкреплению. Такой метод, к примеру, может достаточно эффективно помочь ребенку, который мочится в постель: разбудив ребенка и обнаружив, что простыни сухие, похвалите и обнимите его.
Положительное подкрепление работает даже в отношении самого себя.
Когда-то я ходила в группу по изучению творчества Шекспира. Там я познакомилась с адвокатом с Уолл-стрит. Ему было уже под пятьдесят, и он страстно увлекался игрой в сквош. Он услышал, как я рассказывала о тренинге. Когда мы выходили, он заметил, что хотел бы применить положительное подкрепление в своих спортивных тренировках. Обычно он ругал себя за ошибки и промахи, теперь же решил хвалить себя за хорошие удары.
Через две недели я снова встретилась с этим человеком. «Как ваш сквош?» – спросила я. На его лице появилось выражение удивления и радости – большая редкость для адвокатов с Уолл-стрит.
«Сначала я чувствовал себя полнейшим идиотом, когда при каждом хорошем ударе твердил себе: «Ну, Пит, ты молодец», – рассказал он мне. – Когда я тренировался один, то даже гладил себя по плечу. И мои результаты заметно улучшились. На клубной лестнице я поднялся на четыре ступеньки. Я стал побеждать тех, у кого раньше не мог выиграть ни одной подачи. И мне стало по-настоящему весело. Стоило мне перестать корить себя за неудачные удары, как меня покинуло чувство злобы и разочарования. А ведь раньше я часто выходил с тренировки в таком состоянии! Если я допускаю промах, то не злюсь – ведь за этим ударом обязательно последует удачный. Я с удовольствием наблюдаю за тем, как мой соперник, делая ошибки, сходит с ума, швыряет ракетку на землю… Я-то знаю, что это ему не поможет, и я просто улыбаюсь».
Какой коварный противник! И таким он стал, просто прибегнув к системе положительного подкрепления.
Подкрепление – вещь относительная, а не абсолютная.
Дождь – положительное подкрепление для уток, отрицательное подкрепление для кошек и вещь совершенно безразличная (по крайней мере, не проливной дождь) для коров. Пища не является положительным подкреплением для сытого человека. Улыбка и похвала могут оказаться бесполезными, если собеседник пытается вывести вас из себя.
Чтобы нечто стало подкреплением, нужно, чтобы субъект желал этого.
В любой ситуации тренинга необходимо располагать набором разнообразных подкреплений. В океанариуме «Си Уорлд» косаткам предлагали самые разные подкрепления – рыбу (их пищу), поглаживание различных частей тела, социальное внимание, игрушки и т. п. В бассейне разворачивалось целое шоу, когда животные не знали, какое поведение и чем будет подкреплено в следующий момент. «Сюрпризы» были столь интересны для животных, что любое шоу можно было провести вообще без использования традиционной рыбы. Свою пищу животные получали в конце дня. Необходимость постоянного переключения с одного подкрепления на другое – процесс сложный и интересный и для тренеров тоже.
Положительное подкрепление эффективно работает в человеческих отношениях.
Оно является основой искусства выбора подарков. Необходимо выбрать то, что станет для человека настоящим подкреплением (правильный выбор является подкреплением и для того, кто подарок выбирает). В нашем обществе подарки чаще всего дарят женщины. Я знаю семьи, в которых матери покупают рождественские подарки для всех и каждого. А наутро дети с удивлением рассматривают подарки и говорят: «Смотри-ка, что Анна подарила Билли», хотя всем отлично известно, что Анна не имеет к этому подарку никакого отношения. Но при таком подходе дети никогда не овладеют навыком выбора правильных подкреплений для других людей.
В нашем обществе человек, который умеет замечать положительные подкрепления, обладает огромным преимуществом перед другими людьми. Как мать, я постаралась сделать так, чтобы мои сыновья умели дарить подарки. Как-то раз, когда им было семь и пять лет соответственно, я привела их в детский магазин и попросила выбрать два платья для младшей сестренки. Им ужасно понравилось сидеть в обитых бархатом креслах, рассматривать, как сестра примеряет разные платья, и обсуждать их достоинства и недостатки. Этот процесс понравился и девочке. Кроме того, она обладала правом абсолютного вето. Этот и другие подобные случаи научили моих детей проявлять искренний интерес к тому, чего хотят другие люди, и получать радость от поиска эффективного положительного подкрепления для близких.
Отрицательное подкрепление
Итак, подкрепление – это то, что повышает вероятность повторения поведения. Но подкреплением вовсе не обязательно должно быть то, чего ученик хочет. Избегание неприятного тоже может быть подкреплением. Лабораторные исследования показывают, что поведение можно закрепить с помощью стимулов, вызывающих отрицательную реакцию, если изменение поведения приводит к устранению этих стимулов. Подобные стимулы называются отрицательными подкреплениями. Это то, чего человек или животное стремится избежать.
Отрицательные подкрепления могут состоять из самых слабых раздражителей (стимулов) – неодобрительный взгляд друга, когда вы неудачно пошутили, легкий ветерок от кондиционера, который заставил вас пересесть на другой стул. Однако отрицательными подкреплениями могут служить и самые экстремальные раздражители – от публичного унижения до электрошока. Они же являются и наказанием. Когда на нас кричат, мы воспринимаем это как наказание. Но мы быстро учимся имитировать работу, когда начальник, который часто кричит на нас, появляется у входной двери.
Отрицательное подкрепление – это стимулы, которых можно избежать путем изменения поведения.
Как только возникает новый стандарт поведения, раздражитель исчезает, и новое поведение закрепляется. Предположим, что в гостях у тетушки я собралась положить ноги на журнальный столик, как дома. Тетушка неодобрительно поднимает брови. Я опускаю ноги на пол. Она расслабляется. Я тоже чувствую себя гораздо спокойнее.
Поднятые брови – это стимул, который действует как отрицательное подкрепление. Поскольку я была в состоянии избежать этого стимула, новое поведение – привычка держать ноги на полу – будет повторяться вновь, по крайней мере, в доме тетушки, но, возможно, и в других домах тоже.
Тренинг может основываться почти исключительно на отрицательном подкреплении, и зачастую дрессировка животных проводится именно так. Лошадь учат поворачивать налево, резко дергая левый повод. Когда лошадь поворачивает, неприятное давление во рту ослабевает. Лев поднимается на тумбу и остается на ней, чтобы оказаться подальше от хлыста дрессировщика.
Однако отрицательное подкрепление – это вовсе не то же самое, что наказание. В чем же разница? В первом издании этой книги я написала, что наказание – это воздействие, которое возникает после проявления поведения, нуждающегося в изменении, и, следовательно, не оказывает влияния на поведение. «Мальчик, которого отшлепали за плохие оценки в дневнике, может улучшить или не улучшить свои оценки, но он просто не в состоянии изменить те, что уже в дневнике проставлены». И действительно, когда мы сознательно наказываем кого-либо, то чаще всего делаем это слишком поздно. Но не в этом заключается основное различие между наказанием и отрицательным подкреплением.
Современные психологи-бихевиористы называют наказанием любое событие, которое прекращает поведение. Ребенок засунул шпильку в электрическую розетку. Мать хватает его и/или шлепает по руке: поведение, которое угрожает жизни, необходимо прервать немедленно. Поведение прекращается. В этот момент может начаться что-то другое – ребенок заплачет, мать расстроится и т. п., – но опасная привычка совать что попало в электрическую розетку, будет устранена, по крайней мере, в данный момент.
Б. Ф. Скиннер более точен в этом отношении. Он определяет наказание как нечто, что происходит, когда поведение приводит к утрате чего-либо желанного – удовольствия узнать, что произойдет, если засунуть шпильку в розетку, весьма характерного для детей, – или когда поведение приводит к каким-то нежелательным последствиям. Однако в обоих случаях, когда данное поведение прекращается, невозможно предсказать, повторится ли оно в будущем.
Мы знаем, что положительное подкрепление повышает вероятность желательного поведения в будущем, но наказание не приводит к предсказуемым результатам.
Например, схватив ребенка или шлепнув его по руке даже в самое подходящее время, может ли мать быть уверена в том, что он не попытается засунуть ту же шпильку в ту же розетку в другое время? Я в этом очень сомневаюсь. Спросите у любого родителя. Все мы стараемся спрятать мелкие предметы, закрыть розетки, передвинуть мебель, пока ребенок не вырастет.
Отрицательное подкрепление можно эффективно использовать для воспитания желательного поведения. При этом даже при наличии негативных стимулов процесс может быть относительно доброжелательным. Благодаря любезности специалиста по ламам Джима Логана, я могу привести прекрасный пример использования отрицательного подкрепления при дрессировке полудомашних лам, которых в США содержат как домашних животных, а во всем мире – ради ценной шерсти.
Ламы – животные пугливые и застенчивые. В этом они похожи на лошадей. Если их не воспитывать с раннего детства, приручить их очень трудно. Хотя обучение с помощью пищевого подкрепления великолепно подходит для лам, в тех случаях, когда животное слишком пугливо, чтобы подойти и взять у человека пищу, современные дрессировщики поступают следующим образом. Они используют кликер. Этот сигнал говорит ламе, что ее поступок заслужил подкрепление, но основное, реальное подкрепление заключается в устранении отрицательного подкрепления.
Это все равно, что сказать ламе: «Ты будешь стоять на месте, если я подойду к тебе на 30 футов? Да? Хорошо. Я щелкну моим кликером, повернусь и отойду.
А теперь ты будешь стоять на месте, если я подойду к тебе на 25 футов? Да? Хорошо. Я кликну и отойду».
Использование кликера для концентрации внимания на привычке стоять спокойно, когда страшный человек поворачивается и уходит, действует как положительное подкрепление. Такой прием позволяет сократить дистанцию между животным и человеком до минимальной величины всего за пять или десять минут. В этой ситуации все контролирует лама. Она стоит спокойно – и это заставляет человека отступить! Поэтому животное продолжает стоять спокойно, даже когда человек подходит прямо к нему.
Когда человек несколько раз касается ламы и тут же отступает, лед тает. Человек больше не кажется животному страшным. И вот тут-то наступает время корзинки с пищей. Коммуникативная петля выглядит следующим образом: «Могу я коснуться тебя, пока ты стоишь спокойно? Да? Клик – и вот вкусная, замечательная пища». Лама стремится получить положительное подкрепление, то есть пищу, поглаживание и ласку. Она понимает, что для этого нужно демонстрировать новое поведение – стоять спокойно вместо того, чтобы убегать сломя голову.
Такое использование отступления при проявлении желательного поведения является важным аспектом работы так называемых «заклинателей». При использовании подобного метода дрессировщик работает со свободной лошадью в ограниченном пространстве и за относительно короткое время превращает настоящую дикарку в лошадь, спокойно относящуюся к человеку. Совершенно дикая лошадь успокаивается настолько, что смиряется с седлом и наездником. Подобное мастерство может показаться настоящей магией.
Дрессировщики, использующие такие приемы, часто объясняют происходящее сверхъестественной силой. Хотя многие используют определенный звук или движение в качестве сигнала-маркера, или условного подкрепления, мало кто понимает, что именно он делает. Тем не менее в этой работе нет ничего магического. Это законы оперантного обусловливания в действии.
Хотя отрицательное подкрепление – довольно полезный процесс, очень важно помнить, что любое подобное действие несет в себе элемент наказания. Когда вы тянете за левый повод, пока лошадь не повернет, вы наказываете животное заранее. Чрезмерное увлечение отрицательными подкреплениями может привести к тому, что Мюррей Сидмен называет «осадком», то есть к нежелательному побочному действию.
Время подачи подкрепления
Как уже говорилось, подкрепление должно происходить одновременно с поступком, который необходимо модифицировать.
Время осуществления подкрепления – это информация. Она точно говорит ученику, что именно вам нравится.
Когда человек или животное пытается учиться, информационное содержание подкрепления становится еще более важным, чем само подкрепление. При тренировке спортсменов или танцовщиков инструктор часто кричит: «Да! Хорошо!», отмечая удачное движение. Такие выкрики дают человеку необходимую информацию, что гораздо полезнее последующего разбора в раздевалке.
Запоздалое подкрепление – это главная проблема начинающих тренеров. Собака сидит, но к тому времени, когда хозяин говорит: «Молодец! Хорошая собака!», она уже встала. Какое же поведение стимулирует произнесенное подкрепление? Правильно – не сидеть, а стоять. Когда у вас возникают подобные трудности, вы должны сразу же спросить себя, а не слишком ли поздно прозвучало подкрепление. Если вы работаете с человеком или животным и слишком захвачены процессом, будет полезно пригласить кого-нибудь еще, чтобы этот человек наблюдал за запоздалыми подкреплениями.
Мы слишком часто запаздываем с подкреплениями. «Дорогая, ты замечательно выглядела прошлым вечером». Подобный комплимент окажет совсем не то действие, что те же самые слова, произнесенные в нужный момент. Запоздалое подкрепление может оказать даже обратное действие («Что ты хочешь сказать? Что я сейчас плохо выгляжу?»). Мы трогательно полагаемся на слова, считая, что они смогут компенсировать неправильный выбор времени.
Слишком раннее подкрепление тоже неэффективно. Смотрители зоопарка в Бронксе никак не могли справиться с гориллой. Им нужно было перевести животное в открытый вольер, чтобы вычистить клетку. Но обезьяна сидела у дверей и мешала их закрыть. Смотрители и пищу бросали, и бананами гориллу заманивали, но зверь не обращал на них никакого внимания или хватал пищу и бегом возвращался на прежнее место, прежде чем двери удавалось закрыть. За помощью обратились к дрессировщику зоопарка. Он отметил, что размахивание бананами и подбрасывание пищи были попытками закрепить поведение, которое еще не проявилось. Это можно назвать простым словом «подкуп». Решение заключалось в том, чтобы не обращать внимания на гориллу, когда та сидела возле дверей, но поощрять ее пищей, когда она сама сойдет с этого места. Проблема была решена.
Мне кажется, что иногда мы используем подкрепление слишком рано. Особенно ярко это проявляется в отношениях с детьми. В результате мы стимулируем нежелательное поведение. («Молодец, девочка, вот так, ты все сделала почти правильно».) Такими словами мы стимулируем старание. Но между тем, чтобы постараться сделать и сделать по-настоящему, есть существенная разница. Жалобы «Я не могу» порой имеют под собой основание, но чаще всего они являются симптомами слишком раннего подкрепления.
Подарки, обещания, комплименты и все то, что поощряет еще не произошедшее поведение, ни в коей мере не подкрепляет желательное поведение. Все это подкрепляет то поведение, которое имеет место в данный момент, и в этом отношении его можно считать настоящим подкупом.
Время играет особенно важную роль, когда мы имеем дело с отрицательным подкреплением. Лошадь учится поворачивать налево, когда наездник тянет за левый повод. Но усвоит она навык лишь в том случае, если после поворота давление ослабеет. На этот раз подкреплением оказывается прекращение. Вы садитесь на лошадь, пришпориваете ее и направляете вперед. После этого нужно прекратить пришпоривать (если вам не нужно, чтобы она мчалась быстрее). Начинающие наездники часто забывают об этом. Им кажется, что пришпоривание – это нечто вроде бензина, необходимого для того, чтобы лошадь двигалась. Они постоянно пришпоривают лошадь, из-за чего она не получает никакой информации. В школах верховой езды появились даже этакие «железнобокие» лошади, которые с черепашьей скоростью передвигаются по манежу, сколько бы их ни пришпоривал наездник.
То же самое происходит с людьми, которых пилят и ругают родители, начальники или учителя. Если отрицательное подкрепление не прекращается при достижении желательного результата, оно не несет в себе никакой информации. Оно становится в буквальном и информационном смысле обычным «шумом».
Глядя по телевизору футбольные и бейсбольные матчи, я часто поражалась тому, насколько точно по времени игроки получали подкрепления. Как только игрок поступает именно так, как было нужно, зрители криками выражают свое одобрение. А посмотрите, как взаимодействуют между собой игроки, когда забит гол или одержана победа. У актеров все происходит по-другому. Даже на сцене аплодисменты звучат уже после того, как дело сделано. Киноактерам приходится еще труднее. Они могут получить подкрепление только от режиссера или оператора. Письма поклонников и хорошие рецензии приходят спустя много недель, а то и месяцев после съемок. Да они и сравниться не могут с реакцией огромного стадиона на успешный бросок игрока. Неудивительно, что многие кинозвезды болезненно жаждут поклонения и восторгов. Их работа не приносит удовлетворения, поскольку самые мощные и приятные подкрепления всегда оказываются запоздалыми.
Масштаб подкрепления
Начинающие дрессировщики, которые используют в работе с животными пищевые подкрепления, часто не понимают, насколько большим должно быть подобное подкрепление. Ответ очень прост: чем меньше, тем лучше. Чем меньше подкрепление, тем быстрее животное его съест. Это не только сокращает время ожидания, но еще и позволяет использовать за время сеанса большее количество подкреплений до наступления состояния насыщения.
В 1979 году я работала консультантом в Национальном зоопарке Вашингтона. Я учила сотрудников использованию системы положительного подкрепления. Одна из смотрительниц пожаловалась на то, что работа с пандой идет слишком медленно. Это показалось мне странным, поскольку интуитивно я чувствовала, что панды – крупные, прожорливые, активные животные – должны легко поддаваться пищевому подкреплению. Я понаблюдала за работой этой женщины и выяснила вот что. Хотя она постепенно добивалась успеха в формировании определенного движения, каждый раз она давала панде целую морковку. Панда радостно поедала сладкую морковку. В результате, за пятнадцать минут тренировки животное получало только три подкрепления (да и морковь ему порядком надоела). В качестве подкрепления вполне можно было использовать небольшой ломтик морковки.
В целом подкрепление должно быть небольшим, но достаточным, чтобы заинтересовать животное, – пара зернышек кукурузы для цыпленка, маленький кубик мяса для кота, половинка яблока для слона. Любимое лакомство следует отмерять еще более скупо – чайная ложка овса для лошади, к примеру. Смотрители Национального зоопарка обучили своих белых медведей массе полезных вещей – например, переходу в другую клетку по команде. В качестве подкрепления каждый раз они давали им по одной изюминке.
Золотое правило любого тренера заключается в том, что, проводя в день всего один сеанс, можно подкрепить желательное поведение примерно четвертью дневного рациона животного, а остальную пищу отдать просто так. Если вы планируете провести в течение дня три или четыре сеанса, то разделите обычный рацион на восемьдесят подкреплений. В течение сеанса выдайте животному двадцать-тридцать подкреплений. Восемьдесят подкреплений – это максимальное количество, способное поддержать интерес субъекта в течение дня. (Может быть, поэтому в кассете обычно помещается именно восемьдесят слайдов. Я сама не раз огорченно вздыхала, когда лектор просил помощника поставить вторую кассету.)
Трудность задачи обычно влияет на размер подкрепления. В парке «Си Лайф» за «олимпийские» достижения (прыжки на высоту двадцати двух футов) выдавали каждому из наших китов по большой макрели. Животные просто отказывались делать это за обычное подкрепление, состоявшее из двух маленьких снетков. У людей же вознаграждение за тяжелую работу не всегда бывает более высоким. И как же нам это не нравится, когда тяжелую работу приходится выполнять именно нам.
Джекпот
Одним из самых полезных приемов пищевого или иного положительного подкрепления в отношении людей или животных является джекпот.
Джекпот – это значительное подкрепление, порой раз в десять больше обычного, которое является для субъекта полным сюрпризом.
Когда-то я работала в рекламном агентстве. На Рождество у нас устраивалась вечеринка, а, кроме этого, мы в неформальной обстановке отмечали завершение большого проекта или заключение контракта с новым важным клиентом. Но наш президент имел обыкновение устраивать в течение года пару неожиданных вечеринок. В разгар рабочего дня он появлялся в офисе, кричал, чтобы все бросали работу. Приемная закрывалась, и в конференц-зал чередой тянулись музыканты, бармены, официанты, несли шампанское и копченую семгу. Все это устраивалось для сотрудников без всякого повода. Это был настоящий джекпот для пятидесяти человек. И такая политика приносила плоды. Я думаю, что замечательным моральным климатом наше агентство было обязано именно своему президенту.
Джекпот можно использовать для стимулирования неожиданного прорыва. Так поступил один мой знакомый тренер. Когда молодая лошадь впервые выполнила сложный маневр, наездник соскочил с нее, снял седло и уздечку и выпустил лошадь на манеж. Джекпотом стала полная свобода, и это способствовало закреплению нового поведения.
Удивительно, но один джекпот может оказаться весьма эффективным в работе с недоверчивым, пугливым и сопротивляющимся субъектом, который вообще не демонстрирует желательного поведения. В парке «Си Лайф» мы использовали результаты исследований, проводящихся на военно-морском флоте. Мы пытались обучить дельфина новым реакциям вместо уже усвоенных. Мы работали с очень послушным дельфином по кличке Хоу, который очень редко демонстрировал новые реакции. Не получая подкрепления за проделанный трюк, он переставал работать. Во время одного из сеансов он двадцать минут ничего не делал. В конце концов тренер выдал ему две рыбки просто так. Впечатленный такой щедростью дельфин начал работать очень активно. Очень скоро он сделал движение, которое нужно было подкрепить. На следующих сеансах мы достигли огромного прогресса.
То же самое произошло и во время моей работы с дельфинами. Когда мне было пятнадцать, то наибольшее удовольствие мне доставляли уроки верховой езды. В конюшне, где я занималась, продавали абонементы на десять занятий. На свои карманные деньги я могла себе позволить только один абонемент в месяц. Тогда я жила со своим отцом, Филиппом Уайли, и мачехой, Рикки. Хотя они были очень добры ко мне, в переходном возрасте я была не самой послушной дочерью. Однажды вечером мои любящие и терпеливые родители сказали, что ужасно устали от моего поведения и поэтому решили вознаградить меня.
Они подарили мне новый абонемент в школу верховой езды. Они не пожалели сил и времени, чтобы съездить и купить его. Надо же! Незаслуженный джекпот! Насколько я помню, я исправилась тут же. И Рикки Уайли подтвердила, что это действительно было так (я беседовала с ней, когда писала эту книгу).
Почему незаслуженный джекпот оказывает такое резкое и длительное воздействие, я толком не понимаю. Может быть, кто-нибудь когда-нибудь защитит докторскую диссертацию на эту тему и объяснит нам этот феномен. Я помню, что абонемент в школу верховой езды избавил меня от чувств тоски и обиды. Мне кажется, что дельфины чувствовали то же самое.
Условное подкрепление
В работе, и особенно в работе с пищевыми подкреплениями, часто случается так, что дать подкрепление в момент желательного поведения просто невозможно. Уча дельфина прыгать, я не имею возможности дать ему рыбу, когда он находится в воздухе. Если после каждого прыжка, то есть после неизбежной задержки, кидать ему рыбу, он сумеет связать прыжки и получение пищи и станет прыгать чаще. Но животное не может понять, какой именно аспект прыжка мне понравился. Высота? Траектория? Может быть, погружение с брызгами? Потребуется немало повторений, прежде чем животное поймет, какой именно прыжок мне нужен. Чтобы решить эту проблему, мы стали использовать условные подкрепления.
Условное подкрепление – это первоначально бессмысленный сигнал (звук, вспышка, движение), который подается перед или во время подкрепления.
В работе с дельфинами мы использовали в качестве условного подкрепления полицейский свисток. Его легко услышать даже под водой, и при его использовании руки остаются свободными для подачи других сигналов и бросания рыбы. С другими животными я часто пользовалась «сверчком», маленькой игрушкой, которая при нажатии издает звук «клик-клик». Иногда я использовала конкретную похвалу, приберегаемую только для условного подкрепления. «Хорошая собака». «Хороший пони». Школьные учителя тоже часто пользуются некими ритуализованными и тщательно подобранными похвалами («Хорошо», «Очень хорошо»), и дети ожидают подобных слов.
Условные подкрепления окружают нас постоянно. Мы с радостью слышим телефонный звонок и видим новые письма в почтовом ящике, хотя очень часто звонки не доставляют нам удовольствия, а большая часть писем оказывается обычным спамом. Но в нашей жизни было немало случаев, которые помогли нам связать звонки и конверты с чем-то приятным. Нам нравится рождественская музыка, нас пугает запах в приемной дантиста. Мы украшаем свой дом картинами, тарелками и сувенирами не только потому, что они красивы или полезны, но и потому, что они напоминают нам о счастливых временах или дорогих людях. Все это – условные подкрепления.
Практическая дрессировка с использованием положительного подкрепления почти всегда должна начинаться с определения условного подкрепления. Перед началом выработки конкретного поведения, хотя животное еще не сделало ничего особенного, вы должны научить его понимать значимость условного подкрепления, сочетая его с пищей, лаской или иным реальным подкреплением. Вы сразу поймете (по крайней мере, при работе с животными), когда субъект начинает распознавать ваш одобрительный сигнал. Животное воспринимает условное подкрепление и начинает искать подкрепление реальное. После усвоения условного подкрепления у вас есть реальный способ дать понять животному, что именно вам нравится в его поведении. Так что вовсе не обязательно быть доктором Дулиттлом, чтобы уметь разговаривать с животными. Усвоенным подкреплением вы можете «сказать» очень многое.
Условные подкрепления могут быть очень значимыми. Я видела, как морские млекопитающие даже после насыщения долго работали ради условного подкрепления. Лошади и собаки работали более часа при наличии очень малого количества первичных (то есть реальных) подкреплений. Люди, конечно, могут бесконечно работать ради денег, которые по сути своей являются обычными условными подкреплениями – жетонами, на которые можно купить товары. Много работают даже те, кто уже заработал денег больше, чем сможет потратить. Такие люди впадают в настоящую зависимость от условного подкрепления.
Можно сделать условное подкрепление еще более сильным, сочетая его с несколькими реальными подкреплениями. Предположим, что в данный момент ваш объект не хочет еды. Но если тот же самый подкрепляющий звук или слово сознательно связывается с едой или другими удовольствиями, он сохраняет свою полезность. Мои кошки слышат фразу: «Хорошая девочка!», когда я насыпаю им еду, глажу их, впускаю или выпускаю из дома, когда они выполняют маленькие трюки и получают за них вознаграждение. Следовательно, я могу использовать ту же фразу в качестве подкрепления, сгоняя кошку с кухонного стола. И при этом мне не потребуются подкрепления реальные.
Деньги потому являются для нас таким сильным подкреплением, что их можно совместить с чем угодно. Это исключительно обобщенное условное подкрепление.
Еще одно очень важное правило.
Сформировав условное подкрепление, нужно быть очень осторожным, чтобы не использовать его всуе, то есть не рассеивать его силу.
Дети, которые катаются на моих уэльских пони, очень быстро учатся произносить фразу «Хороший пони!» только тогда, когда нужно подкрепить поведение. Если они хотят выразить любовь и нежность, то пользуются любыми другими словами. Однажды дети заметили, что ребенок, только что присоединившийся к группе, гладит лошадку по морде и говорит: «Ты – мой хороший пони!» Они очень удивились: «Зачем ты ему это говоришь? Он же ничего не сделал!» Точно так же можно и нужно общаться с детьми (супругами, родителями, любимыми и друзьями).
Выражайте свою любовь и внимание вне связи с конкретным поведением любыми словами. Но выделите определенную фразу, сделав ее условным подкреплением, и свяжите ее с чем-то реальным.
В счастливой семье происходит множество событий, заслуживающих похвалы. Поэтому здесь происходит постоянный обмен подкреплениями. Однако ложная или бессмысленная похвала может быстро превратиться в ничего не значащий набор слов и утратить свою силу. Такую неискренность чувствуют даже маленькие дети.
Клик!
Тренеры, работающие с морскими млекопитающими, пользуются условным подкреплением (обычно свистком) в обучении китов, дельфинов, тюленей и белых медведей. Эту концепцию впервые применил в дельфинариях в 1960-е годы Келлер Бреланд, ученик Б. Ф. Скиннера. Бреланд назвал свисток «мостовым стимулом», потому что этот сигнал не только информировал дельфина о том, что он только что заслужил рыбу, но еще и заполнял промежуток времени между важным событием, то есть желательным поведением, и возвращением в бассейн. Усвоив этот сигнал, дельфины сразу же подплывали к бортику за заслуженной наградой.
Бихевиористская литература подтверждает важность этих аспектов условного подкрепления. Но со временем были открыты новые преимущества этого метода. В 1990-е годы многие дрессировщики стали использовать условное подкрепление. Те же приемы стали использовать хозяева собак (см. главу 6). Поскольку владельцы собак применяют металлический кликер в пластиковом корпусе, обучение собак стали называть «кликер-тренингом».
Звук, используемый в кликер-тренинге, является не только условным подкреплением и мостовым стимулом между зарабатыванием и получением пищи. Этот сигнал выполняет и другие функции. Во-первых, он устанавливает то, что Огден Линдсли назвал «событийным маркером». Благодаря ему животное точно понимает, какое именно поведение является желательным. Но у сигнала есть и другие значения. Он передает контроль в руки, лапы, ласты или в то, что есть у объекта обучения. Через определенное время объект не просто повторяет желательное поведение, но еще и демонстрирует намерение: «Эй! Я заставил тебя кликнуть! Посмотри на меня, я собираюсь сделать это снова!» Кликер-тренеры называют этот момент «загоранием лампочки». Он чрезвычайно важен и для тренера, и для ученика.
Эллен Риз указала мне на то, что условное подкрепление в кликер-тренинге является также завершающим сигналом. Он означает «работа сделана». Как говорит Гэри Уилкс: «Клик завершает поведение». Такой сигнал является подкреплением сам по себе. Но это порой шокирует традиционных тренеров. Сигнал не кажется им естественным. Им странно, что для того, чтобы научить собаку держать палку, нужно кликнуть, когда она ее только возьмет, а потом ей можно позволить бросить палку и насладиться заслуженной наградой.
Еще одно преимущество маркерных сигналов заключается в том, что их можно использовать для передачи конкретной информации. Полицейский Стив Уайт рассказал мне, что как-то раз послал свою немецкую овчарку искать брошенный предмет, который упал на верхушку шестифутового куста. Собака долгое время бесплодно обнюхивала землю. Когда же она подняла голову, Стив кликнул. Собака втянула в себя воздух, насторожилась и стала искать в том месте, куда и упал предмет. Она даже поднималась на задние лапы, чтобы лучше чувствовать воздух. Без всякой помощи со стороны Стива собака нашла нужный предмет, упавший на густой кустарник, и достала его.
Сигнал продолжения
Интересно то, что при общении с собакой Стив использовал подкрепление, которое не являлось сигналом завершения. Это был сигнал продолжения. Сигнал подкрепил «высокое» обнюхивание, и желательное поведение продолжалось до тех пор, пока потерянный предмет не был найден. В первом издании этой книги я писала о том, что условное подкрепление можно использовать несколько раз, не сочетая его с подкреплением реальным. Я писала так, потому что в парке «Си Лайф» мы не раз поступали так с дельфинами, формируя длительное поведение или поведенческие цепочки. В то время я не понимала, что на самом деле мы использовали два (по меньшей мере) условных подкрепления или маркерных сигнала: свисток означал все вышесказанное («Правильно, хорошо, пища тебя ждет, иди получи свое лакомство, работа сделана»), а второй, приглушенный, свисток означал совсем другое («Это хорошо, но работа еще не закончена»).
Многие начинающие кликер-тренеры, с которыми я работала в 90-е годы, были теми, кого писатель Морган Спектор называет «перекрестными» тренерами (то есть людьми, опытными в тренинге, основанном на коррекции, но пытающимися перейти к системе положительного подкрепления). Я обнаружила, что они слишком часто используют кликеры бесцельно, из-за чего ценность сигнала недопустимо снижается. Необходимо усвоить главное правило – «один клик – одно угощение». Только так можно эффективно сформировать желательное поведение.
Однако в реальной жизни возникает множество ситуаций, в которых очень полезен может быть промежуточный подкрепляющий стимул. Так произошло с собакой Стива Уайта. В такой ситуации можно использовать иной подкрепляющий стимул, который говорит ученику: «Все хорошо, продолжай в том же духе». Интересно, что сигнал продолжения не должен быть непосредственно связан с первичным подкреплением. Просто начните вставлять его перед завершающим кликом, и ученик быстро поймет, что он ведет к реальному подкреплению.
Затем вы можете включить воображение и использовать его в качестве информативного маркерного сигнала внутри цепочки, не разрывая ее. Например, на соревнованиях по аджилити собак друг за другом пускают на полосу препятствий на время. Владелец должен дать понять собаке, какое препятствие нужно преодолеть следующим. Причем делается это в крайней спешке. Я видела, как собака преодолевала одно препятствие, а потом замирала в недоумении, потому что не понимала, что делать дальше. Бросаться в туннель или прыгать? Собака недоуменно крутила головой. Хозяин крикнул: «Да», и собака взяла барьер. Она правильно поняла хозяина и быстро прошла всю дистанцию.
Как и в случае с сигналом завершения, неважно, какой стимул вы используете для продолжения действий. Это может быть кликер, свисток, окрик или движение руки. Важно, чтобы стимул не являлся сигналом бессмысленного подбадривания, который лишь отвлекает животное или случайно подкрепляет нежелательное поведение. Нужно сформировать прочное и точно используемое условное подкрепление.
Условное отрицательное подкрепление
Правильно поданное условное положительное подкрепление говорит ученику: «То, что ты сейчас делаешь, хорошо и правильно. Это действие принесет тебе пользу, так что продолжай в том же духе». Но можно также установить отрицательный условный сигнал. Такое действие говорит ученику: «То, что ты сейчас делаешь, нехорошо. Если ты не прекратишь, с тобой случится что-то плохое».
Условные отрицательные подкрепления более эффективны, чем угрозы. Некоторые субъекты – и в частности, кошки – не реагируют на крики и выговоры. Но моей подруге удалось совершенно случайно отучить кота от дурной привычки драть диван, сделав условным раздражителем слово «Нет!». Как-то раз, готовя обед, моя подруга уронила большой медный поднос, который упал прямо рядом с котом. Когда поднос падал, подруга воскликнула: «Нет!» – а после этого слова поднос приземлился на пол со страшным звоном. Кот ужасно перепугался, подскочил, шерсть на нем встала дыбом. Когда в следующий раз подруга заметила, что кот дерет диван, она громко крикнула: «Нет!» Испуганный кот тут же умчался прочь. Достаточно было двух повторений, чтобы раз и навсегда положить конец вредной привычке.
Выговоры являются неотъемлемой частью нашего существования. Использование в качестве основного средства обучения положительного подкрепления вовсе не означает, что вы не можете при необходимости использовать и отрицательные подкрепления. Это жизненно необходимо, например, когда ребенок пытается засунуть шпильку в электрическую розетку. Однако часто мы совершаем две ошибки: во-первых, не учитываем побочный эффект, который оказывает отрицательное подкрепление на ученика (см. главу 4, «Наказание»). И, во-вторых, используем выговоры и наказания, не устанавливая предупреждающего сигнала, то есть условного отрицательного подкрепления.
Например, любой, кто считает необходимым использовать электрошокер при воспитании собаки, должен всегда говорить «нет», когда собака что-то делает неправильно. После этого нужно сделать паузу, прежде чем нажать на кнопку шокера, чтобы собака имела возможность избежать отрицательного подкрепления, изменив свое поведение. Простое нажатие на кнопку без предупредительного сигнала превратит ваше действие в наказание, воздействие которого на будущее поведение и на готовность собаки подчиняться вашим приказам абсолютно непредсказуемо. Третья распространенная ошибка – продолжать нажимать на кнопку даже тогда, когда собака уже перестала делать то, что вам не нравилось. Таким образом вы наказываете ее за оба вида поведения – неправильное и правильное.
Неумение использовать условное отрицательное подкрепление повышает количество реальных отрицательных подкреплений, которые используются в коррекционной тренировке. Это значительно замедляет процесс обучения. Традиционные дрессировщики собак и лошадей иногда тратят на выработку желаемого поведения гораздо больше времени, чем те, кто использует положительное подкрепление. Порой время дрессировки увеличивается на несколько месяцев, а то и лет. Это происходит не только потому, что они полагаются исключительно на наказание (этот прием останавливает поведение, а не дает начало новому), но еще и потому, что они используют реальные отрицательные подкрепления, не сформировав условного отрицательного подкрепления. В результате требуются сотни повторений, прежде чем животное поймет, чего же от него хотят.
Среди дрессировщиков собак в последнее время приобрел популярность особый вид условного отрицательного подкрепления. Речь идет о маркере отсутствия вознаграждения. Обычно таким маркером служит слово «Неправильно», произнесенное нейтральным тоном. Идея заключается в том, что, когда собака пытается вести себя неправильно, чтобы понять, чего же вы хотите, вы помогаете ей, сообщая, что именно она делает не так. Вы формируете сигнал, который говорит животному: «Эти действия не будут вознаграждены».
Б. Ф. Скиннер определял отрицательное подкрепление, как лишение чего-то желанного. В этом смысле сигнал «неправильно» является условным отрицательным подкреплением, поскольку он означает недоступность вознаграждения.
Занимаясь дрессировкой собак, я сталкивалась с ситуациями, в которых сигнал «неправильно» был очень полезен. Если ваша собака демонстрирует широкий набор полностью сформированных видов поведения, то есть является сложным объектом для дрессировки, вы можете использовать сигнал «неправильно» в качестве намека на изменение поведения. В данной ситуации он означает: «Этот путь никуда не приведет. Попробуй что-нибудь другое».
Этот прием работает только в том случае, если вы уже использовали положительные подкрепления различных видов поведения, а ваша собака активно ищет новые пути, чтобы заставить вас кликнуть или дать ей реальное подкрепление. Люди испытывают трудности с условным отрицательным подкреплением, когда используют его с неопытной собакой, которая не понимает, чего от нее хотят.
Прикажите собаке сесть, а если она этого не сделает, скажите: «Неправильно». Если собака уже понимает, что этот сигнал означает отсутствие вознаграждения, она поймет, что вы наказываете ее за то, что она не села. Но это еще не означает, что она действительно сядет. На самом деле результат будет таким же, как и при любом другом наказании – то есть абсолютно непредсказуемым. Собака может вообще перестать реагировать на слова и убежать или бросить все и начать искать собственные подкрепления, то есть вести себя неподобающе – лаять, тянуть поводок, обнюхивать землю, скрести, обращать внимание на все, что угодно. Поэтому условное и реальное отрицательное подкрепление лучше использовать тогда, когда вам необходимо прекратить нежелательное поведение, а для выработки новых навыков пользуйтесь положительным подкреплением.
Режимы подкрепления
Существует распространенное заблуждение, что если вы начали вырабатывать какое-то поведение с помощью положительного подкрепления, то должны продолжать пользоваться этим методом всю жизнь. А если перестать использовать этот метод, желательное поведение прекратится. На самом деле это не так. Постоянное подкрепление необходимо только на этапах обучения.
Вы можете постоянно хвалить малыша за то, что он научился пользоваться горшком. Но как только поведение закреплено, дальше оно проявляется автоматически. Мы подаем (или должны подавать) массу подкреплений начинающему. Когда ребенок учится кататься на велосипеде, вы наверняка постоянно повторяете ему: «Правильно, а теперь прямо… Ты сделал это, хорошо!» А теперь представьте, насколько глупо вы будете выглядеть, если продолжите хвалить ребенка, который уже отлично катается на велосипеде. Да и ребенок подумает, что вы сошли с ума.
Чтобы заученное поведение надежно закрепилось, вовсе не нужно подкреплять его каждый раз. Наоборот, очень важно не подкреплять поведение на регулярной основе, а использовать подкрепление лишь от случая к случаю, случайно и непредсказуемо.
Психологи называют это вариативным режимом подкрепления. Вариативный режим намного более эффективно поддерживает поведение, чем постоянный и предсказуемый. Один психолог объяснил мне это так. Если вы купили новую машину, которая резво трогается с места, и в один прекрасный момент она почему-то не завелась, вы несколько раз попробуете повернуть ключ, но потом поймете, что что-то сломалось, и позвоните механику. Поворачивание ключа в отсутствие ожидаемого немедленного подкрепления быстро прекращается. Если же у вас старая машина, которая почти никогда не заводится с первой попытки, и для того, чтобы ее завести, требуется длительное время, вы будете поворачивать ключ снова и снова. Поворачивание ключа длительно подкреплялось в вариативном режиме. И поэтому это прочно закрепленное поведение.
Если я буду давать дельфину рыбу за каждый прыжок, животное станет прыгать невысоко и вяло – лишь бы получить рыбу и отделаться от меня. Если я прекращу давать рыбу, дельфин быстро перестанет прыгать. Но можно поступить иначе. Дельфин научился прыгать за рыбу. Теперь я начинаю подкреплять первый, третий и последующие прыжки случайным образом. Тогда желательное поведение закрепится более прочно. Не получивший вознаграждения дельфин станет прыгать более часто, надеясь вытянуть счастливый билет, а энергичность прыжков может даже возрасти. Это позволит мне избирательно подкреплять лучшие прыжки. Используя вариативный режим, я сформирую требуемое поведение.
Но даже профессиональные дрессировщики не всегда правильно используют вариативный режим положительного подкрепления. Понять и принять эту концепцию бывает нелегко.
Мы понимаем, что не нужно наказывать за неправильное поведение, если это поведение прекратилось. Но мы не понимаем, что необязательно и даже нежелательно вознаграждать правильное поведение постоянно.
Стремясь закрепить дисциплину животного с помощью положительного подкрепления, мы оказываемся менее уверенными в себе.
Привлекательность вариативного режима лежит в основе всех азартных игр. Если бы каждый раз, когда вы опускали мелкую монетку в игровой автомат, вам выпадала монетка более крупного достоинства, вы быстро заскучали бы. Да, вы обогатитесь, но вам будет скучно. Люди любят игровые автоматы именно потому, что предсказать результат практически невозможно. Вы можете ничего не выиграть, выиграть маленькую сумму или получить огромный выигрыш. Невозможно понять, в какой момент будет получено подкрепление (это может случиться даже в самый первый раз). Почему некоторые люди впадают в игровую зависимость, а некоторые – нет, это другой вопрос. Но для тех, кто попался на крючок, привлекательным является именно вариативный режим подкрепления.
Чем дольше сохраняется вариативный режим, тем прочнее он закрепляет поведение. Но длительность режима работает против вас в тех случаях, когда вы стремитесь устранить определенный стандарт поведения.
Неподкрепленное поведение угасает само собой. Но если поведение время от времени подкрепляется, пусть даже спорадически – одна сигарета, одна рюмка, одна уступка капризному ребенку или нудному партнеру, – оно не угаснет, а, напротив, прочно закрепится.
И добьетесь вы такого нежелательного результата с помощью длительного вариативного режима. Так человек, бросивший курить и случайно позволивший себе одну сигарету, может снова превратиться в отъявленного курильщика за одну минуту.
У каждого из нас есть знакомые, которые почему-то продолжают жить с супругами или любовниками, хотя те относятся к ним несправедливо. Мы привыкли считать, что такое случается только с женщинами, которые влюбляются в грубых, невнимательных, эгоистичных и даже жестоких людей. Но это происходит и с мужчинами. Мы все знаем таких людей. Даже после развода или расставания с неподходящим партнером они ухитряются найти себе нового точно такого же.
Являются ли эти люди по каким-то глубинным психологическим причинам постоянными жертвами? Возможно. Но не являются ли они жертвами длительного вариативного режима? Вступив в отношения с обаятельным, сексуальным, веселым и внимательным человеком, который со временем превращается в настоящего монстра, хотя время от времени все же проявляет свою хорошую сторону, вы живете надеждой на те редкие моменты, когда вам удается получить столь желанное положительное подкрепление: обаяние, сексуальность, внимание и заботу.
С точки зрения здравого смысла это кажется странным, но с точки зрения дрессировщика, все абсолютно ясно. Чем более редкими и непредсказуемыми будут такие моменты, тем более сильное воздействие они окажут на вас и тем прочнее укрепится поведение. Более того, легко понять, почему человек, когда-то находившийся в таких отношениях, стремится вступить в них вновь. Отношения с нормальным партнером, который почти всегда дружелюбен и нежен, кажутся ему скучными. Ему недостает редких, долгожданных и оттого гораздо более сильных эмоций, связанных с вариативным подкреплением.
А теперь взглянем на то же состояние с точки зрения манипулятора: «Она/он будет у меня из рук есть и делать все, что я захочу, только ради моего комфорта, пока я буду давать ей/ему то, чего она/он хочет… иногда». Так сутенеры держат в ежовых рукавицах своих проституток. Это действительно очень мощное средство, но стоит жертве понять, что «обаяние» действует только по причине редкости и случайности своего проявления, как она или он тут же смогут выйти из такого рода отношений и найти себе нормального партнера.
Исключения из правила вариативного подкрепления
Не следует прибегать к вариативному режиму в процессе закрепления конкретного поведения, когда поведение связано с решением определенных задач или выполнением тестов путем выбора.
В процессе обучения послушанию собакам предлагают выбрать из массы различных предметов те, которые держали в руках их хозяева. Каждый раз, когда собака сделает правильный выбор, ее нужно хвалить, чтобы она знала, что нужно делать в следующий раз. В тестах на различение – например, при выборе более высокого из двух звуков – ученик должен получать подкрепление при каждом правильном ответе. Только так он будет понимать, какой вопрос ему задан. (Разумеется, в такой ситуации нужно использовать условное подкрепление.) Разгадывая кроссворд или собирая пазл, мы получаем подкрепление своим правильным предположениям, поскольку только они «подходят» к данному месту. Если бы при собирании пазла в любом месте можно было использовать разные фрагменты, то вы не получили бы положительного подкрепления верного выбора. А это и есть обратная связь, которая необходима в большинстве ситуаций выбора путем проб и ошибок.
Долговременные программы поведения
Кроме вариативных режимов можно установить также фиксированный режим подкрепления, при котором субъект ради получения подкрепления должен работать в течение определенного периода времени или определенное количество раз продемонстрировать желательное поведение.
Например, я могут заставить дельфина прыгать шесть раз подряд, используя подкрепление только при каждом шестом прыжке. Очень скоро дельфин усвоит, что от него требуется. Проблема с фиксированным режимом заключается в том, что более ранние проявления желательного поведения не подкрепляются, поэтому они будут выполняться с минимальными усилиями. В случае с дельфиньими прыжками можно быть уверенным, что первые пять будут довольно посредственными, а по-настоящему качественным только последний, за которым последует подкрепление.
Такой эффект фиксированного режима, по-видимому, влияет на выполнение множества человеческих задач – например, на сборочном конвейере. Для того чтобы получить подкрепление, необходимо проработать определенное количество времени. Но, поскольку подкрепление поступает по фиксированному режиму и не зависит от качества работы, человек, естественно, стремится выполнять минимальный объем работы, достаточный лишь для сохранения рабочего места. В начале рабочего периода показатели могут быть особенно плохими. Выплаты по пятницам – это фиксированное подкрепление, которое приводит к «черному понедельнику».
При работе с дельфинами случайное подкрепление первого или второго прыжка наряду с шестым помогает закрепить поведение. При работе с людьми различные виды поощрительных бонусов или иные подкрепления (премии, к примеру) самым прямым образом связаны с качеством и количеством продукции. Нарушение синхронности обычного подкрепления оказывается весьма эффективным.
С помощью фиксированного или вариативного режимов можно выработать невероятно длинные поведенческие цепочки. Цыпленка можно приучить сто и более раз нажимать на кнопку ради единственного зерна кукурузы. В человеческом обществе мы встречаемся с массой примеров отложенных поощрений. Один психолог как-то пошутил, что самый длительный период неподкрепляемого поведения – это обучение в школе.
В долговременных режимах иногда возникает так называемая точка невозврата. Для цыпленка это определяется обменными процессами: когда на нажатие кнопки он начинает тратить больше энергии, чем может восстановить при получении зернышка, поведение начинает угасать – цена работы падает так низко, что ее просто становится незачем делать. Такое сплошь и рядом происходит с людьми.
При очень длительных интервалах между подкреплениями происходит и еще одно явление, а именно, замедленный старт. В начале процесса цыпленок нажимает на кнопку с одинаковой частотой, поскольку каждое нажатие приближает его к желанному подкреплению. Но исследователи заметили, что по мере увеличения промежутка между подкреплениями цыпленок начинает поведенческую цепочку все позже и позже.
Такое явление называют отсроченным началом поведения с долговременной программой, и оно очень хорошо знакомо всем людям. Когда нам предстоит длительная работа – заполнение налоговой декларации или уборка в гараже, – мы придумываем для себя массу оправданий для того, чтобы не приступать к ней прямо сейчас. Иногда даже написание письма является для нас долговременной программой. Стоит нам начать, и мы справляемся с задачей вполне неплохо. Но, боже мой, до чего же трудно заставить себя сесть к столу и начать писать!
Джеймсу Терберу было так трудно начинать статью, что он порой обманывал жену, которая (что и неудивительно) заставляла его писать, потому что только так они могли оплатить арендную плату за жилье. Тербер уходил в свой кабинет и целое утро лежал на диване, держа книгу в одной руке, а другой рукой случайным образом нажимая на кнопки пишущей машинки. Желание отсрочить неприятный момент начала длительной работы оказывается гораздо сильнее перспективы получения положительного денежного подкрепления. А постукивание по клавишам пишущей машинки избавляло Тербера от отрицательного подкрепления, то есть от упреков жены.
Для того чтобы преодолеть это явление, необходимо установить подкрепление за начало работы. В работе с дельфинами я, к примеру, использовала случайное подкрепление за первый или второй прыжок из серии в шесть прыжков. Тот же прием я довольно эффективно применяла в аутотренинге. В течение нескольких лет я училась в вечернем институте. Занятия проходили один-два раза в неделю. Три часа уходило на занятия, и два часа я тратила на дорогу. Около пяти часов вечера я всегда испытывала ужасный соблазн не ходить. Но потом я обнаружила, что, если разбить дорогу на пять шагов – дорога до станции метро, ожидание поезда, пересадка, автобус до университета и подъем по лестнице до класса – и подкреплять завершение каждого шага маленьким кусочком шоколада, который я любила, но обычно не ела, то будет гораздо проще выбраться из дома. За несколько недель я научилась проделывать весь путь и без шоколада, и без внутренней борьбы.
Суеверия: случайное подкрепление
В реальной жизни подкрепления происходят сплошь и рядом. Зачастую это просто совпадения. Биолог, изучавший поведение ястребов, заметил, что стоит ястребу поймать мышь под каким-то кустом, в течение недели он будет каждый день прилетать к этому кусту. Вероятность того, что он пролетит над этим конкретным местом, значительно повышается. Достаточно найти в мусорном ящике двадцатидолларовую банкноту, и, я уверена, на следующий день вам не удастся пройти мимо, не бросив на него пристального взгляда.
Случайное подкрепление оказалось благотворным для ястреба. В действительности, поведение животных настолько эволюционировало, что каждый вид извлекает пользу из любого полученного подкрепления. Хотя многие подкрепления оказываются случайными, они все же оказывают сильнейшее влияние на поведение. Когда поведение не связано с последствиями подкрепления, но субъект все же поступает так, как необходимо для получения подкрепления, ученые называют его поведение суеверным.
Для примера рассмотрим привычку грызть карандаш. Если во время экзамена вы случайно прикусили кончик карандаша, а потом нашли правильный ответ или вас посетила хорошая идея, подкрепление может повлиять на поведение: хорошая идея пришла, когда вы грызли карандаш, таким образом, привычка получила подкрепление. Когда я училась в колледже, у меня не было ни одного неизгрызенного карандаша. Во время сложных экзаменов я порой даже перекусывала карандаши пополам. Я была абсолютно уверена, что привычка грызть карандаш помогает мне думать. Конечно, на самом деле это было не так. Налицо было случайно обусловленное поведение.
То же самое относится к привычке надевать определенную одежду или выполнять определенный ритуал, приступая к выполнению некоторой задачи. Я видела одного бейсболиста, который каждый раз выполнял сложную последовательность из девяти движений, когда был готов к удару. Он прикасался к кепке, прикладывал мяч к перчатке, натягивал кепку на лоб, тер ухо, сдвигал кепку назад, переминался с ноги на ногу и так далее. В напряженный момент он мог повторить все девять движений дважды и при этом никогда не менял их порядок. Последовательность проходила очень быстро – комментаторы никогда не обращали на нее внимание, – однако она являла собой идеальный пример суеверного поведения.
Суеверное поведение часто проявляется в дрессировке животных. Животное может реагировать на критерий, который вы устанавливать не собирались, но случайно подкрепляли настолько часто, что он стал условным. Например, животное может вести себя так, словно для получения подкрепления ему достаточно находиться в определенном месте или сидеть неким конкретным образом. Достаточно перенести занятие в другое место, и поведение таинственным образом нарушается, а вам остается только гадать, почему же это произошло. Было бы разумно в тот момент, когда поведение уже частично усвоено, повторять его в разных ситуациях, даже если они не кажутся вам важными. Таким образом, вы сможете минимизировать вероятность возникновения случайного обусловливания, которое может помешать вам в будущем.
Самое главное – следить за развитием случайных временных связей. И животные, и люди обладают очень четким ощущением временных интервалов. В этом я убедилась, когда дрессировала двух белух прыгать по сигналу (движению руки). Случайно присутствовавший при тренировке ученый с секундомером сообщил мне, что дельфины прыгают каждые двадцать девять секунд. И действительно, даже когда я не давала команды, они прыгали через двадцать девять секунд. Совершенно случайно получилось так, что я отдавала команду через регулярные промежутки времени, и животные привыкли к такому режиму. Они вовсе не опирались на ту информацию, которую должны были бы использовать, по моему мнению.
Многие дрессировщики старой школы находятся в настоящем плену суеверного мышления и поведения. Мне говорили, что дельфины предпочитают, чтобы люди, работающие с ними, были одеты в белое, что мулов нужно бить, что медведи не любят женщин и так далее. Точно такими же бывают школьные учителя, убежденные в том, что на пятиклассников, к примеру, нужно кричать и что завоевать уважение можно только с помощью наказаний. Такие учителя находятся в плену традиций. Они должны поступать совершенно одинаково, потому что не могут отделить по-настоящему эффективные методы от методов суеверных.
Такая путаница проявляется во многих профессиях – в преподавании, технике, военном деле и особенно часто в медицине. Удивительно, сколь многим процедурам приходится подвергаться пациентам не потому, что они необходимы для излечения, а просто потому, что их принято проводить и в настоящее время их проводят все. Любой, кто хоть раз лежал в больнице, может привести в пример десяток ненужных действий, которые являются не чем иным, как проявлением суеверного поведения.
Интересно, что даже после выявления неэффективности суеверного поведения оно пропадает не всегда. Поскольку оно сильно обусловлено, то и защищают его изо всех сил. Укажите врачу на бесполезность или даже вред проводимой им процедуры, и он обрушится на вас с обвинениями в некомпетентности. Я уверена, что бейсболист, выполнявший сложную последовательность движений, ни за что не согласится с тем, кто прикажет ему бросать мяч, не надевая, к примеру, кепки, к которой он перед каждым ударом прикасается по четыре раза.
Чтобы избавиться от собственного суеверного поведения, вы должны осознать, что оно никоим образом не связано с подкреплением.
Мой сын Тед – банкир. Он увлекается фехтованием. Два-три раза в неделю он ходит на тренировки, а по выходным часто уезжает на соревнования. Однажды, когда ему предстояло сразиться с особенно сильным противником, он чувствовал себя ужасно, потому что оставил дома свой любимый клинок. Ту схватку он проиграл. Потом он понял, что гораздо больший вред ему принес его настрой, а вовсе не клинок, который пришлось использовать. В действительности выбор «любимого» клинка являлся всего лишь примером суеверного поведения.
Тед решил избавиться от любых проявлений суеверного поведения, связанных с фехтованием. Сосредоточившись на этом, он выявил массу собственных суеверий – от пристрастия к определенным видам одежды до внутреннего убеждения в том, что на результат выступления могут повлиять плохой сон, конфликт и даже фруктовый сок, выпитый во время соревнований. Систематически анализируя каждое подобное обстоятельство, он поочередно избавлялся от выявленных зависимостей, стоило ему осознать их суеверный характер. Теперь он приезжает на любое соревнование спокойным и уверенным, даже если только что пережил настоящий кошмар – опоздал на поезд, перепутал пересадку, поругался с таксистом. Его не волнует даже перспектива использования чужого клинка или выступления в тренировочном костюме, к которому по цвету совершенно не подходят носки.
Чего можно добиться с помощью положительного подкрепления?
Вот несколько примеров того, чего мои знакомые добились с помощью положительного подкрепления:
* Дизайнер Джуди раз в неделю ходила на курсы живописи в местном университете, чтобы усовершенствовать свое мастерство. Двадцать ее однокурсников тоже были дизайнерами или художниками рекламы. Учитель каждую неделю задавал им домашнее задание. Поскольку все были очень заняты на работе, практически никто этого задания не делал. На каждом занятии учитель десять минут ругал учеников за невыполненное или плохо выполненное домашнее задание. В конце концов Джуди это надоело, и она предложила учителю, чтобы он поощрял тех, кто сделал задание, вместо того чтобы ругать тех, кто его не выполнил. Учитель так и поступил. Он стал хвалить своих учеников за каждое выполненное домашнее задание. Через две недели ученики стали гораздо счастливее, а вместо 30 процентов выполнять домашнее задание стали 75 процентов учеников.
* Студентка Шэннон пришла в гости к подруге и застала такую сцену. Четверо взрослых безуспешно и с определенным риском для себя пытались удержать немецкую овчарку, чтобы полечить ей ухо. Шэннон не особо любит собак, но она изучала роль положительного подкрепления. Она достала из холодильника кусок сыра и за пять минут научила собаку сидеть спокойно, а свободной рукой закапала ей в ухо лекарство.
* Молодая женщина вышла замуж за человека, который оказался чрезмерно властным и требовательным. Хуже всего было то, что свекор, который жил вместе с ними, вел себя по отношению к невестке точно так же. Об этой истории мне рассказала мать этой женщины. Впервые оказавшись в этом доме, она была в ужасе от того, что приходится терпеть ее дочери. «Не волнуйся, мама, – успокоила ее дочь. – Просто подожди и посмотри». Дочь привыкла практически не реагировать на приказы и грубость, но в то же время положительно подкрепляла любые проявления вежливости и нежности со стороны обоих мужчин. За год она превратила мужа и свекра в милейших людей. Они стали улыбаться ей и мгновенно бросаться на помощь, заметив, что у нее в руках тяжелые пакеты.
* Восьмиклассница, живущая в городе, любила отправляться на загородные прогулки со своей собакой. Но собака часто убегала слишком далеко и не возвращалась, когда ее звали. Особенно тяжело было уговорить пса пойти домой. В очередные выходные девочка устроила для собаки настоящий праздник. Она хвалила, ласкала, обнимала ее – но лишь тогда, когда собака подходила к ней во время прогулки. Когда настало время возвращаться домой, девочка позвала собаку, и та с радостью подбежала к ней. Нежность хозяйки перевесила прелесть свободы. Поведение девочки стало положительным подкреплением. Впоследствии никаких проблем во время загородных прогулок не возникало.
* Молодой сотрудник, которого буквально затерроризировал начальник, сумел выбрать те сферы своей работы, которые могли бы стать для начальника положительным подкреплением (например, подача бумаг на подпись). Эту работу он старался приурочить к тем моментам, когда начальник находился в хорошем настроении. Начальник оттаял и даже начал шутить и рассказывать анекдоты.
* Некоторые люди создают особые виды подкреплений. Чтобы их заслужить, другие готовы пойти на многое. Домохозяйка Аннет, когда ее дети выросли, почувствовала бы себя очень одиноко, если бы не подруги, которые каждую неделю, а то и чаще звонили, чтобы поделиться своими новостями. Речь идет вовсе не о соседках или родственницах. Многие подруги Аннет были занятыми деловыми женщинами и жили довольно далеко. Я была одной из них. Почему же все мы звонили Аннет? Если новости были плохими – грипп, проверка налоговой службы или увольнение няни, – Аннет всегда проявляла сочувствие и давала полезные советы. Но особенно необычно Аннет подкрепляла хорошие известия. Достаточно было сказать, что банк предоставил тебе кредит, и она не ограничивалась односложным восклицанием: «Это замечательно!» Она подробно и восхищенно рассказывала тебе, что ты сделала, чтобы заслужить эту радость. «Ты понимаешь? – говорила она. – Вспомни, как напряженно ты работала, чтобы создать хорошую кредитную историю? Помнишь, как тяжело тебе было с телефонной компанией? А как непросто было получить карточку авиакомпании? А теперь ты пожинаешь плоды своей работы. Все признали, что ты – успешная деловая женщина. Но сначала ты должна была сделать правильные ходы, и тебе это удалось. Я по-настоящему горжусь тобой!» Ее слова были не просто одобрением. Это было настоящее подкрепление. После этого все прошлые усилия казались более не испытаниями судьбы, а напряженной работой в верном направлении. Аннет переводила хорошие известия из категории случайной удачи в положительное подкрепление. Неудивительно, что все мы так любили ей звонить.
Организованное подкрепление
Совещания по продажам, клубы поддержки, курсы Дейла Карнеги, группы желающих похудеть – то есть большинство организаций, где группы людей обучаются самосовершенствованию, – активно используют прием положительного подкрепления со стороны группы в отношении отдельных ее членов. Аплодисменты, медали, церемонии вручения премий и другие формы группового признания являются сильными подкреплениями. Иногда такие средства используются весьма творчески.
Один менеджер по продажам из компании «Ай-би-эм», желая поощрить своих сотрудников за хорошие результаты, арендовал футбольный стадион. Он устроил отличную вечеринку для сотрудников и руководителей и пригласил членов их семей. Его сотрудники выходили на поле там, где обычно появляются игроки. И с появлением каждого из них на экране загоралось его имя, а все собравшиеся приветствовали его аплодисментами и криками одобрения.
Некогда я ходила на курсы повышения самооценки Вернера Эрхарда. Эта программа насквозь коммерческая, но меня подкупило в ней следующее. Как профессиональный тренер, я оценила, как великолепно применяются в ней приемы формирования поведения и положительного подкрепления. Программа, как я и предполагала, называлась «тренингом». Руководителя называли «тренером». Целью формирования являлось повышение самооценки. Основным подкреплением в рамках программы являлись не реакции тренера, а невербальное поведение всей группы.
Чтобы поведение группы стало подкреплением, всем участникам велели аплодировать после выступления каждого оратора, даже если делать этого им не хотелось. Таким образом, с самого начала участники группы избавлялись от застенчивости, получали вознаграждение и понимали, что любой их вклад, даже самый незначительный, оценен группой.
Сначала люди аплодировали по обязанности и не более того. Но очень скоро аплодисменты стали искренними. Конечно, они звучали не от радости и удовольствия, как в театре. Но они были исполнены чувства и смысла. В моем классе сложилась ситуация, которая наверняка часто складывается и в других подобных группах. Один из участников постоянно оспаривал то, что говорил тренер. Когда это случилось в третий или четвертый раз, тренер начал спорить с ним. Все понимали, что с логической точки зрения спорщик был совершенно прав. Но поскольку конфликт длился и длился, участникам группы стало неважно, кто из спорящих прав. Все 249 остальных участников хотели только одного – чтобы наш спорщик заткнулся и сел на место.
Правила игры – то есть правила формирования поведения – не позволяли нам протестовать или приказать спорщику замолчать. Но постепенно он почувствовал мрачное молчание группы. Мы видели, что он понял: никому нет дела до того, прав он или нет. Может быть, быть правым – еще не самое главное. Наш спорщик замолчал и сел на место. Все остальные участники группы тут же приветствовали его решение громкими аплодисментами. Это было проявление симпатии и понимания, но в то же время и знак глубокого облегчения. Наши аплодисменты стали очень мощным положительным подкреплением только что продемонстрированного поведения.
Случаи обучения такого типа, в которых важную роль играют поведенческие аспекты, а не словесное выражение, безумно трудно объяснить непосвященным. Эрхард, как любой наставник дзен, часто изрекал афоризмы. В только что описанной ситуации он изрек: «Когда ты прав, от тебя требуется только одно: быть правым». То есть не обязательно любимым или милым: просто правым. Когда я цитирую это высказывание на вечеринках, где кто-то начинает задираться, другие выпускники курсов Эрхарда улыбаются. Пожалуй, улыбнется в такой ситуации любой хороший современный тренер. Но большинство окружающих считают меня странной или захмелевшей. Великолепные приемы тренинга не всегда находят точное вербальное выражение.