Не рычите на собаку! (О дрессировке животных и людей)
Не рычите на собаку! (О дрессировке животных и людей) читать книгу онлайн
Эта книга о том, как обучать кого угодно: человека или животное, старого или молодого, самого себя или других — и чему угодно. Как добиться, чтобы кот спрыгнул с кухонного стола, а бабушка перестала ворчать; как управлять поведением домашних животных, детей, начальства и друзей; как улучшить свои достижения в теннисе, гольфе, математике, развить память?
Все это можно достичь, используя принципы обучения с подкреплением. Эти принципы являются такими же непреложными законами природы, как законы физики.
Внимание! Книга может содержать контент только для совершеннолетних. Для несовершеннолетних чтение данного контента СТРОГО ЗАПРЕЩЕНО! Если в книге присутствует наличие пропаганды ЛГБТ и другого, запрещенного контента - просьба написать на почту [email protected] для удаления материала
Но это скучно. Разве мы не хотим всегда обучиться новому — катанию на лыжах, игре на пианино, как и любой другой деятельности — как можно быстрее? Конечно, хотим, и вот тут все дело в правильной выработке навыка. Далее, разве мы не предпочитаем избежать вообще или сократить до минимума повторения? Опять-таки, конечно же, но некоторые физические навыки требуют повторения, потому что мускулы «учатся» медленно, и требуется многократное повторение движений, прежде чем они станут совершаться с легкостью. Но даже в этом случае хорошо спланированная программа выработки может свести до минимума необходимую тренировку и сделать значимым каждый момент практических занятий тем самым чрезвычайно ускоряя совершенствование. И наконец, в спорте, музыке и других творческих устремлениях вы можете захотеть развить не только стабильное выполнение навыка, но и выполнение на том наивысшем уровне, который доступен вам или тому, кого вы обучаете. В этом случае правильное использование законов направленной выработки может быть решающим.
Способы и приемы или закономерности
Есть два аспекта выработки: первый способ и приемы, то есть последовательность шагов, необходимых для выработки типа поведения, и второй — закономерности или правила, предписывающие, как, когда и почему эти типы поведения должны подкрепляться.
Большинство тренеров, большинство книг о тренировке и большинство тех, кто обучает тренеров, — имеет дело потом исключительно со способом или приемом. «Возьмите в руки клюшку для гольфа как показано на рисунке», «Подведите прицел винтовки под нужное место мишени», «Никогда не наклоняйтесь в горах», «Взбивайте яйца металлическим венчиком по часовой стрелке» Это прекрасно. Эти приемы обычно складываются годами при участии многих людей, путем проб и ошибок, и поэтому они оптимальны. В самом деле вы будете более уверенно сидеть на лошади, если пятки у вас опущены, а мяч для гольфа будет послан вами дальше, если вы хорошенько отклонитесь в сторону замаха. Если вы заинтересованы в том, чтобы овладеть каким-либо навыком, я могу вас уверить, что вы извлечете максимум возможного от устоявшихся приемов выполнения действий, которые включаются в данный навык, почерпнув это из книг, от преподавателей, инструкторов и наблюдая или изучая действия других людей. Другую сторону выработки составляют закономерности, которые регулируют сам процесс обучения: когда надо поднажать, когда подослабить обучение; как наиболее эффективно повышать критерии, что делать, если возникли затруднения, и, вероятно, самое главное — когда остановиться. В этих вопросах обычно полагаются на интуицию и опыт тренеров или инструкторов, на случай или удачу. Между тем именно успешность применения этих закономерностей определяет разницу между просто хорошим и великим преподавателями, между радостным, быстрым и успешным обучением и обучением, приводящим к срывам, медленным, скучным и неприятным. Хороший процесс выработки, а не только хорошие приемы, делают обучение эффективным.
Десять правил выработки
С моей точки зрения существуют десять правил, управляющих процессом выработки. Некоторые — по крайней мере четыре первых — берут начало из психологических лабораторий и установлены экспериментально. Другие, насколько мне известно, даже не являлись предметом специального изучения, но рассматриваются всеми, кто имел дело с выработкой поведения, как неотъемлемая особенность: вы всегда знаете (обычно слишком поздно), когда вы нарушили одно из них. Я перечислю эти правила, а затем несколько подробнее остановлюсь на каждом из них:
1. Повышайте критерий небольшими градациями, чтобы у субъекта всегда была реальная возможность выполнить требуемое и получить подкрепление.
2. В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно.
3. Прежде чем увеличивать или повышать критерий, пользуйтесь подкреплением текущего уровня ответа, т. е. подкрепляйте любое исполнение данного действия, имеющегося в данный момент.
4. Вводя новый критерий, временно ослабьте старые.
5. Будьте впереди того, кого вы обучаете: полностью планируйте свою программу выработки так, чтобы в случае внезапного успеха обучаемого, вы знали, что следует подкреплять далее.
6. Не меняйте тренеров на «середине реки»; у вас может быть несколько инструкторов на одного обучающегося, но придерживайтесь одной программы выработки на каждый из типов поведения.
7. Если одна процедура выработки не приносит успеха, найдите другую, существует столько же способов добиться нужного поведения, сколько инструкторов, способных их придумать.
8. Не кончайте тренировку, не дав положительного подкрепления, это соответствует наказанию.
9. Если навык ухудшается, «возвратитесь к детскому саду», быстро повторите весь процесс выработки с серией легких подкреплений.
10. Оканчивайте, по возможности, каждую тренировку на высокой ноте и в любом случае останавливайтесь, оставаясь впереди обучаемого.
1. Повышайте критерий небольшими градациями, чтобы у субъекта всегда была реальная возможность выполнить требуемое и получить подкрепление. Практически это означает, что, когда вы увеличиваете требования или повышаете критерий подкрепления, вы должны это делать в пределах, доступных в данный момент субъекту. Если ваша лошадь берет барьер в два фута, иногда имея фут в запасе вы можете увеличить барьер до двух с половиной футов. Поднять его до трех футов, значит искать себе неприятностей: животное способно на это, но пока не в состоянии обеспечить стабильности. А повысить барьер до трех с половиной футов означает накликать несчастье.
То, насколько быстро вы можете увеличить критерий, не зависит от фактических возможностей субъекта, нынешних или будущих, никогда не исходите из того, что лошадь большое существо с сильными ногами, способное взять восьми футовое препятствие, или из того, что она обычно перепрыгивает через четырехфутовый забор на пастбище. Быстрота увеличения критерия зависит от того, насколько хорошо ваше взаимодействие в процессе выработки, каковы ваши правила подкрепления.
Каждый раз, как вы увеличиваете критерий, вы меняете правила. Субъекту должна быть дана возможность обнаружить это; несмотря на изменение правил, при некотором увеличении усилий, субъект должен продолжать получать подкрепление (но при этом в некоторых случаях выполнение действия на прежнем уровне становится неэффективным).
Это может быть усвоено только в процессе ознакомления с подкреплением на новом уровне.
Если вы повышаете критерий так сильно, что субъекту надо совершить усилия значительно большие, чем он ранее совершал для вас — неважно делал или не делал он это для себя, — вы сильно рискуете. Поведение может быть сорвано.
У прыгуна могут появиться дурные привычки, такие, как останавливаться перед барьером или сбивать его. Привычки, подавление которых потребует много времени. Самый быстрый — а иногда единственный — способ сформировать поведение — это увеличивать критерии такими ступенями, чтобы субъекту легко давалось постоянное улучшение поведения. Непрерывный прогресс, даже дюйм за дюймом, приведет вас к поставленной цели гораздо быстрее, чем попытки форсировать быстрый прогресс с риском потерять все выработанное поведение.
Однажды мне пришлось встретиться с одним отцом, допустившим в этом серьезную ошибку. Так как сын-подросток очень плохо учился, он отобрал у него обожаемый всеми подростками мотоцикл до улучшения отметок. Мальчик стал заниматься лучше, его оценки улучшились, с F и D до D и C. Однако вместо того, чтобы поощрить этот прогресс, отец сказал, что оценки еще недостаточно хорошие, и продолжал придерживаться своего запрета. Эта эскалация критерия была слишком резкой, мальчик совсем перестал заниматься. Более того, он стал очень недоверчивым.
2. В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно. Под этим я не подразумеваю, что вы не можете работать над многими различными типами поведения в один и тот же период времени. Безусловно, вы можете это. Во время любого занятия мы можем сначала немного поработать над качеством, затем над скоростью — в теннисе над ударом слева, затем над ударом справа, затем над работой ног и т. д. Это избавляет от монотонности. Хорошие преподаватели все время меняют работу, оставляя данную задачу, как только в ней достигнут успех, и переходят к другой. Однако, когда вы работаете над данным типом поведения, вы должны пользоваться в каждый данный отрезок времени одним и только одним неизменным критерием. Допустим, что я обучаю дельфина делать фонтан брызг, и один раз не дам ему подкрепление, потому что фонтан недостаточно велик, а другой раз — потому что он направлен не в ту сторону, в итоге у животного не будет ключа к расшифровке того, что я хочу от него. Одно подкрепление не может содержать двух типов информации: я должна сначала довести высоту фонтана до удовлетворяющей меня отметки, а затем формировать его направление вне зависимости от высоты, до тех пор, пока оно тоже не будет заучено; только когда оба критерия установлены, я могу требовать соблюдения обоих.