Metapractice: Лента записей и комментариев

</>

Масштаб действия и время подкрепления

metatheo 18 января 2011, 04:44 в посте Metapractice (оригинал в ЖЖ)

Я что-то совершенно не обратил внимание на этот момент.

Но здесь я не имел в виду, что человека поощряют «дважды». Я скорее говорю о разных уровнях поощрения: подкрепление конкретного элемента, подкрепление цепочки элементов, подкрепление всего занятий. И чем более масштабно поведение, т.е. дольше по времени, тем на более длительный срок можно отложить подкрепление.

</>

Условное подрепления = Якорь особого типа

metatheo 18 января 2011, 04:28 в посте Metapractice (оригинал в ЖЖ)

Условное подкрепление представляет собой какой-либо изначально ничего незначащий сигнал - звук, свет, движение - который умышленно связывают с подачей подкрепления.
...
Наша жизнь изобилует условными подкреплениями. Нам нравится слышать, как звонит телефон или видеть набитый почтовый ящик, даже если половина звонков неинтересна и большая часть корреспонденции - утиль, потому что множество случаев научили нас связывать звонок или конверт с хорошим. Нам нравится рождественская музыка, и мы ненавидим запах зубного кабинета. Мы храним окружающие нас вещи - картины, посуду, трофеи - не потому, что они красивы или полезны, а потому, что они напоминают нам о временах, когда мы были счастливы, или о людях, которых мы любили. Они представляют собой условные подкрепления.

Ну из этого описания хорошо видно, что условное подкрепление — это определенного вида якорь. Как назвать переживание, которое якорится, и если в этом смысл, я сходу не соображу.

Практически дрессировка животных с использованием положительного подкрепления почти всегда должна начинаться с выработки условного подкрепления. Прежде чем начать выработку поведения как такового, пока субъект еще ничего особенного и не делает, вы учите его понимать значимость условного подкрепления, сочетая его с пищей, поглаживанием или другим истинным подкреплением.

Угу. Дрессировка животного начинается с установки определенного вида якоря.

Как только вы выработали условное подкрепление, вы должны пользоваться им осторожно, не разбрасывать без толку, иначе его сила уменьшится.

Как и в случае с якорением? Или подождите, ведь якорь может быть типа самоподкрепляющимся? Хотя, кстати, вроде никаких закомерностей на этот счет нигде не указано.

</>

Вариабельное подкрепление

metatheo 18 января 2011, 04:27 в посте Metapractice (оригинал в ЖЖ)

Для того чтобы поддерживать уже выученное поведение нa определенном уровне надежности, не только не надо подкреплять его все время, а даже, наоборот, следует прекратить регулярные подкрепления и перейти на эпизодическое использование подкрепления, подаваемого в случайном и непредсказуемом порядке. Это и есть то, что психологи называют вариабельным режимом подкрепления. Вариабельный режим гораздо более эффективен для поддержания поведения, чем постоянный, предсказуемый.

Настолько важная идея, что хочется ее просто выписать. Совершенно не понятно, почему это должно работать, но не доверять и смысла не вижу. Подумать, как это можно использовать в самоподкреплении.

Действенность вариативного подкрепления лежит в основе всех азартных игр. Если каждый раз, опустив в автомат 5 центов, будете получать десять, то скоро вы потеряете к этому интерес.

В сервисы социальных сетей тот же механизм присутствует. Народ даже сообразил: «Vkontakte, как холодильник - знаешь что ничего нового нету, но 5 раз зайдёшь и проверишь.»

</>

Слишкое раннее подкрепление неэффективно

metatheo 18 января 2011, 03:57 в посте Metapractice (оригинал в ЖЖ)

Слишком раннее подкрепление тоже неэффективно.
...
Мне кажется, что иногда и детей мы подкрепляем слишком рано, находясь под ложным впечатлением, будто мы их подбадриваем ("Молодец, хорошо, ты уже почти все сделала правильно"). Возможно, при этом мы подкрепляем попытки. Но существует разница между попыткой сделать что-то и выполнением этого. Причитания типа "я не могу" иногда отражают фактическое положение вещей, но они могут являться и признаками того, что часто подкреплялись просто попытки. Вообще, подкрепление поведения, которое еще не совершилось, - подарками, обещаниями, комплиментами или чем-нибудь в этом роде - ни капельки не подкрепляет это поведение. Если что-то и подкрепляется, так это поведение, совершающееся в данное время: верояшве всего - выпрашивание подкрепления.

Вот это заставило меня задуматься. Как бы провести грань между создание мотивации у человека, приободрении и слишком ранним подкреплением. Может быть мои теплые слова подкрепляют в человеке, как раз то, чего бы я не хотел, и он даже он не хотел. Меня и раньше терзали такие сомнения, но тут они облечены в форму, с которой можно поработать.

</>

Время подкрепления и длительность программы

metatheo 18 января 2011, 03:49 в посте Metapractice (оригинал в ЖЖ)

Как уже говорилось, подкрепление должно совершаться в связи с действием, которое предполагается видоизменить. Подкрепление - это информация. Оно говорит субъекту, что именно вам нравится. Когда субъект пытается обучиться, информационное содержание подкрепления становится важнее самого подкрепления. В тренировке спортсменов или при обучении танцоров именно восклицания инструктора "Да!" или "Хорошо!", отмечающие нужное движение, а не разбор тренировки или репетиции в раздевалке дают требующуюся информацию.

Я вот думаю, а человека ведь можно дать подкреплении в большинстве случае и чуть позже. Конечно, когда речь идет как в примерах о танце или спорте, то, вероятно, единственный момент поощрить какое-либо отработаваемое действие — это в тот же после его совершения. Но если речь идет о том, чтобы подкрепить не какое-то конкретное действие, а более сложную программу поведения, например, возьмем тот же спорт, тренировку, то подкрепление можно дать, похвалив не тут сразу прямо после окончания тренировки, а позже. Конечно, и тут, наверное, ценность подкрепления может угаснуть если пройдет достаточное количество времени. Но я думаю, что закономерность такая — чем сложнее и длиннее программа поведения, тем на более поздний срок можно отложить подкрепление. Ну, например, человек готовился-готовился к экзамену и сдал его. Необязательно же сразу ему сообщаться какой он молодец. Это можно сделать и через неделю. И более того потом еще несколько раз похвалить его. Не уверен еще в качестве своего примера, ведь, конечно, тут сам сдача экзамена может быть и чаще всего будет подкреплением.

Мы всегда слишком запаздываем, подкрепляя друг друга. "Послушай, дорогая, вчера вечером ты выглядела замечательно", - звучит совсем не так, как та же фраза, сказанная вовремя. Отсрочка подкрепления может даже оказать вредное воздействие ("А что, разве я сейчас не выгляжу замечательно?"). Мы свято верим, что сила слов перекроет ошибки во времени подкрепления.

И тут как раз я думаю, что если быть достаточно искуссным коммуникатором, то можно поведение, указанное в данном примере, подкрепить и на следующий день. Только не в лоб так говорить, а грубо говоря, сначала получить доступ к тому вчерашнему переживанию и затем уже похвалить.

Так что может Прайор и права в общем, что сила слов не может исправить ошибки во времени подкрепления, но в данном примере эта сила все-таки недооценена.

</>

ОФ и мотивация

metatheo 18 января 2011, 03:36 в посте Metapractice (оригинал в ЖЖ)

Существуют два вида подкрепления: положительное и отрицательное.
Положительное подкрепление - это нечто, желаемое субъектом: пища, ласка или похвала. Негативное подкрепление - это то, чего субъект хотел бы избежать: шлепок, нахмуривание бровей, неприятный звук (предупреждающий зуммер в машинах, который раздается, если вы забыли пристегнуть ремень безопасности, - это отрицательное подкрепление).

Тут очевидно можно провести параллель между ОФ и мотивацией. Отрицательное ОФ — отрицательная мотивая; положительное ОФ - положительная мотивация. И еще одним моментом, который похожи — это подкрепление при осуществление какой-то длительной программы поведения. В «Используй свой мозг» Бэндлер выявляется стратегию мотивации одной женщины, и она говорит, что испытываю небольшую часть приятного переживания, которое ожидает ее в конце, при завершении каждого небольшого шага.

Отсюда вопрос — не является ли предпочитаемая стратегия мотивации в какой-то степени отражение того, как именно происходило воспитание/выработка поведения.

Например, кого-то в школу заставляют идти, заставляют учится, грозясь наказанием. А кому-то больше везет, их хвалят, ими гордятся. И эти уроки для кого-то становятся решающими в их дальнейшей жизни.

</>

Re: Основа ОФ

metatheo 16 января 2011, 23:42 в посте Metapractice (оригинал в ЖЖ)

А какое там современное введение в бихевиоризм почитать можно?

</>

Основа ОФ

metatheo 16 января 2011, 22:07 в посте Metapractice (оригинал в ЖЖ)

Основа этой теории по разным источникам известна как модификация поведения, теория подкрепления, оперантное обусловливание, бихевиоризм, психология поведения и т.д.; это тот раздел психологии, который принес мировую известность Б.Ф.Скиннеру, профессору Гарвардского университета.

</>

Хорошие пресуппозиции и Франк Бук

metatheo 16 января 2011, 22:03 в посте Metapractice (оригинал в ЖЖ)

Хочется отметить, что Прайор с первых слов задает такие вот ~хорошие пресуппозиции.

Фраза про «человеческий взгляд» Франка Бука заинтересовала мое внимание. И я заглянул в оригинал:

«You do not need special qualities of patience, or a forceful personality, or a way with animals or children, or what circus trainer Frank Buck used to call the power of the human eye. »

Может быть Бук говорил что-то более конкретное, что может оказаться подходящим материалом для моделирования.

А Франк Бук, видимо, это вот это человек: http://en.wikipedia.org/wiki/Frank_Buck_(animal_collector)

</>

Предисловие автора

metatheo 16 января 2011, 21:59 в посте Metapractice (оригинал в ЖЖ)

Эта книга о том, как обучать кого угодно: человека или животное, старого или молодого, самого себя или других - и чему угодно. Как добиться, чтобы кот спрыгнул с кухонного стола, а бабушка перестала ворчать; как управлять поведением домашних животных, детей, начальства и друзей; как улучшить свои достижения в теннисе, гольфе, математике, развить память? Все это можно достичь, используя принципы обучения с подкреплением.
...
Законы подкрепления просты: их можно за десять минут записать на школьной доске и за час выучить. Применение их в основном зависит от ситуации, обучение с подкреплением подобно игре, в которой надо быстро соображать. Каждый может быть тренером, но некоторые от природы способны к этому больше, чем другие. Вам вовсе не обязательно отличаться каким-то особым терпением, быть сильной личностью, не требуется и особого подхода к детям и животным, можно не обладать и тем, что цирковой дрессировщик Франк Бук называет силой человеческого взгляда.