Время подкрепления и длительность программы ↑

metatheo 18 января 2011, 03:49 в посте Metapractice (оригинал в ЖЖ)

Как уже говорилось, подкрепление должно совершаться в связи с действием, которое предполагается видоизменить. Подкрепление - это информация. Оно говорит субъекту, что именно вам нравится. Когда субъект пытается обучиться, информационное содержание подкрепления становится важнее самого подкрепления. В тренировке спортсменов или при обучении танцоров именно восклицания инструктора "Да!" или "Хорошо!", отмечающие нужное движение, а не разбор тренировки или репетиции в раздевалке дают требующуюся информацию.

Я вот думаю, а человека ведь можно дать подкреплении в большинстве случае и чуть позже. Конечно, когда речь идет как в примерах о танце или спорте, то, вероятно, единственный момент поощрить какое-либо отработаваемое действие — это в тот же после его совершения. Но если речь идет о том, чтобы подкрепить не какое-то конкретное действие, а более сложную программу поведения, например, возьмем тот же спорт, тренировку, то подкрепление можно дать, похвалив не тут сразу прямо после окончания тренировки, а позже. Конечно, и тут, наверное, ценность подкрепления может угаснуть если пройдет достаточное количество времени. Но я думаю, что закономерность такая — чем сложнее и длиннее программа поведения, тем на более поздний срок можно отложить подкрепление. Ну, например, человек готовился-готовился к экзамену и сдал его. Необязательно же сразу ему сообщаться какой он молодец. Это можно сделать и через неделю. И более того потом еще несколько раз похвалить его. Не уверен еще в качестве своего примера, ведь, конечно, тут сам сдача экзамена может быть и чаще всего будет подкреплением.

Мы всегда слишком запаздываем, подкрепляя друг друга. "Послушай, дорогая, вчера вечером ты выглядела замечательно", - звучит совсем не так, как та же фраза, сказанная вовремя. Отсрочка подкрепления может даже оказать вредное воздействие ("А что, разве я сейчас не выгляжу замечательно?"). Мы свято верим, что сила слов перекроет ошибки во времени подкрепления.

И тут как раз я думаю, что если быть достаточно искуссным коммуникатором, то можно поведение, указанное в данном примере, подкрепить и на следующий день. Только не в лоб так говорить, а грубо говоря, сначала получить доступ к тому вчерашнему переживанию и затем уже похвалить.

Так что может Прайор и права в общем, что сила слов не может исправить ошибки во времени подкрепления, но в данном примере эта сила все-таки недооценена.

30 комментариев

сначала старые сначала новые

</>

Щелчок и рыбка

eugzol 18 января 2011, 04:35 (оригинал в ЖЖ)

Так и дельфина ведь поощряют "дважды":

— прямо во время правильного действия щелчком

— потом — рыбкой, в общем количестве пропорциональном сумме щелчков

</>

Что конкретно подкрепляется

eugzol 18 января 2011, 04:40 (оригинал в ЖЖ)

а более сложную программу поведения, например, возьмем тот же спорт, тренировку, то подкрепление можно дать, похвалив не тут сразу прямо после окончания тренировки, а позже.

Мне кажется, тут всё-таки продолжает действовать главное правило ОФ — подкрепляется всё без задержки. В таком случае правильно задать вопрос — а что конкретно так подкрепляется?

Может типа какие-то отсроченные процессы развития силы/ловкости и т.п., которые после тренировки прямо в момент подкрепления проходят в теле.

Конечно, и тут, наверное, ценность подкрепления может угаснуть если пройдет достаточное количество времени. Но я думаю, что закономерность такая — чем сложнее и длиннее программа поведения, тем на более поздний срок можно отложить подкрепление.

Чем сложнее и длиннее программа — тем большее в ней скрытых шагов, которые будут идти уже после "официального" окончания. Они и будут подкрепляться.

Ну, например, человек готовился-готовился к экзамену и сдал его. Необязательно же сразу ему сообщаться какой он молодец. Это можно сделать и через неделю. И более того потом еще несколько раз похвалить его. Не уверен еще в качестве своего примера, ведь, конечно, тут сам сдача экзамена может быть и чаще всего будет подкреплением.

Поощрение, скажем, позитивных воспоминаний, связанных со сданным экзаменом. Или продолжающей фоном идти обработки знаний, связанных со сданным предметом. Или ещё чего вроде того.

</>

Масштаб действия и время подкрепления

metatheo 18 января 2011, 04:44 (оригинал в ЖЖ)

Я что-то совершенно не обратил внимание на этот момент.

Но здесь я не имел в виду, что человека поощряют «дважды». Я скорее говорю о разных уровнях поощрения: подкрепление конкретного элемента, подкрепление цепочки элементов, подкрепление всего занятий. И чем более масштабно поведение, т.е. дольше по времени, тем на более длительный срок можно отложить подкрепление.

</>

Re: Масштаб действия и время подкрепления

eugzol 18 января 2011, 04:50 (оригинал в ЖЖ)

Ты говоришь, похоже, о том же что я только что описал:

http://community.livejournal.com/metapractice/281369.html?thread=6209049#t6209049 :)

Я скорее говорю о разных уровнях поощрения: подкрепление конкретного элемента, подкрепление цепочки элементов, подкрепление всего занятий. И чем более масштабно поведение, т.е. дольше по времени, тем на более длительный срок можно отложить подкрепление.

Но в любом случае чтобы всё это имело смысл, надо предполагать что "действие" типа экзамена не оканчивается сдачей экзамена. Или нет? А мы продолжаем подкреплять какую-то продолжающуюся на тему/связанную с "экзаменом" (м.б. уже отдалённо-ассоциативно) активность. Это не "отложенное подкрепление" уже давно сданного экзамена, это прямо точно-вовремя подкрепления чего-то другого, что следует за сдачей экзамена.

</>

Re: Масштаб действия и время подкрепления

metatheo 18 января 2011, 05:03 (оригинал в ЖЖ)

Ты говоришь, похоже, о том же что я только что описал:
http://community.livejournal.com/metapractice/281369.html?thread=6209049#t6209049 :)

:) Ну да, программы-подпрограммы.

Но в любом случае чтобы всё это имело смысл, надо предполагать что "действие" типа экзамена не оканчивается сдачей экзамена. Или нет?

Ага. Под подкрепление после сдачи экзамена подразумевалось, что подкрепляется достаточное изучение предмета.

А мы продолжаем подкреплять какую-то продолжающуюся на тему/связанную с "экзаменом" (м.б. уже отдалённо-ассоциативно) активность.

Ну почему отдаленную активность. Прямо связанную — изучение предмета или даже более широко — образование.

Это не "отложенное подкрепление" уже давно сданного экзамена, это прямо точно-вовремя подкрепления чего-то другого, что следует за сдачей экзамена.

Хм. Вот учился я, учился. Меня за сидение за книжками подкрепляли. Потом я сдал экзамен. Меня похвалил — и я типа чувствую какой я молодец, что учусь. Вообще, пожалуй, тут такое сложное поведение как обучение, что совершенно не понятно, где его начало, а где конец. Тогда да, можно сказать, что подкрепление спустя время после экзамена — будет подкреплением какого-то текущего поведения, которое имеет место быть, но не прямо сейчас.

</>

Re: Масштаб действия и время подкрепления

eugzol 18 января 2011, 05:05 (оригинал в ЖЖ)

--Но в любом случае чтобы всё это имело смысл, надо предполагать что "действие" типа экзамена не оканчивается сдачей экзамена. Или нет?
Ага. Под подкрепление после сдачи экзамена подразумевалось, что подкрепляется достаточное изучение предмета.
--А мы продолжаем подкреплять какую-то продолжающуюся на тему/связанную с "экзаменом" (м.б. уже отдалённо-ассоциативно) активность.
Ну почему отдаленную активность. Прямо связанную — изучение предмета или даже более широко — образование.

Согласен.

--Это не "отложенное подкрепление" уже давно сданного экзамена, это прямо точно-вовремя подкрепления чего-то другого, что следует за сдачей экзамена.
Хм. Вот учился я, учился. Меня за сидение за книжками подкрепляли. Потом я сдал экзамен. Меня похвалил — и я типа чувствую какой я молодец, что учусь. Вообще, пожалуй, тут такое сложное поведение как обучение, что совершенно не понятно, где его начало, а где конец. Тогда да, можно сказать, что подкрепление спустя время после экзамена — будет подкреплением какого-то текущего поведения, которое имеет место быть, но не прямо сейчас.

Это не очень понял :)

</>

Re: Масштаб действия и время подкрепления

metatheo 18 января 2011, 05:17 (оригинал в ЖЖ)

Это не очень понял :)

Я тоже :). Пытался интегрировать твою мысль. Посмотреть на все, исходя из акцентируемых тобой вопросов. Но что-то с ходу не получилось. Попробую в скором времени более формально подойти к описанию поведения. Надеюсь, что удастся адекватно разбить на шаги и тогда будет более проще и понятнее прикинуть.

</>

Re: Время подкрепления и длительность программы

klizardin 18 января 2011, 07:38 (оригинал в ЖЖ)

Я вот думаю, а человека ведь можно дать подкреплении в большинстве случае и чуть позже.

достаточно сомнительное утверждение?..или нет?

т.е. понимаю, ты выводил его из того, что подкрепление действия в точный момент позволяет из той же иконографической памяти вытянуть действие, на которое человек не обращал внимание, но которое важно в данном обучении. или просто для организма точно определить желательное действие. т.е. мы имеем некий набор внутренних процессов, которые нужно модифицировать путем выделения некоторой части и увеличения ее значимости. в то же время, мышление не относится к таким ненаблюдаемым внутреним процессам, но желательное мышление вполне может основыватся на внутрених процессах, которые нужно переформировать используя подкрепление по точному времени. или если не основывается на внутренних процессах, но тогда оно является той же частью мотивации. во втором случае имеет смысл работать с процессами мотивации. но такие процессы опять же внутренние, и опять же для их переформирования нужно точное по времени подкрепление.

</>

Re: Время подкрепления и длительность программы

klizardin 18 января 2011, 07:42 (оригинал в ЖЖ)

Но я думаю, что закономерность такая — чем сложнее и длиннее программа поведения,

для цепочек поведения, в начале подкрепляется последнее действие, потом подкрепляется предпоследнее действие и последнее, и т.д. ты же говоришь лишь о подкрепление, допустим, нахождения в раздевалке. полезно для мотивации (подкрепления мотивации как некоторого процесса) и бесполезно для подкрепления конкретной цепочки действий.

</>

Re: Время подкрепления и длительность программы

klizardin 18 января 2011, 07:48 (оригинал в ЖЖ)

Ну, например, человек готовился-готовился к экзамену и сдал его. Необязательно же сразу ему сообщаться какой он молодец. Это можно сделать и через неделю.

ИМХО ОФ работает с конкретными внутренними процессами. поэтому следует различать подкрепление некоторых стратегий/процессов и подкрепление той же мотивации (как процеса мотивации) для реализации сознательных действий. имхо сознательные действия не определяются ОФ. т.е. да можно заставить преподавателя вести лекцию из угла лекционного помещения, но если преподаватель получит информацию, что наиболее эффективное обучение можно вести с кафедры, то он просто примет решение и пойдет туда.

</>

Re: Время подкрепления и длительность программы

klizardin 18 января 2011, 07:52 (оригинал в ЖЖ)

Мы всегда слишком запаздываем, подкрепляя друг друга. "Послушай, дорогая, вчера вечером ты выглядела замечательно", - звучит совсем не так, как та же фраза, сказанная вовремя. Отсрочка подкрепления может даже оказать вредное воздействие ("А что, разве я сейчас не выгляжу замечательно?"). Мы свято верим, что сила слов перекроет ошибки во времени подкрепления.

ОФ связано с текущими процессами. на данный момент высказывания благодарности в примере женщина осознает, что оно выглядит обычно. далее мужчина говорит, что вчера она выглядела отлично, как результат осознание, что сейчас она выглядит хуже чем вчера.

ИМХО очень точная метафора от Карен Прайон.

</>

Re: Щелчок и рыбка

klizardin 18 января 2011, 08:09 (оригинал в ЖЖ)

Так и дельфина ведь поощряют "дважды":
— прямо во время правильного действия щелчком
— потом — рыбкой, в общем количестве пропорциональном сумме щелчков

правда одно поощрение (один тип) используется для формирование поведения, другой для его поддержания, как подкрепление всего комплексного поведения.

</>

Re: Масштаб действия и время подкрепления

klizardin 18 января 2011, 08:24 (оригинал в ЖЖ)

Я скорее говорю о разных уровнях поощрения:

да откуда этим уровням возникнуть? имхо в ОФ подкрепляется некий внутрений процесс. а вот уже значимость этих процессов и может определять "уровень". но для самого ОФ нет уровней, есть только внутренние процессы.

</>

Re: Щелчок и рыбка

eugzol 18 января 2011, 14:54 (оригинал в ЖЖ)

Да, рыбка в конце тренировки поощряет всю тренировку в целом.

</>

Re: Масштаб действия и время подкрепления

eugzol 18 января 2011, 14:58 (оригинал в ЖЖ)

--Я скорее говорю о разных уровнях поощрения:
--да откуда этим уровням возникнуть?

Всё что кто угодно делает сгруппировано во вложенные циклы.

имхо в ОФ подкрепляется некий внутрений процесс.

но Скиннер-то как раз не заглядывал внутрь "чёрного ящика" :)

а вот уже значимость этих процессов и может определять "уровень".

в обсуждаемом случае значимость создаётся ээ искусственно системой сигналов поощрения

но для самого ОФ нет уровней, есть только внутренние процессы.

для самого ОФ нет никаких внутренних процессов, есть только внешнее поведение

</>

Цепочки поведения подкрепляются в жизни С НАЧАЛА

eugzol 18 января 2011, 15:02 (оригинал в ЖЖ)

для цепочек поведения, в начале подкрепляется последнее действие, потом подкрепляется предпоследнее действие и последнее, и т.д.

для цепочек поведения ПО ХОДУ ИХ ИСПОЛНЕНИЯ подкрепляется сначала первое действие, потом второе и т.д. вплоть до последнего за которое выдаётся самое ээ "сильное" поощрение. если первое действие не подкрепляется субъект не вовлекается в цепочку.

</>

...

eugzol 18 января 2011, 15:05 (оригинал в ЖЖ)

Если я правильно понял, вы говорите о том, что можно с помощью ОФ подкреплять некие подсознательные процессы ("внутренние процессы" — на самом деле мы можем подкреплять лишь внешние сигналы/проявления этих процессов), которые уже дальше сами по себе приведут к нужным действиям.

С другой стороны, вспомните систему званий и учёта выслуги, использующуюся в определённых профессиональных контекстах. Влияет именно на сознательное поведение и влияет очень сильно.

</>

Re: Щелчок и рыбка

klizardin 18 января 2011, 15:07 (оригинал в ЖЖ)

я имел в виду, что один тип используется во время тренировок, для формирования последовательностей дейтсвий. другой же используеются во время выступлений для всего сформированного сложного действия.

т.е. нужно обращаться к исходникам, мы противоречим друг другу.

</>

Re: Цепочки поведения подкрепляются в жизни С НАЧАЛА

klizardin 18 января 2011, 15:10 (оригинал в ЖЖ)

читай исходники, ты не прав. там была даже фраза, что Карен не смогла придумать применение этому правилу кроме как заучивание стихотворений начиная с последнего четырехстишья.

</>

Re: Масштаб действия и время подкрепления

klizardin 18 января 2011, 15:13 (оригинал в ЖЖ)

--имхо в ОФ подкрепляется некий внутрений процесс.
--но Скиннер-то как раз не заглядывал внутрь "чёрного ящика" :)

а подкрепляя некоторый процесс мы "не заглядываем" в его природу.

--а вот уже значимость этих процессов и может определять "уровень".
--в обсуждаемом случае значимость создаётся ээ искусственно системой сигналов поощрения

т.е. давай полностью твое утвержедние: для подкрепления используются сигналы с разной степенью "уровня". попровляй, если не точен.

</>

Re: Цепочки поведения подкрепляются в жизни С НАЧАЛА

eugzol 18 января 2011, 15:15 (оригинал в ЖЖ)

читай исходники

чтение исходников не освобождает от необходимости думать самому дополнительно :)

ты не прав. там была даже фраза, что Карен не смогла придумать применение этому правилу кроме как заучивание стихотворений начиная с последнего четырехстишья.

а я тебе про другое. обучение идёт с конца. а когда субъект выполняет цепочку, он выполняет её сначала. читай исходники — там тебе напишут — каждое следующее действие служит подкреплением для предыдущего :) таким образом получается что:

— один стимул поощрения (не явный) = типа "переход" между шагами

— второй стимул поощрения — завершение всей цепочки и получения свистка/рыбки

Получается два (один в друго вложенный) цикла подкреплений.

</>

...

eugzol 18 января 2011, 15:17 (оригинал в ЖЖ)

1. Сигналы используются любые

2. "Уровни"/"сила" сигналов формируется по ходу их натурального применения. Какой сигнал используется для подкрепления большего числа ээ атомарных действий, тот в итоге и будет ээ "сильнее".

</>

Re: Масштаб действия и время подкрепления

klizardin 18 января 2011, 15:18 (оригинал в ЖЖ)

--но для самого ОФ нет уровней, есть только внутренние процессы.
--для самого ОФ нет никаких внутренних процессов, есть только внешнее поведение

внутренние процессы естественно будут иметь некоторое внешнее проявление, по которому мы их и подкрепляем. процессы были затронуты как обобщение, когда мы можем подкреплять как конкретное поведение, так и такие процессы как мотивация. процессом в одном из случаев может быть и некоторое напряжение мышц и его результат движение.

</>

...

klizardin 18 января 2011, 15:20 (оригинал в ЖЖ)

я утверждаю, что ОФ и сознательный выбор -- явления разной природы, хотя они и могут пересекатся. но такое пересечение это ошибка сознательного выбора.

</>

Re: Масштаб действия и время подкрепления

eugzol 18 января 2011, 15:20 (оригинал в ЖЖ)

понял. то есть фактически, вообще-то, мы МОЖЕМ подкреплять даже очень-очень маленькие "кванты" действия, и субъект в итоге таки имеет все шансы их просуммировать и самостоятельно вовлечься в макро/масштабное поведение

</>

...

eugzol 18 января 2011, 15:21 (оригинал в ЖЖ)

сознательный выбор определяется ценностными иерархиями. ценностные иерархии включают иерархии стимулов ОФ :)

</>

действие - условное подкрепление действия

klizardin 18 января 2011, 15:29 (оригинал в ЖЖ)

да, здесь последующее действие становятся условным подкреплением для предыдущего.

</>

...

klizardin 18 января 2011, 15:38 (оригинал в ЖЖ)

а смысл в самом понятии силы? ты собираешься смешивать при ОФ разные сигналы? и для того чтобы знать, какой из сигналов будет определять поведение вводишь понятие силы сигнала?

</>

...

klizardin 18 января 2011, 15:44 (оригинал в ЖЖ)

ну да, возникает вопрос практического рассмотрения.

</>

...

eugzol 18 января 2011, 15:55 (оригинал в ЖЖ)

не смешивать, а выстраивать вложенные циклы. определять будут все в совокупности. понятие "силы" м.б. реально ни к чему.