[userpic]

Re: оперантное формирование 

bionycks в посте Openmeta (оригинал в ЖЖ)

некоторое время назад между мной, с одной стороны, и agens утверждал ( со ссылками на Карен Прайотт ), что самым эффективным методом является наличие положительного подкрепления, в случае выполнения субьектом полностью или частично желаемого поведения и полное отсутствие к-л реакции оператора на поведение нежелательное.
----------------------
Вы решили пойти по пути решения двух задач параллельно:
а. сформировать поведение X, и
б. прекратить поведение Y,
Проверьте мою догадку: поведение Х, которое вы формировали, планировалось как замена поведению Y. В другом варианте - это могли быть совершенно разные типы поведений для достижения различных целей, и тогда простота задачи для модельных тренировок снижается.
определенный смысл в таком способе, безусловно, есть, но дело в том, что он далеко не всегда является оптимальным.
так как ОФ является коммуникацией, то процесс ОФ является процессом обмена информацией.

-----------------
Вы выбрали так исходную задачу. Прежде чем начать ее решать, говорить об оптимальности не приходится.
Задача выбрать оптимальный режим подкрепления возникает тольок на следующем шаге оперантного формирования.
обычно цель ОФ достигается довольно медленно.
-----------------
это лишь утверждение о навыке использовать ОФ в повседневной комуникации, или вопрос выбора оптимальной стратегии формирования.
Сколько времени вы можете свободно дать испытуемому на то, чтобы он проявил наконец требуемое поведение?)
это происходит из-за того, что субъект не может сразу понять, чего именно от него хотят. фактически, субъект своими действиями задает оператору вопрос, а тот положительным подкреплением отвечает на него "да", а отсутствием подкрепления - "нет". таким образом, задача субъекта сводится к бинарному поиску правильного ответа.
-----------------
Оператору при формировании полезно считать, что субъект вообще не понимает чего от него хотят. Субъект, будучи бинарной системой, Субстратом воспринимает/реагирует на действия оператора, в обход сознания, и при разумной стратегии подкрепления выдает нужное поведение.
как и любая бинарная коммуникация, Положительно-Нейтральное Подкрепление является достаточно надежным каналом ( в плане однозначности интерпретации субъектом информации от оператора ) передачи информации. обратная сторона медали - узость этого канала. как правило, должно пройти достаточно большое количество итераций, чтобы субъект начал уверенно демонстрировать требуемое поведение.
----------------------
Вы пишете о многократном числе повторений для формирования поведения.
А прикиньте, сколько повторений потребуется начинающему наркоману чтобы его привычка стала наконец очень и очень прочной. Одно-два-три, как я представляю, редко больше. Вопрос - в силе подкрепления.
--Наркотик - универсальный и очень сильный позитивный стимул, действует прямиком на биохимию.
-- Пищевое подкрепление - тоже универсальное, но несколько слабей, и пищевые предпочтения уже вступают в роль.
--Ментальные поощрения - удобны уже тем, что вы вольны выбирать те из них, которые будут действовать на данного вам субъекта наиболее сильно.
Кому-то будут нравиться короткие односложные слова-поощрения("замечательно!!", "отлично!", "великолепно!", "супер!", "молодец!"), кому-то особый вариант двигательной или вербальной экспрессии оператора, ну а чей-то Субстрат выдаст нужное ответное поведение при незамедлительном подкреплении позитивными темами в разговоре.
другим существенным недостатком этого метода является то, что из всего множества возможных состояний субъекта лишь несколько являются звеньями искомой цепочки состояий. поэтому субъекту обычно приходится действовать методом перебора, в ожидании положительного подкрепления. если бы к-л образом удалось достичь соотношения положительного подкрепления и его отсутствия как 1:1, то это бы существенно ускорило процесс.
-------
Увеличение числа активностей Субъекта в таком варианте - первейшая задача в цепочке формирования. У Карен Прайор это описано. Животное поощряется всякий раз, когда проявляет какую-то новую активность, - это стимулирует процессы творчества в субстрате, и запускает новые варианты поведений. А оператору появляется выбор из чего редактировать.

2 комментария

сначала старые сначала новые