[userpic]

Вложенные системы подкреплений 

eugzol в посте Metapractice (оригинал в ЖЖ)

Революция кликера
  10. Karen Pryor «Don't shoot the dog!» metatheo
    Re: Масштаб действия и время подкрепления eugzol
    Re: Масштаб действия и время подкрепления metatheo
Конечно можно искуссно владеть ОФ на одном сигнале подкрепления и тем самым решать поставленную задачу/проблему. Типа не выдавать подкрепления слишком часто. Сложность должна со временем расти. Подкреплять реальное продвижение.
Но может поставленная тобой задача уже решена типа в компьютерных играх за рамками описываемой Карен модели ОФ. Там используются вложенные циклы активности-и-подкреплений. Шаги подкрепляются одним стимулом, а завершение всего действия другим.
[(1* 2* 3*)* (4* 5* 6*)* (7* 8* 9*)*]*
Цифрами обозначены отдельные шаги, разным цветом звёздочек — разные стимулы подкрепления.

3 комментария

сначала старые сначала новые