Посмотрели презентацию "Алгоритм Скиннера", потом проделали упражнение. Потом посмотрели материал по вариабельному режиму подкрепления и повторили упражнение.
Некоторые из вопросов, возникавших по ходу и после в обсуждении:
1. Почему в упражнении требуется только один раз достичь требуемого результата, хотя в прикладном применении обычно требуется устойчивость. В моём понимании ответом на это как раз является вариабельный режим подкрепления:
Вариабельный режим гораздо более эффективен для поддержания поведения, чем постоянный, предсказуемый. Один психолог объяснил это мне так: если у вас машина новая и всегда хорошо заводилась, а однажды, когда вы сели в нее, повернули ключ, она не завелась, то вы, может быть, и попробуете завести
ее еще несколько раз, но скоро решите, что что-нибудь не в порядке, и позвоните в гараж. Поведение, состоящее в поворачивании ключа, при отсутствии ожидаемого немедленного подкрепления быстро угаснет. С другой стороны, если у вас вместо машины старая консервная банка, которая еще ни разу не заводилась с первой попытки, и каждый раз требуется целая вечность для того, чтобы привести
ее в движение, вы можете продолжать попытки ее завести в течение получаса; ваше поведение
по поворачиванию ключа происходит в низковероятностном режиме подкрепления и поэтому сильнейшим образом поддерживается.
Если давать дельфину рыбку за каждый прыжок, то скоро прыжки станут невысокими, небрежными, лишь бы отделаться. Если теперь перестать давать рыбу, дельфин тут же перестает прыгать.
Но, если после того как животное научилось прыгать за рыбку, начать подкреплять первый прыжок,
затем третий и так далее наугад, поведение будет поддерживаться на более высоком уровне:
не получив подкрепления, животное станет прыгать чаще, стараясь угадать счастливый номер,
и прыжки могут даже усилиться. В свою очередь это позволит подкреплять выборочно наиболее сильные прыжки, то есть посредством вариативного режима совершенствовать деятельность.
http://lib.ru/DPEOPLE/nerychite.txt_with-big-pictures.html
2. В реальной дрессировке животных часто с помощью дополнительных манипуляций заставляют его совершить нужное действие (ну а человеку можно просто сказать что от него надо), дальше это подкрепляют. В упражнении же требуется использовать только один сигнал-подкрепление без всякого другого обмена информацией. Кажется были сомнения в том что с помощью него одного можно сформировать из текущей активности за разумное время любое требуемое поведение.
3. Была отмечена необходимость высокой точности формулирования задания. То что получалось в итоге у субъекта часто формально подходило под задачу, но вызывало некоторую неудовлетворённость. В общем и целом, мне кажется, ОФ может дать хороший контекст для практики метамоделирования, без точного формулирования задания до полной очевидности невозможно ни эффективно проводить выработку, ни получить "чистый" конечный результат.
4. Был несколько раз поднят вопрос о том, что дрессируемый "не понимает", что он делает. Было указано, что это нормальное положение вещей. Как по ходу выяснялось, под "пониманием" понималось не оно само, а совсем разный набор вещей как то:
- то что субъект будет регулярно, а не однократно повторять поведение
- то что результируемое поведение "чистое": точно удовлетворяет заданию, не содержит лишних движений перед или после нужного
- и др.