Посмотрели презентацию "Алгоритм Скиннера", потом проделали упражнение. Потом посмотрели материал по вариабельному режиму подкрепления и повторили упражнение.Некоторые из вопросов, возникавших по ходу и после в обсуждении:1. Почему в упражнении требуется только один раз достичь требуемого результата, хотя в прикладном применении обычно требуется устойчивость. В моём понимании ответом на это как раз является вариабельный режим подкрепления:
Вариабельный режим гораздо более эффективен для поддержания поведения, чем постоянный, предсказуемый. Один психолог объяснил это мне так: если у вас машина новая и всегда хорошо заводилась, а однажды, когда вы сели в нее, повернули ключ, она не завелась, то вы, может быть, и попробуете завестиее еще несколько раз, но скоро решите, что что-нибудь не в порядке, и позвоните в гараж. Поведение, состоящее в поворачивании ключа, при отсутствии ожидаемого немедленного подкрепления быстро угаснет. С другой стороны, если у вас вместо машины старая консервная банка, которая еще ни разу не заводилась с первой попытки, и каждый раз требуется целая вечность для того, чтобы привестиее в движение, вы можете продолжать попытки ее завести в течение получаса; ваше поведениепо поворачиванию ключа происходит в низковероятностном режиме подкрепления и поэтому сильнейшим образом поддерживается.Если давать дельфину рыбку за каждый прыжок, то скоро прыжки станут невысокими, небрежными, лишь бы отделаться. Если теперь перестать давать рыбу, дельфин тут же перестает прыгать.Но, если после того как животное научилось прыгать за рыбку, начать подкреплять первый прыжок,затем третий и так далее наугад, поведение будет поддерживаться на более высоком уровне:не получив подкрепления, животное станет прыгать чаще, стараясь угадать счастливый номер,и прыжки могут даже усилиться. В свою очередь это позволит подкреплять выборочно наиболее сильные прыжки, то есть посредством вариативного режима совершенствовать деятельность.http://lib.ru/DPEOPLE/nerychite.txt_with-big-pictures.html
2. В реальной дрессировке животных часто с помощью дополнительных манипуляций заставляют его совершить нужное действие (ну а человеку можно просто сказать что от него надо), дальше это подкрепляют. В упражнении же требуется использовать только один сигнал-подкрепление без всякого другого обмена информацией. Кажется были сомнения в том что с помощью него одного можно сформировать из текущей активности за разумное время любое требуемое поведение.3. Была отмечена необходимость высокой точности формулирования задания. То что получалось в итоге у субъекта часто формально подходило под задачу, но вызывало некоторую неудовлетворённость. В общем и целом, мне кажется, ОФ может дать хороший контекст для практики метамоделирования, без точного формулирования задания до полной очевидности невозможно ни эффективно проводить выработку, ни получить "чистый" конечный результат.4. Был несколько раз поднят вопрос о том, что дрессируемый "не понимает", что он делает. Было указано, что это нормальное положение вещей. Как по ходу выяснялось, под "пониманием" понималось не оно само, а совсем разный набор вещей как то:- то что субъект будет регулярно, а не однократно повторять поведение- то что результируемое поведение "чистое": точно удовлетворяет заданию, не содержит лишних движений перед или после нужного- и др.
1. Почему в упражнении требуется только один раз достичь требуемого результата, хотя в прикладном применении обычно требуется устойчивость. В моём понимании ответом на это как раз является вариабельный режим подкрепления:Упражнение рассчитано на человека. А правила расписаны в большей мере для животных.2. В реальной дрессировке животных часто с помощью дополнительных манипуляций заставляют его совершить нужное действие (ну а человеку можно просто сказать что от него надо), дальше это подкрепляют.Но как только это "то что надо" попадет в поле сознания человека - достижение этого "что надо" - становится таким же вероятным, как результат игры в крикет с помощью фламинго в роли биты (см. аллегорию Бейтсона/Кэррола).В упражнении же требуется использовать только один сигнал-подкрепление без всякого другого обмена информацией. Кажется были сомнения в том что с помощью него одного можно сформировать из текущей активности за разумное время любое требуемое поведение.Но именно в этом надо во что бы то ни стало убедиться. В упражнении. На субъекте-человеке.3. Была отмечена необходимость высокой точности формулирования задания.Как это. Какие такие задания? Субъект знает только что он должен войти в комнату и демонстрировать некоторую фоновую активность.То что получалось в итоге у субъекта часто формально подходило под задачу, но вызывало некоторую неудовлетворённость. В общем и целом, мне кажется, ОФ может дать хороший контекст для практики метамоделирования, без точного формулирования задания до полной очевидности невозможно ни эффективно проводить выработку, ни получить "чистый" конечный результат.Это все потом потом.4. Был несколько раз поднят вопрос о том, что дрессируемый "не понимает", что он делает.Он и не должен понимать что он делает. Но все субъекты делятся:--на тех кто во что бы то ни стало ищет понимания того что делает--другие могут делать нечто "просто так"
3. Была отмечена необходимость высокой точности формулирования задания.Как это. Какие такие задания? Субъект знает только что он должен войти в комнату и демонстрировать некоторую фоновую активность.Оператор формулирует для себя и говорит контроллёрам/наблюдателям.
--То что получалось в итоге у субъекта часто формально подходило под задачу, но вызывало некоторую неудовлетворённость. В общем и целом, мне кажется, ОФ может дать хороший контекст для практики метамоделирования, без точного формулирования задания до полной очевидности невозможно ни эффективно проводить выработку, ни получить "чистый" конечный результат.Это все потом потом.Были отклонены задания типа "субъект споёт", "субъект станцует" из-за недостаточной конкретности глаголов.