[userpic]

... 

metanymous в посте Openmeta (оригинал в ЖЖ)

фактически, субъект своими действиями задает оператору вопрос, а тот положительным подкреплением отвечает на него "да", а отсутствием подкрепления - "нет".
Лучше не употреблять метафору "вопроса-ответа" по отношению к сигналам, которые представляет субъект оператору для ОФ. Метафора вопроса-ответа утягивает вас (непроизвольно) в сторону словесных вопросов-ответов.
таким образом, задача субъекта сводится к бинарному поиску правильного ответа.
Вас вводит в заблуждение тренировочная модель ОФ -- "игра в дрессировку". В этой игре субъект (только игрАющий роль животного :) ЗНАЕТ, что идет дрессировка. Для облегчения ее протекания и при наличии знания о факте дрессировки, субъекту проще прибегнуть к определенной стратегии "бинарных проб" -- причем, "бинарность" задается физической/механической природой особенностей движений в пространстве:
--если не двигаться налево, то надо двигаться направо
--если не двигаться вперед, то надо двигаться назад
и т.п.
Но в реальном процессе формирования субъект НЕ знает о факте дрессировки!