хорошо нейронная сеть реагировала бы следующим образом.1. она научалась, что есть некий желатеьный исход для каждого из шагов2. научалось понимать, что некий блок оконченно 2 не значит, что оно как-то связано с 1 (по заданным условиям) это просто некоторое деление. если по 1 задания лесенкой увеличивают сложность, а по 2 сложность очередного шага будет чуть падать, то 2 будет связан с тем, что следующий шаг будет проще. но по данным условиям 2 никак не определяет подкрепление цепочки шагов 1.
хорошо, некие реальные люди отреагировали таким образом, а теперь представьте то подкрепление, которе мы обсуждаем. вопрос в том , что мы конкретно подкрепляем.