[userpic]

Дрессируются через 50 тыс. попыток!

metanymous в Metapractice (оригинал в ЖЖ)

Революция кликера, выпуск 22

Революция кликера
  23. ИИ "Скиннер" 1 metanymous
  22. Дрессируются через 50 тыс. попыток! 41 metanymous
  21. Метод "зеленой ручки" 2 metanymous
  20. Оперантное формирование стимулировало Обучение (N?) 1 metanymous
  19. Режешь скидку — режешь лояльность - режешь клиента 24 metanymous
  18. Кнут, пряник и покер 2 metanymous
  15. Оперантные грехи Карла Роджерса 14 metanymous
  14. "Слоновья выездка" от «Ringling Bros.» 1 metanymous
  13. Pavlov Poke - "Тычок от Павлова" 3 metanymous
  12. Don't shoot the Cat 17 metanymous
  11. «Don't shoot the GAME!» 7 metanymous
  10. Karen Pryor «Don't shoot the dog!» 110 metatheo
  9. Подготовка крыс-саперов 2 metanymous
  8. "собаки для чтения" 2 metanymous
  7. Игры вызывающие зависимость 79 meta_eugzol
  6. ОФ "африканская" выездка 9 metanymous
  5. ОФ подзатыльниками и чем еще похуже 11 metanymous
  4. Обещают доказать: ОФ = ЯКОРЯ 139 metanymous
  3. ОФ всего что шевелится 32 metanymous
  2. Революция кликера 17 metanymous
  Революция кликера 26 metanymous
Оракул metapractice
  46. Оракул metapractice metanymous
Революция кликера
  21. Метод "зеленой ручки" metanymous
apa.org
  http://psycnet.apa.org/psycinfo/1992-32468-001
dogstatus.ru
  http://www.dogstatus.ru/img/upload/articles/301/dsc_0014.jpg
dropboxusercontent.com
  https://dl.dropboxusercontent.com/s/dp1m7ocaetfjwhy/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B41.JPG?dl=0
  https://dl.dropboxusercontent.com/s/23ffe0tjf45so8w/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B42.JPG?dl=0
  https://dl.dropboxusercontent.com/s/whz2c8sdaqg48w3/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B43.JPG?dl=0
  https://dl.dropboxusercontent.com/s/0vxo69ynnrdzn8i/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B44.JPG?dl=0
  https://dl.dropboxusercontent.com/s/d7cjz3uwpb92lfz/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B45.JPG?dl=0
  https://dl.dropboxusercontent.com/s/ebh9kd2a283fxg4/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B46.JPG?dl=0
  https://dl.dropboxusercontent.com/s/bst5unnrnpfi5ap/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B47.JPG?dl=0
  https://dl.dropboxusercontent.com/s/bg4qybtbayg8l8u/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B48.JPG?dl=0
  https://dl.dropboxusercontent.com/s/xlydjoprsj29952/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B49.JPG?dl=0
  https://dl.dropboxusercontent.com/s/u2eqyjk1csci64i/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B410.JPG?dl=0
  https://dl.dropboxusercontent.com/s/s6dnn8pfcrp72bl/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B411.JPG?dl=0
  https://dl.dropboxusercontent.com/s/z77h63lvzrt8be2/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B412.JPG?dl=0
  https://dl.dropboxusercontent.com/s/a4bzi3vje3htep9/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B413.JPG?dl=0
  https://dl.dropboxusercontent.com/s/chyt8umxhy3pi1k/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B414.JPG?dl=0
  https://dl.dropboxusercontent.com/s/w1w2zfudunkxl6w/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B415.JPG?dl=0
  https://dl.dropboxusercontent.com/s/vb5rykzxot48828/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B416.JPG?dl=0
  https://dl.dropboxusercontent.com/s/1cq3fkdw4gn50fr/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B417.JPG?dl=0
  https://dl.dropboxusercontent.com/s/17excaxzttdcqty/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B418.JPG?dl=0
  https://dl.dropboxusercontent.com/s/8i7ku7lm0x3cpzq/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B419.JPG?dl=0
  https://dl.dropboxusercontent.com/s/d2squ7up12qnwlx/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B420.JPG?dl=0
  https://dl.dropboxusercontent.com/s/hhlysyovufo37u5/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B421.JPG?dl=0
  https://dl.dropboxusercontent.com/s/mrjkq4ntum725a2/%D0%A1%D0%BB%D0%B0%D0%B9%D0%B422.JPG?dl=0
geektimes.ru
  https://geektimes.ru/post/271036/
livejournal.com
  http://ailev.livejournal.com/1228496.html
  http://ailev.livejournal.com/1233313.html
  http://incose-ru.livejournal.com/53902.html
pnei-it.com
  http://www.pnei-it.com/1/upload/conditioned_induced_immunosuppression_1975.pdf
transplantation-proceedings.org
  http://www.transplantation-proceedings.org/article/S0041-1345
wikipedia.org
  https://en.wikipedia.org/wiki/Psychoneuroimmunology
Активные темы вне лицевой страницы журнала
  Активные темы вне лицевой страницы журнала metanymous
  Активные темы вне лицевой страницы журнала metanymous
  Активные темы вне лицевой страницы журнала metanymous
  Активные темы вне лицевой страницы журнала metanymous
  Активные темы вне лицевой страницы журнала metanymous
  Активные темы вне лицевой страницы журнала metanymous
Революция кликера
  23. ИИ "Скиннер" metanymous
Оракул metapractice
  46. Оракул metapractice metanymous
    ОФ и иммунитет metanymous
http://metapractice.livejournal.com/490655.html
Оригинал взят у ailev в Роботов теперь не программируют, а дрессируют
Сегодня прочёл почти двухчасовой доклад на тему дрессировки роботов: http://incose-ru.livejournal.com/53902.html (там видео и слайды). На одном из слайдов намеренно привёл "теорию вопроса": книжку Карен Прайор про дрессировку собак. Ибо с роботом сегодня поступают ровно так же: его уже не программируют на выполнение сложных функций, а дают поиграться с окружающим миром, награждая за правильное поведение. Результат -- воспитанный, хорошо выдрессированный робот.

Мы ещё год назад активно обсуждали киберфизические системы, сложности их программирования, сложность представления модели окружающего мира в таких системах. А выяснилось, что роботов учат ездить на велосипеде ровно так же, как медведей: не запихивая в их убогие мозги разнообразные дифуры, а методом кнута и пряника. Медведь не знает дифуров, но едет. Робот тоже не знает дифуров, но после некоторой практики с кнутом и пряником тоже едет. Много рефлексов, мало реконструкции сложной модели окружающего мира на формальном онтологическом или ещё каком языке.
Например, как научить робота двухпальцевым захватом правильно брать игрушки неправильной формы? Как научить его определять место "оптимального захвата" для игрушек произвольной формы -- от водяных пистолетиков до мячиков, от ёлочек до кукол? Программировать такое слишком долго и трудно. Но можно заставить робота хватать уж как придётся, и поощрять за каждую не выскользнувшую из захвата игрушку. Через примерно 50тыс. попыток (сегодняшние роботы тупы, они медленно учатся) наслаждаться тем, что игрушки прекратили выскальзывать! Конечно, это 700 часов дрессировки. Но это не 700 часов труда программиста (и ещё непонятно, сможет ли программист решить такую задачу. Я вот не уверен, что сможет. Точнее, уверен, что не сможет -- ни за 700 часов, ни за 7тыс. часов).
Забавно, что visuomotor learning (зрительно-двигательное обучение) приходится сегодня для инженеров специально переводить. Ибо слово visuomotor было из языка нейрофизиологов, не робототехников. А сейчас статей про visuomotor learning для роботов -- толстый ручеёк. А вслед за статьями текут инвесторские деньги. Посмотрите слайды, там про всё это достаточное количество ссылок. И послушайте видео, я там "на пальцах" всё это разъясняю. Бонус-трек для специалистов -- пятнадцать минут дискуссии в конце заседания про перспективы симбиоза распределённых и символьных представлений.
Вот тут я ещё немного про дрессировку роботов писал (как про это пишет Karphathy): http://ailev.livejournal.com/1228496.html -- только там научно-фантастический рассказ, а тут у меня примеры из реальной жизни.

40 комментариев

сначала старые сначала новые