arech: (Default)
Тут в коменте к прошлому посту [livejournal.com profile] robomakerr поднял интересную тему о том, что такое "обучение с учителем" и "обучение с подкреплением" и не является ли второе подвидом первого? Я было полез в википедию, чтобы дать ссылки в качестве обоснования, но чуть посмотрев на там написаное понял, что нифига оно там не полезно и не понятно (и что-то ещё и устарело лет на много). Поэтому и чтобы привести в порядок собственные мысли, решил описать вопрос самостоятельно. Текста получилось много, отсюда и родился этот пост. Надеюсь, что кому-то это окажется полезным (ну, мне так было точно полезно это написать и обдумать ещё раз :) )

Поехали.
Если кратко, то "обучение с учителем" и "обучение с подкреплением" это два совершенно различных класса алгоритмов искусственного интеллекта, решающих совершенно разные задачи. Дело в чём.
Read more... )

PS к осилившим опус: пожалуйста, если кому-то это интересно - мяукните, штоль) Мне будет смысл написать что-нить ещё интересное в этом направлении. Если не интересно - тоже мяукните, не держите в себе :)
arech: (Default)


Ребята из DeepMind cделали такую вот интересную штуковину: взяли семь старых игр для Atari и подали картинку с экрана на вход свёрточной нейросети, обучаемой несколько модифицированным алгоритмом Q-Learning. На выходе ждали сигнал, грубо говоря, какую кнопочку на клавиатуре нажимать. А скалярный сигнал {"умер", "выжил", "победил"} использовали для докрутки обучения сети...

"Сначала работало никак.
Через час тренировки - вроде как "понимало, чо надо делать".
Через два - играло лучше, чем любой известный человек.
Через четыре - открыло и стало использовать самую эффективную стратегию игры"

Read more... )

Profile

arech: (Default)
arech

October 2021

S M T W T F S
      12
3456789
10111213141516
17181920212223
24252627282930
31      

Syndicate

RSS Atom

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated May. 2nd, 2026 01:07 pm
Powered by Dreamwidth Studios