arech | Entries tagged with reinforcement learning

robomakerr поднял интересную тему о том, что такое "обучение с учителем" и "обучение с подкреплением" и не является ли второе подвидом первого? Я было полез в википедию, чтобы дать ссылки в качестве обоснования, но чуть посмотрев на там написаное понял, что нифига оно там не полезно и не понятно (и что-то ещё и устарело лет на много). Поэтому и чтобы привести в порядок собственные мысли, решил описать вопрос самостоятельно. Текста получилось много, отсюда и родился этот пост. Надеюсь, что кому-то это окажется полезным (ну, мне так было точно полезно это написать и обдумать ещё раз :) )

Поехали.
Если кратко, то "обучение с учителем" и "обучение с подкреплением" это два совершенно различных класса алгоритмов искусственного интеллекта, решающих совершенно разные задачи. Дело в чём.
( Read more... )

PS к осилившим опус: пожалуйста, если кому-то это интересно - мяукните, штоль) Мне будет смысл написать что-нить ещё интересное в этом направлении. Если не интересно - тоже мяукните, не держите в себе :)

Ребята из DeepMind cделали такую вот интересную штуковину: взяли семь старых игр для Atari и подали картинку с экрана на вход свёрточной нейросети, обучаемой несколько модифицированным алгоритмом Q-Learning. На выходе ждали сигнал, грубо говоря, какую кнопочку на клавиатуре нажимать. А скалярный сигнал {"умер", "выжил", "победил"} использовали для докрутки обучения сети...

"Сначала работало никак.
Через час тренировки - вроде как "понимало, чо надо делать".
Через два - играло лучше, чем любой известный человек.
Через четыре - открыло и стало использовать самую эффективную стратегию игры"

( Read more... )

S	M	T	W	T	F	S
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Своя колея

Entries tagged with reinforcement learning

"Обучение с учителем" против "Обучения с подкреплением"

"The start of Skynet" (c) - ну, почти.

Profile

October 2021

Syndicate

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags