"The start of Skynet" (c) - ну, почти.
Nov. 3rd, 2014 09:45 pmРебята из DeepMind cделали такую вот интересную штуковину: взяли семь старых игр для Atari и подали картинку с экрана на вход свёрточной нейросети, обучаемой несколько модифицированным алгоритмом Q-Learning. На выходе ждали сигнал, грубо говоря, какую кнопочку на клавиатуре нажимать. А скалярный сигнал {"умер", "выжил", "победил"} использовали для докрутки обучения сети...
"Сначала работало никак.
Через час тренировки - вроде как "понимало, чо надо делать".
Через два - играло лучше, чем любой известный человек.
Через четыре - открыло и стало использовать самую эффективную стратегию игры"
( Read more... )
