"The start of Skynet" (c) - ну, почти.
Nov. 3rd, 2014 09:45 pmРебята из DeepMind cделали такую вот интересную штуковину: взяли семь старых игр для Atari и подали картинку с экрана на вход свёрточной нейросети, обучаемой несколько модифицированным алгоритмом Q-Learning. На выходе ждали сигнал, грубо говоря, какую кнопочку на клавиатуре нажимать. А скалярный сигнал {"умер", "выжил", "победил"} использовали для докрутки обучения сети...
"Сначала работало никак.
Через час тренировки - вроде как "понимало, чо надо делать".
Через два - играло лучше, чем любой известный человек.
Через четыре - открыло и стало использовать самую эффективную стратегию игры"
В сумме, по 6 играм подход продемонстрировал результаты, превосходящие все известные подходы до этого, а по 3 играм были побиты лучшие экспертные игроки.
Короче, посоны, я чо думаю...
1. берём данные с маркета как пространство состояний, {"buy","hold","sell"} как пространство действий, значение сделки как reward и повторяем подход.
2. тренируем на истории
3. выставляем торговать.
???
5. PROFIT!!!
Кто в команде? :-D
no subject
Date: 2014-11-04 10:41 pm (UTC)Не хочу спорить, но 100% не в этом ;)
> у самого казино есть дисциплина и план действия....
;) У самого казино в первую очередь есть матожидание, сдвинутое в его пользу (зеро в рулетке, комиссии в играх и т.д. - всё это любую игру с нулевой суммой превращают в очень прибыльное для организатора дело). На эти полпроцента и живут... Всё остальное - детали заманивания и вытряхивания клиента.
> эллиотчики там уже сделали программу
Знаете, вот все без исключения люди, про которых у меня есть хоть какое-то основание думать, что они реально делают какие-то деньги на рынке, - все они без исключения творения эллиота и прочих "гуру" иначе как ахинеей не называют. Но даже без них, у меня всегда были основания считать аналогично, ибо так говорит простая сермяжная логика. Смотрите: рынок - тоже игра с нулевой суммой (stay away from zero sum games! ^)). В таких играх для того, чтобы кто-то выиграл, кто-то обязательно должен проиграть. Далее, смотрите, условия входов по широкорастрезвоненным граалям всем известны. Это значит, что при формировании некоторых описанных рыночных ситуаций неинформированная толпа будет готова вставать в позы в убеждении об определённом дальнейшем движении рынка. А что вы можете сделать, если у вас достаточно денег и вы знаете, что вот сейчас на рынке мелочёвка покупает мелкие позы с довольно короткими стопами? Вы будете продавать им актив, а т.к. денег/актива у вас больше, вы крупнее, то вы продавите цену вниз и свозите мясо на стопы, выкупив по меньшей цене всё, что продали им ранее. А потом ещё дадите задание своему аналитическому отделу выпустить "информационный биллютень", чётко объясняющий почему всё так произошло, что "уровни не до конца сформировались и аллигатор ганна ещё не до конца сделал что-то там с задницей эллиота" (с) и уж в следующий-то раз всё будет по другому!
Если вы сочувствующая, то могу предложить ради интереса посмотреть вот например этот пост