arech | "The start of Skynet" (c)

Ребята из DeepMind cделали такую вот интересную штуковину: взяли семь старых игр для Atari и подали картинку с экрана на вход свёрточной нейросети, обучаемой несколько модифицированным алгоритмом Q-Learning. На выходе ждали сигнал, грубо говоря, какую кнопочку на клавиатуре нажимать. А скалярный сигнал {"умер", "выжил", "победил"} использовали для докрутки обучения сети...

"Сначала работало никак.
Через час тренировки - вроде как "понимало, чо надо делать".
Через два - играло лучше, чем любой известный человек.
Через четыре - открыло и стало использовать самую эффективную стратегию игры"

В сумме, по 6 играм подход продемонстрировал результаты, превосходящие все известные подходы до этого, а по 3 играм были побиты лучшие экспертные игроки.

Короче, посоны, я чо думаю...
1. берём данные с маркета как пространство состояний, {"buy","hold","sell"} как пространство действий, значение сделки как reward и повторяем подход.
2. тренируем на истории
3. выставляем торговать.
???
5. PROFIT!!!

Кто в команде? :-D

Flat | Top-Level Comments Only

From:

arech

> мне кажется вся хитрость в дисциплине.

Не хочу спорить, но 100% не в этом ;)

> у самого казино есть дисциплина и план действия....

;) У самого казино в первую очередь есть матожидание, сдвинутое в его пользу (зеро в рулетке, комиссии в играх и т.д. - всё это любую игру с нулевой суммой превращают в очень прибыльное для организатора дело). На эти полпроцента и живут... Всё остальное - детали заманивания и вытряхивания клиента.

> эллиотчики там уже сделали программу

Знаете, вот все без исключения люди, про которых у меня есть хоть какое-то основание думать, что они реально делают какие-то деньги на рынке, - все они без исключения творения эллиота и прочих "гуру" иначе как ахинеей не называют. Но даже без них, у меня всегда были основания считать аналогично, ибо так говорит простая сермяжная логика. Смотрите: рынок - тоже игра с нулевой суммой (stay away from zero sum games! ^)). В таких играх для того, чтобы кто-то выиграл, кто-то обязательно должен проиграть. Далее, смотрите, условия входов по широкорастрезвоненным граалям всем известны. Это значит, что при формировании некоторых описанных рыночных ситуаций неинформированная толпа будет готова вставать в позы в убеждении об определённом дальнейшем движении рынка. А что вы можете сделать, если у вас достаточно денег и вы знаете, что вот сейчас на рынке мелочёвка покупает мелкие позы с довольно короткими стопами? Вы будете продавать им актив, а т.к. денег/актива у вас больше, вы крупнее, то вы продавите цену вниз и свозите мясо на стопы, выкупив по меньшей цене всё, что продали им ранее. А потом ещё дадите задание своему аналитическому отделу выпустить "информационный биллютень", чётко объясняющий почему всё так произошло, что "уровни не до конца сформировались и аллигатор ганна ещё не до конца сделал что-то там с задницей эллиота" (с) и уж в следующий-то раз всё будет по другому!
Если вы сочувствующая, то могу предложить ради интереса посмотреть вот например этот пост

anatoly_utkin, где приведён "немного" более реалистичный пример торговой системы ;)

S	M	T	W	T	F	S
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Своя колея

"The start of Skynet" (c) - ну, почти.

"The start of Skynet" (c) - ну, почти.

no subject

Profile

October 2021

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags