arech: (Default)
[personal profile] arech


Ребята из DeepMind cделали такую вот интересную штуковину: взяли семь старых игр для Atari и подали картинку с экрана на вход свёрточной нейросети, обучаемой несколько модифицированным алгоритмом Q-Learning. На выходе ждали сигнал, грубо говоря, какую кнопочку на клавиатуре нажимать. А скалярный сигнал {"умер", "выжил", "победил"} использовали для докрутки обучения сети...

"Сначала работало никак.
Через час тренировки - вроде как "понимало, чо надо делать".
Через два - играло лучше, чем любой известный человек.
Через четыре - открыло и стало использовать самую эффективную стратегию игры"

В сумме, по 6 играм подход продемонстрировал результаты, превосходящие все известные подходы до этого, а по 3 играм были побиты лучшие экспертные игроки.

Короче, посоны, я чо думаю...
1. берём данные с маркета как пространство состояний, {"buy","hold","sell"} как пространство действий, значение сделки как reward и повторяем подход.
2. тренируем на истории
3. выставляем торговать.
???
5. PROFIT!!!

Кто в команде? :-D

Date: 2014-11-03 09:14 pm (UTC)
From: [identity profile] robomakerr.livejournal.com
Мой опыт, кратко:
1) нейросети - механизм, давно трейдерам известный, многократно перетертый и можно сказать, отработанный :)
2) чтобы они могли находить системы, нужно: а) правильно определить, что есть "входные данные", б) правильно определить критерий успеха
3) НС это уже "тяжелая артиллерия", можно легко обойтись и без них; я лично за пару часов "тупого перебора параметров" нашел две системы, и это мне просто лень было ковыряться дальше; главное хоть примерно понимать, какие именно параметры значимы
4) просто найти системы - недостаточно, нужно еще понимать почему они работают, иначе могут внезапно "сломаться"
5) вследствие п.4), искать системы можно и без всякого датамайнинга; есть версия, что это даже проще :)

Date: 2014-11-04 10:36 am (UTC)
From: [identity profile] robomakerr.livejournal.com
Почему "несбыточен", вы же читаете Пратрейдера и А.Уткина, этого полностью достаточно, чтоб понять, куда двигаться :)

Я согласен, что это безумно круто, и сам немного опасаюсь, что какие-нибудь гугловские профессора машин-лёрнинга могут свести рынок к шуму, если возьмутся за него правильным образом )))
Но если стоит цель "заработать", а не "сделать крутую штуку", то это несомненный overhead. Мизерная порция априорных знаний сокращает объем работы в миллиарды раз :)
И к тому же, дает понимание, когда систему следует остановить.

Насчет "обучения с подкреплением" согласен, что это интересный и мощный механизм, но всё же это частный случай обучения с учителем, поощрение всё-таки присутствует, пусть и в другой форме?

Date: 2014-11-04 08:30 pm (UTC)
From: [identity profile] iskra-di.livejournal.com
Эллиот уже все нарисовал? тут ни учитель не нужен, ни обучение. сиди, следуй математической предопределенности

Date: 2014-11-04 09:26 pm (UTC)
From: [identity profile] iskra-di.livejournal.com
ну я вообще считаю все это поле трейдинга гэмблингом чистой воды, поэтому мне не жалко тех, кому не удается там заработать. но что-то у меня есть ощущение, что если действовать по плану и по правилам - там все работает. стоп-лоссы ставить себе и выполнять их, не отвлекаясь на личное прогнозирование и интерпретацию - и будет доход. все, кто из моих занимался полноценно и вел список шагов и потом его сравнивал с реальностью - говорили, что все работает, просто эмоции перешкаливали и они сами не выполняли свои планы меняя их "в зависимости от среды". на этом и горели. возможно ограниченная выборка, конечно, но в моей картине мира все сходится.

Date: 2014-11-04 09:56 pm (UTC)
From: [identity profile] iskra-di.livejournal.com
мне кажется вся хитрость в дисциплине. там все и валятся. собственно, как в казино. у самого казино есть дисциплина и план действия. у игроков не совсем. именно в consistency следования плану. с деньгами остается тот, кто уважает математику и статистику поперек эмоций и трактовки событий.

я слышала, что вроде эллиотчики там уже сделали программу, которая все рисует. но врядли она все сама покупает и продает. но я не настолько в теме, я просто сочувствующая))

Date: 2015-02-26 03:08 pm (UTC)
From: [identity profile] robomakerr.livejournal.com
Сегодня на хабре написали про них. И там в комментах интересная идея: запустить два таких бота друг против друга. Пускай прокачиваются до бесконечности исчерпания ресурсов. Скайнет на подходе, посоны =)

Date: 2015-02-26 08:00 pm (UTC)
From: [identity profile] robomakerr.livejournal.com
Пост: http://geektimes.ru/post/246444/

Ленты (чтобы они стали доступны, нужно залогиниться):
http://habrahabr.ru/feed/all/
http://geektimes.ru/all/

Profile

arech: (Default)
arech

October 2021

S M T W T F S
      12
3456789
10111213141516
17181920212223
24252627282930
31      

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 8th, 2026 04:16 pm
Powered by Dreamwidth Studios