arech | "The start of Skynet" (c)

Ребята из DeepMind cделали такую вот интересную штуковину: взяли семь старых игр для Atari и подали картинку с экрана на вход свёрточной нейросети, обучаемой несколько модифицированным алгоритмом Q-Learning. На выходе ждали сигнал, грубо говоря, какую кнопочку на клавиатуре нажимать. А скалярный сигнал {"умер", "выжил", "победил"} использовали для докрутки обучения сети...

"Сначала работало никак.
Через час тренировки - вроде как "понимало, чо надо делать".
Через два - играло лучше, чем любой известный человек.
Через четыре - открыло и стало использовать самую эффективную стратегию игры"

В сумме, по 6 играм подход продемонстрировал результаты, превосходящие все известные подходы до этого, а по 3 играм были побиты лучшие экспертные игроки.

Короче, посоны, я чо думаю...
1. берём данные с маркета как пространство состояний, {"buy","hold","sell"} как пространство действий, значение сделки как reward и повторяем подход.
2. тренируем на истории
3. выставляем торговать.
???
5. PROFIT!!!

Кто в команде? :-D

Flat | Top-Level Comments Only

From:

robomakerr.livejournal.com

Мой опыт, кратко:
1) нейросети - механизм, давно трейдерам известный, многократно перетертый и можно сказать, отработанный :)
2) чтобы они могли находить системы, нужно: а) правильно определить, что есть "входные данные", б) правильно определить критерий успеха
3) НС это уже "тяжелая артиллерия", можно легко обойтись и без них; я лично за пару часов "тупого перебора параметров" нашел две системы, и это мне просто лень было ковыряться дальше; главное хоть примерно понимать, какие именно параметры значимы
4) просто найти системы - недостаточно, нужно еще понимать почему они работают, иначе могут внезапно "сломаться"
5) вследствие п.4), искать системы можно и без всякого датамайнинга; есть версия, что это даже проще :)

From:

arech

Спасибо за ответ.
У меня примерно такие же наблюдения, разве что за исключением того, что у меня нет понимания рынка, соответственно, п.5 не сбыточен :(

Но тут ведь вот какое дело. Вероятно, все примеры использования НС и в более широком смысле алгоритмов ИИ, о которых вы писали, представляют собой примеры классов т.н. "обучения с учителем" / supervised learning, когда модель имеет
а) некое априорное знание о предметной области
б) имеет маркированный набор тренировочных данных "вход->правильный выход", на основании которого учится обобщать и находить правильный выход для невиденного ранее входа.
В лучшем случае, там могут использоваться некоторые элементы т.н. "обучения без учителя" / unsupervised learning, когда модель учится находить некую структуру в неразмеченных данных (кластеризация, feature learning и некоторые другие задачи).

В описанной же работе вся соль в использовании третьего класса алгоритмов ИИ - т.н. "обучение с подкреплением" / reinforcement learning. Эти алгоритмы не содержат вообще никакого априорного знания о предметной области и работая с неразмеченными данными, учатся принимать правильные решения на основании отклика внешней среды на их прошлые действия (через так называемую награду / reward). Это самые трудные, сложные и плохо проработанные алгоритмы ИИ, но самые многообещающие, т.к. наиболее полно "эмулируют" поведение и обучение живого существа.
В описанной работе входом модели была только картинка с экрана и ничего больше вообще. Никакого знания о предметной области (особенностях и правилах игр и т.д.) в системе не было; не было у неё доступа и к внутреннему состоянию работающих программ. Она буквально видела только значения яркостей пикселей матрицы экрана и всё! И вот только из одной картинки система "поняла" что делать и "научилась" весьма оптимальным (а иногда и самым оптимальным) стратегиям поведения. Вот это всё безумно круто, потому что повторяет в общем случае самый мощный и универсальный алгоритм обучения из всех известных - жизнь.

Если пофантазировать, то переложение подобных алгоритмов на трейдинг (после решения ряда специфических задач, таких как существенная ограниченность тренировочных данных) может создать чрезвычайно эффективные самообучающиеся торговые системы, которые сначала съедят всех людишек, а потом начнут грызть друг друга :) Если указанные специфические задачи будут успешно решены, то скорее всего именно маркет станет первым в истории массовым местом / профессией, откуда ИИ выбьет человека)

From:

robomakerr.livejournal.com

Почему "несбыточен", вы же читаете Пратрейдера и А.Уткина, этого полностью достаточно, чтоб понять, куда двигаться :)

Я согласен, что это безумно круто, и сам немного опасаюсь, что какие-нибудь гугловские профессора машин-лёрнинга могут свести рынок к шуму, если возьмутся за него правильным образом )))
Но если стоит цель "заработать", а не "сделать крутую штуку", то это несомненный overhead. Мизерная порция априорных знаний сокращает объем работы в миллиарды раз :)
И к тому же, дает понимание, когда систему следует остановить.

Насчет "обучения с подкреплением" согласен, что это интересный и мощный механизм, но всё же это частный случай обучения с учителем, поощрение всё-таки присутствует, пусть и в другой форме?

From:

arech

> Почему "несбыточен", вы же читаете Пратрейдера и А.Уткина, этого полностью достаточно, чтоб понять, куда двигаться :)

Ну вот пока видимо всё же чего-то не хватает)

Насчёт overhead - согласен, конечно.

> Насчет "обучения с подкреплением" согласен, что это интересный и мощный механизм, но всё же это частный случай обучения с учителем, поощрение всё-таки присутствует, пусть и в другой форме?

Не-не, это две совершенно принципиально разные вещи, не сводимые впрямую одна к другой. Я тут было стал отвечать на этот вопрос и незаметно для себя накатал текста на отдельный пост))) http://zmeygor.livejournal.com/79948.html

From:

iskra-di.livejournal.com

Эллиот уже все нарисовал? тут ни учитель не нужен, ни обучение. сиди, следуй математической предопределенности

From:

arech

Если б всё было так просто, то всеб давно дрались за покупки собственных островов в окиянах.

Все (с очень хорошей точностью) методы торговли, широко растиражированные в публике, не работают и нужны лишь только для пополнения количества нового мяса на рынке.

From:

iskra-di.livejournal.com

ну я вообще считаю все это поле трейдинга гэмблингом чистой воды, поэтому мне не жалко тех, кому не удается там заработать. но что-то у меня есть ощущение, что если действовать по плану и по правилам - там все работает. стоп-лоссы ставить себе и выполнять их, не отвлекаясь на личное прогнозирование и интерпретацию - и будет доход. все, кто из моих занимался полноценно и вел список шагов и потом его сравнивал с реальностью - говорили, что все работает, просто эмоции перешкаливали и они сами не выполняли свои планы меняя их "в зависимости от среды". на этом и горели. возможно ограниченная выборка, конечно, но в моей картине мира все сходится.

From:

arech

Это похоже на гэмблинг. Вход в лонг по сути это ставка на повышение курса, шорт - понижение. Правда, тут, "говорят", существуют стратегии с существенно положительным матожиданием. Чем, собственно это дело и отличается кардинально от гэмблинга, где матожидание всегда сдвинуто в пользу казино.

Что касается вашей выборки - так ведь так все говорят, что дескать "ну ещё! ну вот-вот! яж её почти!...". Это ещё у Фёдора нашего Михалыча в романе "Игрок" хорошо описано (опять параллели с гэмблингом). Но стабильно в течение долгого времени зарабатывают лишь единицы не процентов - промилле. Но ведь зарабатывают же, гады! Поэтому всё немного не так, как кажется, всё ещё хитрее))

From:

iskra-di.livejournal.com

мне кажется вся хитрость в дисциплине. там все и валятся. собственно, как в казино. у самого казино есть дисциплина и план действия. у игроков не совсем. именно в consistency следования плану. с деньгами остается тот, кто уважает математику и статистику поперек эмоций и трактовки событий.

я слышала, что вроде эллиотчики там уже сделали программу, которая все рисует. но врядли она все сама покупает и продает. но я не настолько в теме, я просто сочувствующая))

From:

arech

> мне кажется вся хитрость в дисциплине.

Не хочу спорить, но 100% не в этом ;)

> у самого казино есть дисциплина и план действия....

;) У самого казино в первую очередь есть матожидание, сдвинутое в его пользу (зеро в рулетке, комиссии в играх и т.д. - всё это любую игру с нулевой суммой превращают в очень прибыльное для организатора дело). На эти полпроцента и живут... Всё остальное - детали заманивания и вытряхивания клиента.

> эллиотчики там уже сделали программу

Знаете, вот все без исключения люди, про которых у меня есть хоть какое-то основание думать, что они реально делают какие-то деньги на рынке, - все они без исключения творения эллиота и прочих "гуру" иначе как ахинеей не называют. Но даже без них, у меня всегда были основания считать аналогично, ибо так говорит простая сермяжная логика. Смотрите: рынок - тоже игра с нулевой суммой (stay away from zero sum games! ^)). В таких играх для того, чтобы кто-то выиграл, кто-то обязательно должен проиграть. Далее, смотрите, условия входов по широкорастрезвоненным граалям всем известны. Это значит, что при формировании некоторых описанных рыночных ситуаций неинформированная толпа будет готова вставать в позы в убеждении об определённом дальнейшем движении рынка. А что вы можете сделать, если у вас достаточно денег и вы знаете, что вот сейчас на рынке мелочёвка покупает мелкие позы с довольно короткими стопами? Вы будете продавать им актив, а т.к. денег/актива у вас больше, вы крупнее, то вы продавите цену вниз и свозите мясо на стопы, выкупив по меньшей цене всё, что продали им ранее. А потом ещё дадите задание своему аналитическому отделу выпустить "информационный биллютень", чётко объясняющий почему всё так произошло, что "уровни не до конца сформировались и аллигатор ганна ещё не до конца сделал что-то там с задницей эллиота" (с) и уж в следующий-то раз всё будет по другому!
Если вы сочувствующая, то могу предложить ради интереса посмотреть вот например этот пост

anatoly_utkin, где приведён "немного" более реалистичный пример торговой системы ;)

From:

robomakerr.livejournal.com

Сегодня на хабре написали про них. И там в комментах интересная идея: запустить два таких бота друг против друга. Пускай прокачиваются до ~~бесконечности~~ исчерпания ресурсов. Скайнет на подходе, посоны =)

From:

arech

А ссылка есть? А то там сделали очередной идиотский редизайн и теперь вообще не понятно, как увидеть ленту публикаций. Там только топы, но пролистав до 5й страницы я так ничего и нашёл...

Идея - да, есть такое. Кажется, так даже делают иногда и вполне успешно...

From:

robomakerr.livejournal.com

Пост: http://geektimes.ru/post/246444/

Ленты (чтобы они стали доступны, нужно залогиниться):
http://habrahabr.ru/feed/all/
http://geektimes.ru/all/

From:

arech

Спасибо.

Акка нет, слежу обычно через рсс-читалку, так шта, выходит, они таких как я оставили без ленты.

Flat | Top-Level Comments Only

Profile

arech

October 2021

S	M	T	W	T	F	S
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Page Summary

Style Credit

Style: Neutral Good for Practicality by timeasmymeasure

Expand Cut Tags

No cut tags

Page generated Jan. 8th, 2026 04:16 pm

Своя колея

"The start of Skynet" (c) - ну, почти.

"The start of Skynet" (c) - ну, почти.

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

Profile

October 2021

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags