Страницы: 1
Ответить

Нейронные сети <<архив>>

 
<b>Нейронные сети

alex2003 </b> протуберанец пишет:
цитата
--------------------------------------------------------------------------------
Почему бы не поделитться- расскажите уж..
--------------------------------------------------------------------------------
Как бы это так сделать чтоб не "грузить" вас математикой...
И так верчу свои нараьотки и этак, всё равно много математики.
Или "грузануть" вас всех математикой всё-таки?
<b>
germes </b> to CC-20
Валютами пока не торгую, как уже писала - только акции, хочу добавить фьючерсы на индексы.
<b>
germes </b> to alex2003
Меня грузите, я с удовольствием и интересом, думаю, что и протуберанец не откажется.
<b>
alex2003 </b> По поводу нейронных сетей...
цитата
--------------------------------------------------------------------------------
Правый мозг любит сладкое больше, чем левый. ... И где же тут парадокс? - спросил я, стараясь как можно незаметнее оттолкнуть левую руку, которая опять совала мне пряник в рот.
С.Лем, Мир на Земле
--------------------------------------------------------------------------------
Зайдем из далека. Где применяются нейросети? Так как нас наиболее интересует именно то, чем мы занимаемся, то я назову лишь маленькое подмножество приложений, а именно:предсказание рынков, автоматический дилинг, оценка риска невозврата кредитов, предсказание банкротств, оценка стоимости недвижимости, выявление пере- и недооцененных компаний, автоматическое рейтингование, оптимизация портфелей, оптимизация товарных и денежных потоков, автоматическое считывание чеков и форм, безопасность транзакций по пластиковым карточкам.
Они могут обучаться как с учитилем, когда мы знаем заранее желаемый результат...
цитата
--------------------------------------------------------------------------------
... постарайся, насколько можешь отвечать о чем я буду спрашивать тебя. И, если я по рассмотрении твоего ответа найду в нем нечто призрачное и неистинное, незаметно выну это и отброшу...
Платон, Теэтет
--------------------------------------------------------------------------------
Где-то таким же образом работают и нейронные сети с учитилем, если не вдаваться в подробности...
... так и без учителя, фактически обобщая входные данные...
цитата
--------------------------------------------------------------------------------
... а мудрость его все возрастала, причиняя ему страдание полнотой своей.
Ф.Ницше, Так говорил Заратустра
--------------------------------------------------------------------------------
Сети могут обладать ассоциативной памятью (запись и воспроизведение), выделять прототипы и даже предсказывать новые классы данных, но основе существующих. Это делают рекурентные сети...
цитата
--------------------------------------------------------------------------------
Самое худшее случилось - сказал сэр Дональд Акер, когда в Массачусетском Технологическом Институте соединили входы с выходами
С.Лем, Не буду прислуживать
--------------------------------------------------------------------------------
... они прекрасно справляются с комбинаторной оптимизацией, пытаются решать (довольно успешно) NP-полные задачи, например, задачу коммивояжера...
цитата
--------------------------------------------------------------------------------
В Смеральдине, городе на воде, сеть каналов накладывается и пересекается с сетью улиц. Чтобы добраться от одного места к другому, всегда можно выбрать между сухопутной дорогой и лодкой, но поскольку в Смеральдине самый короткий путь пролегает не по прямой линии, а по зигзагообразной, ....
Итало Кальвино. Незримые города
--------------------------------------------------------------------------------
... говорят, они могут даже прогнозировать временные ряды, да ещё и финансовые, да еще и с поразительной точьностью...
цитата
--------------------------------------------------------------------------------
И будущаго, конечно, не знаютъ ни Ангелы Божiи, ни демоны; однако, они предсказываютъ.
Св. Иоанн Дамаскин, Точное изложение православной веры
Я реагирую на события на рынке, как животное реагирует на то, что происходит в джунглях.
Д.Сорос, Алхимия финансов
--------------------------------------------------------------------------------
Вот о последнем я и хотел бы с вами поговорить, если вы не возражаете...
<b>
alex2003 </b> Поддерживая ваш "поразительный" интерес к данной теме, я, с вашего позволения, продолжу своё повествование и если кто-то попытается упрекнуть меня в отсутствии математики - не волнуйтесь, она скоро появится...
Можно ли предсказывать рынок?
Это важнейшее свойство рыночных временных рядов легло в основу теории "эффективного" рынка, изложенной в диссертации Луи де Башелье (L.Bachelier) в 1900 г. Согласно этой доктрине, инвестор может надеяться лишь на среднюю доходность рынка, оцениваемую с помощью индексов, таких как Dow Jones или S&P500 для Нью-Йоркской биржи. Всякий же спекулятивный доход носит случайный характер и подобен азартной игре на деньги. В основе непредсказуемости рыночных кривых лежит та же причина, по которой деньги редко валяются на земле в людных местах: слишком много желающих их поднять.
Теория эффективного рынка не разделяется, вполне естественно, самими участниками рынка (которые как раз и заняты поиском "упавших" денег). Большинство из них уверено, что рыночные временные ряды, несмотря на кажущуюся стохастичность, полны скрытых закономерностей, т.е в принципе хотя бы частично предсказуемы. Такие скрытые эмпирические закономерности пытался выявить в 30-х годах в серии своих статей основатель технического анализа Эллиот (R.Elliott).
В 80-х годах неожиданную поддержку эта точка зрения нашла в незадолго до этого появившейся теории динамического хаоса. Эта теория построена на противопоставлении хаотичности и стохастичности (случайности). Хаотические ряды только выглядят случайными, но, как детерминированный динамический процесс, вполне допускают краткосрочное прогнозирование. Область возможных предсказаний ограничена по времени горизонтом прогнозирования, но этого может оказаться достаточно для получения реального дохода от предсказаний (Chorafas, 1994). И тот, кто обладает лучшими математическими методами извлечения закономерностей из зашумленных хаотических рядов, может надеяться на большую норму прибыли - за счет своих менее оснащенных собратьев.
Согласно доктрине дяди Элдера, для предсказания рыночных кривых необходимо освободиться от власти толпы, стать выше и умнее ее. Для этого предлагается выработать систему игры, апробированную на прошлом поведении временного ряда и четко следовать этой системе, не поддаваясь влиянию эмоций и циркулирующих вокруг данного рынка слухов. Иными словами, предсказания должны быть основаны на алгоритме, т.е. их можно и даже должно перепоручить компьютеру (LeBeau, 1992). За человеком остается лишь создание этого алгоритма, для чего в его распоряжении имеются многочисленные программные продукты, облегчающие разработку и дальнейшее сопровождение компьютерных стратегий на базе инструментария технического анализа.
Следуя этой логике, почему бы не использовать компьютер и на этапе разработки стратегии, причем не в качестве ассистента, рассчитывающего известные рыночные индикаторы и тестирующего заданные стратегии, а для извлечения оптимальных индикаторов и нахождения оптимальных стратегий по найденным индикаторам. Такой подход - с привлечением технологии нейронных сетей - завоевывает с начала 90-х годов все больше приверженцев (Beltratti, 1995, Бэстенс, 1997), т.к. обладает рядом неоспоримых достоинств.
Во-первых, нейросетевой анализ, в отличие от технического, не предполагает никаких ограничений на характер входной информации. Это могут быть как индикаторы данного временного ряда, так и сведения о поведении других рыночных инструментов. Недаром нейросети активно используют именно институциональные инвесторы (например, крупные пенсионные фонды), работающие с большими портфелями, для которых особенно важны корреляции между различными рынками.
Во-вторых, в отличие от теханализа, основанного на общих рекомендациях, нейросети способны находить оптимальные для данного инструмента индикаторы и строить по ним оптимальную опять же для данного ряда стратегию предсказания. Более того, эти стратегии могут быть адаптивны, меняясь вместе с рынком, что особенно важно для молодых активно развивающихся рынков.
Нейросетевое моделирование в чистом виде базируется лишь на данных, не привлекая никаких априорных соображений. В этом его сила и одновременно - его ахиллесова пята. Имеющихся данных может не хватить для обучения, размерность потенциальных входов может оказаться слишком велика. Далее будет показано как для преодолеть эти типичные в области финансовых предсказаний трудности воспользовавшись опытом, накопленным техническим анализом.
Для начала обрисуем общую схему нейросетевого предсказания временных рядов:
1. Погружение -› 2. Выделение признаков -› 3. Обучение нейроиндикаторов -› 4. Адаптивное предсказание и принятие решений.
Далее будут более детально описаны этапы этой технологической цепочки. Хотя общие принципы нейро-моделирования применимы к данной задаче в полном объеме, предсказание финансовых временных рядов имеет свою специфику. Именно эти отличительные черты и будут в большей мере затронуты далее.
Продолжать?
Или я впустую трачу своё и ваше время?
<b>
OSCo </b> alex2003 пишет:
цитата
--------------------------------------------------------------------------------
Продолжать?
--------------------------------------------------------------------------------
Ну... теперь уж извольте
<b>
germes </b> Форум трейдеров превращается в форум философов...???!!!
<b>
germes </b>
цитата
--------------------------------------------------------------------------------
Мрак был вначале сокрыт мраком. Все это было неразличимою пучиною... Был ли низ тогда? И был ли верх? Были плодотворители. Силы роста были. Порыв внизу. Удовлетворение наверху. Кто воистину знает? Кто возвестит это? Отчего родилось, откуда происходит это творение?
Гимн Ригведы
--------------------------------------------------------------------------------
цитата
--------------------------------------------------------------------------------
...спонтанная согласованность структур - более приемлемый механизм эволюции, нежели медленные перемены по теории Дарвина. ...
Временной ряд будет только тогда случаен, когда он является следствием большого количества равновероятных событий. ...
Традиционная техника моделирования не может управиться со сложностью реального мира в таких ситуациях, как упомянутые выше.
Э.Петерс. Хаос и порядок на рынках капитала.
--------------------------------------------------------------------------------
Продолжайте, конечно.
<b>
alex2003 </b> germes пишет:
цитата
--------------------------------------------------------------------------------
Форум трейдеров превращается в форум философов...???!!!
--------------------------------------------------------------------------------
А вы что, ненавидите философию? Хотя, если внипательно прочитать мой пост, можно понять, что высказывания людей, которых я цитировал, я привел как некую метафору к моим словам.
<b>
alex2003 </b> OSCo пишет:
цитата
--------------------------------------------------------------------------------
Ну... теперь уж извольте
--------------------------------------------------------------------------------
Изволяю...
Предупреждение: наглядность материала может быть потеряна из-за того, что у меня нет прав приводить формулы в виде картинок.
Метод погружения. Теорема Такенса
Начнем с этапа погружения. Как мы сейчас убедимся, несмотря на то, что предсказания, казалось бы, являются экстраполяцией данных, нейросети, на самом деле, решают задачу интерполяции, что существенно повышает надежность решения. Предсказание временного ряда сводится к типовой задаче нейроанализа - аппроксимации функции многих переменных по заданному набору примеров - с помощью процедуры погружения ряда в многомерное пространство (Weigend, 1994). Например, d-мерное лаговое пространство ряда Xt состоит из d значений ряда в последовательные моменты времени: Xt-d=(Xt-1,...,Xt-d).
Для динамических систем доказана следующая теорема Такенса. Если временной ряд порождается динамической системой, т.е. значения Xt есть произвольная функция состояния такой системы, существует такая глубина погружения d (примерно равная эффективному числу степеней свободы данной динамической системы), которая обеспечивает однозначное предсказание следующего значения временного ряда (Sauer, 1991). Таким образом, выбрав достаточно большое d можно гарантировать однозначную зависимость будущего значения ряда от его d предыдущих значений: Xt=f(Xt-d), т.е. предсказание временного ряда сводится к задаче интерполяции функции многих переменных. Нейросеть далее можно использовать для восстановления этой неизвестной функции по набору примеров, заданных историей данного временного ряда.
Напротив, для случайного ряда знание прошлого ничего не дает для предсказания будущего. Поэтому, согласно теории эффективного рынка, разброс предсказываемых значений ряда на следующем шаге при погружении в лаговое пространство не изменится.
Отличае хаотической динамики от стохастической (случайной), проявляющееся в процессе погружения, иллюстрировал бы рисунок, но его нет (по причинческим технинам (с)Масяня)
<b>
СССС </b> germes пишет:
цитата
--------------------------------------------------------------------------------
мнение участников форума про механические системы
--------------------------------------------------------------------------------
Считаю - это не работает. Причина в том, что меняется характер рынка, и система перестает работать. Такие вещи часто видны при изменении направления глобальной тенденции. Или при изменении характера движения болтанка-тенденция. Вот так. И в волны я тоже не верю.
<b>
alex2003 </b> Эмпирические свидетельства предсказуемости финансовых рядов
Метод погружения позволяет количественно измерить предсказуемость реальных финансовых инструментов, т.е. проверить или опровергнуть гипотезу эффективности рынка. Согласно последней, разброс точек по всем координатам лагового пространства одинаков (если они - одинаково распределенные независимые случайные величины). Напротив, хаотическая динамика, обеспечивающая определенную предсказуемость, должна приводить к тому, что наблюдения будут группироваться вблизи некоторой гиперповерхности Xt=f(Xt-d), т.е. экспериментальная выборка формирует некоторое множество размерности меньшей, чем размерность всего лагового пространства.
Для измерения размерности можно воспользоваться следующим интуитивно понятным свойством: если множество имеет размерность D, то при разбиении его на все более мелкие покрытия кубиками со стороной Є (имеется ввиду буковка епсилон) число таких кубиков растет как Є^-D (епсилон в степени - D). На этом факте основывается определение размерности множеств методом box-counting. Размерность множества точек определяется по скорости возрастания числа ячеек (boxes), содержащих все точки множества. Для ускорения алгоритма размеры Є берут кратными 2, т.е. масштаб разрешения измеряется в битах.
В качестве примера типичного рыночного временного ряда возьмем такой известный финансовый инструмент, как S&P 500 (привет Иванову Максиму )
Что б было немало, возьмем его статистику за 679 месяцев (таймфрейм 1 месяц).
Размерность (информационная) приращений этого ряда, подсчитанная методом box-counting вы могли бы увидить на рисунке, но опять не увидите...
Как следует из последнего рисунка, в 15-мерном пространстве погружения экспериментальные точки формируют множество размерности примерно 4. Это значительно меньше, чем 15, что мы получили бы исходя из гипотезы эффективного рынка, считающей ряд приращений независимыми случайными величинами.
Таким образом, эмпирические данные убедительно свидетельствуют о наличии некоторой предсказуемой составляющей в финансовых временных рядах, хотя здесь и нельзя говорить о полностью детерминированной хаотической динамике . Значит попытки применения нейросетевого анализа для предсказания рынков имеют под собой веские основания.
Заметим, однако, что теоретическая предсказуемость вовсе не гарантирует достижимость практически значимого уровня предсказаний. Количественную оценку предсказуемости конкретных рядов дает измерение кросс-энтропии, также возможное с помощью методики box-counting. Для примера приведем измерения предсказуемости приращений индекса S&P500 в зависимости от глубины погружения. Кросс-энтропия I(Xt,Xt-d)=H(Xt)-H(Xt¦Xt-d) измеряет дополнительную информацию о следующем значении ряда, обеспеченную знанием прошлых значений этого ряда. И опять нет рисунка...
Ну вот, погрузились... Далее по плану "Формирование входного пространства признаков", может быть...
<b>
alex2003 </b> Пару примеров для размышлений.
Jav любезно предоставил мне 15 мин. котировки microsoft, так вот вот результаты "первого приближения" нейроанализа:
Мы хотим предсказывать цену закрытия через 15 мин.
Определяем размерность d. d=6. Следовательно, для предсказания цены необходимо знать 6 предыдущих цен закрытия.
1 вариант.
Точность предсказания: +- 0.5875
Всего примеров: 1277
Правильно: 1271 (99.53015%)
Неправильно: 6 (0.4698512%)
Ср. ошибка: 0.1368566
Макс. ошибка (на неправильных примерах): 0.761202
2 вариант.
Точность предсказания: +- 0.3875
Всего примеров: 1277
Правильно: 1239 (97.02428%)
Неправильно: 38 (2.975724%)
Ср. ошибка: 0.1197461
Макс. ошибка: 1.00975
Комментарии? Замечания? Пожелания? Вопросы?
<b>
OSCo </b> alex2003 пишет:
цитата
--------------------------------------------------------------------------------
Комментарии? Замечания? Пожелания? Вопросы?
--------------------------------------------------------------------------------
И что Вы здесь делаете с таким "философским камнем"?
<b>
alex2003 </b> OSCo пишет:
цитата
--------------------------------------------------------------------------------
И что Вы здесь делаете с таким "философским камнем"?
--------------------------------------------------------------------------------
1. Я никогда не работал со стоками.
2. На форексе мой булыжник не так хорошо работает.
3. Вникните пожалуйста в суть примера: Интервалы 15 мин., а средняя ошибка - 0.13.
Пример "предсказания" сейчас цена 26.46, сеть говорит, что через 15 мин. цена будет 26.4614, а на самом деле она оказывается 26.42, ошибка -0.04142
или сейчас 26.55, прогноз 26.5171, а на самом деле 26.46
сильно вы поторгуете с такими прогнозами?
Не всё так просто, как выглядит
<b>
OSCo </b> alex2003 пишет:
цитата
--------------------------------------------------------------------------------
нейросетевой анализ... не предполагает никаких ограничений на характер входной информации.
--------------------------------------------------------------------------------
Попробуйте, наверное, добавить характеристик..
<b>
OSCo </b> OSCo пишет:
цитата
--------------------------------------------------------------------------------
Попробуйте, наверное, добавить характеристик..
--------------------------------------------------------------------------------
Например: такая-то акция никогда не котировалась выше такой-то. Но я в стоках ничего не понимаю, рассматриваю, как отвлеченную задачу.
<b>
alex2003 </b> Формирование входного пространства признаков
Почти очевидно, что увеличение ширины окна погружения ряда приводит в конце концов к понижению предсказуемости - когда повышение размерности входов уже не компенсируется увеличением их информативности. В этом случае, когда размерность лагового пространства d слишком велика для данного количества примеров, приходится применять специальные методики формирования пространства признаков с меньшей размерностью. Способы выбора признаков и/или увеличения числа доступных примеров, специфичные для финансовых временных рядов будут описаны ниже.
Выбор функционала ошибки
Для обучения нейросети недостаточно сформировать обучающие наборы входов-выходов. Необходимо также определить ошибку предсказаний сети. Среднеквадратичная ошибка, используемая по умолчанию в большинстве нейросетевых приложений, не имеет большого "финансового смысла" для рыночных рядов. Поэтому в далее будут рассмотрены специфичные для финансовых временных рядов функции ошибки и будет показана их связь с возможной нормой прибыли.
Например, для выбора рыночной позиции надежное определение знака изменения курса более важно, чем понижение среднеквадратичного отклонения. Хотя эти показатели и связаны между собой, сети оптимизированные по одному из них будут давать худшие предсказания другого.
Выбор адекватной функции ошибки, должен опираться на некую идеальную стратегию и диктоваться, например, максимизацией прибыли (или минимизацией возможных убытков).
Обучение нейросетей
Основная специфика предсказания временных рядов лежит в области предобработки данных. Процедура обучения отдельных нейросетей стандартна. Как всегда, имеющиеся примеры разбиваются на три выборки: обучающая, валидационная и тестовая. Первая используется для обучения, вторая - для выбора оптимальной архитектуры сети и/или для выбора момента остановки обучения. Наконец, третья, которая вообще не использовалась в обучении, служит для контроля качества прогноза обученной нейросети.
Однако, для сильно зашумленных финансовых рядов существенный выигрыш в надежности предсказаний способно дать использование комитетов сетей.
В литературе имеются свидетельства улучшения качества предсказаний за счет использования нейросетей с обратными связями. Такие сети могут обладать локальной памятью, сохраняющей информацию о более далеком прошлом, чем то, что в явном виде присутствует во входах. Рассмотрение таких архитектур, однако, увело бы нас слишком далеко от основной темы, тем более, что существуют альтернативные способы эффективного расширения "горизонта" сети, за счет специальных способов погружения ряда, рассмотренных ниже.
<b>
alex2003 </b> А теперь подробнее...
Формирование пространства признаков
Ключевым для повышения качества предсказаний является эффективное кодирование входной информации. Это особенно важно для труднопредсказуемых финансовых временных рядов. Имеются, однако, и специфичные именно для финансовых временных рядов способы предобработки данных, о которых далее.
Начнем с того, что в качестве входов и выходов нейросети не следует выбирать сами значения котировок, которые мы обозначим Ct. Действительно значимыми для предсказаний являются изменения котировок. Поскольку эти изменения, как правило, гораздо меньше по амплитуде, чем сами котировки, между последовательными значениями курсов имеется большая корреляция - наиболее вероятное значение курса в следующий момент равно его предыдущему значению:
‹Ct+1›=Ct+‹deltaCt›=Ct. Между тем, как это уже неоднократно подчеркивалось, для повышения качества обучения следует стремиться к статистической независимости входов, то есть к отсутствию подобных корреляций.
Поэтому в качестве входных переменных логично выбирать наиболее статистически независимые величины, например, изменения котировок deltaCt или логарифм относительного приращения log(Ct/Ct-1)~deltaCt/Ct-1. Последний выбор хорош для длительных временных рядов, когда уже заметно влияние инфляции. В этом случае простые разности в разных частях ряда будут иметь различную амплитуду, т.к. фактически измеряются в различных единицах. Напротив, отношения последовательных котировок не зависят от единиц измерения, и будут одного масштаба несмотря на инфляционное изменение единиц измерения. В итоге, большая стационарность ряда позволит использовать для обучения большую историю и обеспечит лучшее обучение.
Отрицательной чертой погружения в лаговое пространство является ограниченный "кругозор" сети. Технический анализ же, напротив, не фиксирует окно в прошлом, и пользуется подчас весьма далекими значениями ряда. Например, утверждается, что максимальные и минимальные значения ряда даже в относительно далеком прошлом оказывают достаточно сильное воздействие на психологию игроков, и, следовательно, должны быть значимы для предсказания. Недостаточно широкое окно погружения в лаговое пространство не способно предоставить такую информацию, что, естественно, снижает эффективность предсказания. С другой стороны, расширение окна до таких значений, когда захватываются далекие экстремальные значения ряда, повышает размерность сети, что в свою очередь приводит к понижению точности нейросетевого предсказания - уже из-за разрастания размера сети.
Выходом из этой, казалось бы, тупиковой ситуации являются альтернативные способы кодирования прошлого поведения ряда. Интуитивно понятно, что чем дальше в прошлое уходит история ряда, тем меньше деталей его поведения влияет на результат предсказаний. Это обосновано психологией субъективного восприятия прошлого участниками торгов, которые, собственно, и формируют будущее. Следовательно, надо найти такое представление динамики ряда, которое имело бы избирательную точность: чем дальше в прошлое - тем меньше деталей, при сохранении общего вида кривой. Весьма перспективным инструментом здесь может оказаться т.н. вейвлетное разложение (wavelet decomposition). Оно эквивалентно по информативности лаговому погружению, но легче допускает такое сжатие информации, которое описывает прошлое с избирательной точностью.
Понижение размерности входов: признаки
Подобного рода сжатие информации является примером извлечения из непомерно большого числа входных переменных наиболее значимых для предсказания признаков. Способы систематического извлечения признаков - отдельная тема для разговоров.
Важно только, чтобы способ представления входной информации по возможности облегчал процесс извлечения признаков. Вейвлетное представление являет собой пример удачного, с точки зрения извлечения признаков, кодирования (Kaiser, 1995). Например, на следующем рисунке (который вы не увидите) изображен отрезок из 50 значений ряда вместе с его реконструкцией по 10 специальным образом отобранным вейвлет-коэффициентов. Несмотря на то, что для этого потребовалось в пять раз меньше даных, непосредственное прошлое ряда восстановлено точно, а более далекое - лишь в общих чертах, хотя максимумы и минимумы отражены верно. Следовательно, можно с приемлемой точностью описывать 50-мерное окно всего лишь 10-мерным входным вектором.
Еще один возможный подход - использование в качестве возможных кандидатов в пространство признаков различного рода индикаторов технического анализа, которые автоматически подсчитываются в соответствующих программных пакетах. Многочисленность этих эмпирических признаков (Colby, 1988) затрудняет пользование ими, тогда как каждый из них может оказаться полезным в применении к данному ряду. Выбор наиболее значимой комбинации технических индикаторов, которую и следует затем использовать в качестве входов нейросети, сам по себе представляет собой достаточно нетривиальную задачу.
Измерение качества предсказаний
Хотя предсказание финансовых рядов и сводится к задаче аппроксимации многомерной функции, оно имеет свои особенности как при формировании входов, так и при выборе выходов нейросети. Первый аспект, касающийся входов, мы уже обсудили. Теперь коснемся особенностей выбора выходных переменных. Но прежде ответим на главный вопрос: как измерить качество финансовых предсказаний. Это поможет определить наилучшую стратегию обучения нейросети.
Связь предсказуемости с нормой прибыли
Особенностью предсказния финансовых временных рядов является стремление к получению максимальной прибыли, а не минимизации среднеквадратичного отклонения, как это принято в случае аппроксимации функций.
В простейшем случае ежедневной торговли прибыль зависит от верно угаданого знака изменения котировки. Поэтому нейросеть нужно ориентировать именно на точность угадывания знака, а не самого значения. Найдем как связана норма прибыли с точностью определения знака в простейшей постановке ежедневного вхождения в рынок (тут опять мог бы быть рисунок).
Обозначим на момент t: полный капитал игрока Kt, относительное изменение котировки xt=deltaCt/Ct, а в качестве выхода сети возьмем степень ее уверенности в знаке этого изменения yt є Такая сеть с выходной нелинейностью вида y=tanh(a) обучается предсказывать знак изменения и выдает прогноз знака с амплитудой пропорциональной его вероятности. Тогда возрастание капитала на шаге t запишется в виде:
Kt=Kt-1* (формула конечно получилась... но надеюсь поймете)
где delta - доля капитала "в игре". Выигрыш за все время игры:
Kt=K0*exp(summa_po_k_ot_1_do_t(ln)
нам и предстоит максимизировать, выбрав оптимальный размер ставок delta. Пусть в среднем игрок угадывает долю p=(1/2)+epsilon знаков и, соответственно, ошибается с вероятностью q=(1/2)-epsilon. Тогда логарифм нормы прибыли,
‹ln(Kt/K0)›=t‹p*ln(1+¦x¦*delta)+q*ln(1-¦x¦*delta)›
а следовательно и сама прибыль, будет максимальной при значении delta=(p-q)*‹¦x¦›/‹x^2› и составит в среднем:
‹ln(Kt/K0)›~(t*(p-q)^2)*((‹¦x¦›^2)/(2*‹x^2›))=2*a* t*epsilon^2
Здесь введен коэффициент a=(‹¦x¦›^2)/‹x^2›‹=1. Например, для Гауссова распределения a~0.8. Степень предсказуемости знака напрямую связана с кросс-энтропией, которую можно оценить a priory методом box-counting. Для бинарного выхода:
I=Hmax-H(p)=1+p*log(p)+q*log(q)=1+/ln (2)~(2*epsilon^2)/ln(2)
В итоге получаем следующую оценку нормы прибыли при заданной величине предсказуемости знака:
Kt=K0*2^(a*I*t)
То есть, для ряда с предсказуемостью I в принципе возможно удвоить капитал за t=1/(a*I) вхождений в рынок. Так, например, измеренная выше предсказуемость временного ряда S&P500, равная I=0.17 предполагает удвоение капитала в среднем за t=1/(0.8-0.17)~8 вхождений в рынок. Таким образом, даже небольшая предсказуемость знака изменения котировок способна обеспечить весьма заметную норму прибыли.
Подчеркнем, что оптимальная норма прибыли требует достаточно аккуратной игры, когда при каждом вхождении в рынок игрок рискует строго определенной долей капитала (мани мэнэджмент, однако ):
‹deltaK›/K=delta*‹¦x¦›=(p-q)*(‹¦x¦›^2)/‹x^2›=2*a*e psilon~1.6*epsilon
где deltaK - типичная при данной волатильности рынка ‹¦x¦› величина выигрыша или проигрыша. Как меньшие, так и большие значения ставок уменьшают прибыль. Причем, чересчур рискованная игра может привести к проигрышу при любой предсказательной способности. (тут опять не помешал бы рисунок).Поэтому приведенные выше оценки дают представление лишь о верхнем пределе нормы прибыли. Более тщательный анализ с учетом влияния флуктуаций, выходит за рамки этого изложения. Качественно понятно, однако, что выбор оптимального размера контрактов требует оценки точности предсказаний на каждом шаге.
<b>
alex2003 </b> Выбор функционала ошибки
Если принять, что целью предсказаний финансовых временных рядов является максимизация прибыли, логично настраивать нейросеть именно на этот конечный результат. Например, при игре по описанной выше схеме для обучения нейросети можно выбрать следующую функцию ошибки обучения, усредненную по всем примерам из обучающей выборки:
E=-‹ln(1+xt*deltat*sgn(yt)]›
Здесь доля капитала в игре введена в качестве дополнительного выхода сети, настраиваемого в процессе обучения. При таком подходе, первый нейрон, yt с функцией активации f=tanh(...) даст вероятность возрастания или убывания курса, в то время как второй выход сети deltat даст рекомендованную долю капитала в игре на данном шаге.
Поскольку, однако, в соответствии с предыдущим анализом, эта доля должна быть пропорциональна степени уверености предсказания, можно заменить два выхода сети - одним, положив deltat=delta*¦yt¦, и ограничиться оптимизацией всего одного глобального параметра минимизирующего ошибку:
E=-‹lnalex2003@forkom.com.ua
<b>
SS-20 </b> April пишет:
цитата
--------------------------------------------------------------------------------
Ребята, отклонились от темы. "Ближе к телу" пожалуйста.
--------------------------------------------------------------------------------
Согласен. Только если Вы думаете, что трейдер должен быть похож на Кролика из сказки про Винни Пуха, то я против (ИМХО)
НП, СС-20.
<b>
SS-20 </b> alex2003 пишет:
цитата
--------------------------------------------------------------------------------
Мы пытаемся сформировать рабочую группу с целью исследований и создания практических методик эфективной работы на финансовых рынках. Предполагается исспользование передовых технологий и многого другого.
--------------------------------------------------------------------------------
А обычные и простые методики приносящие реальные деньги рассматриваются? Или более точно, что Вам важнее процесс или результат?
НП, СС-20.
<b>
Asus </b> Для alex2003: Не-е-е-е-е, ребята, это не правильно. ИМХО. Бред какой-то. Каждый же трейдер индивидуальность. И в ЛЮБУЮ программу или проект эту индивидуальность не заложишь. И возникает вопрос "На кой черт мне создавать рабочую группу, если я индивидуальность?".
А результаты и стратегии можно и на форуме обсуждать.
Чем-то этот постинг пахнет....не пойму чем только.........
<b>
OSCo </b> Asus пишет:
цитата
--------------------------------------------------------------------------------
Чем-то этот постинг пахнет....не пойму чем только.........
--------------------------------------------------------------------------------
Обязательно поймете, хотя сомнительно, что не поняли
<b>
alex2003 </b> SS-20 пишет:
цитата
--------------------------------------------------------------------------------
Вам важнее процесс или результат?
--------------------------------------------------------------------------------
Конечно же результат. Единственное что хотелось бы от процесса - это то, чтобы он был интересен и чтобы его учасники действительно осознавали себе командой. Я думаю это очень важно.
<b>
April </b> Кстати образ кролика сам по себе не плох. Он может пролезть в любую дырку. Читай спред, тренд, слипэдж and so on. Вини в этом плане не канает. А на счет идеи-супер! По мере сил смогу чем помогу. Почему бы и нет? Поучимся друг у друга. И польза будет. Я надеюсь
<b>
germes </b> to all, написавшим в этой ветке
Представьте себе американский рынок акций в течение дня...
10 top pct gainers за сегодня 27.10.2003:
AVSR 44% NAVI 43.4% CKCM 40.7% EGAN 40% MKTG 38% LCOR 29.6% UAIR 29% NETC 24.4% MS 24.4% FBF 23.3%
Акция CKCM за два дня прыгнула с 2.25$ до 5.19$, NAVI - за сегодня с 3.60 сходила один раз до 5.30, потом ее зашортили до 4.29, потом подняли опять до 5.30, вчера close был 3.50, MKTG за неделю поднялась с 1.70 до 8.06 (сегодняшний high), при этом в прошлую пятницу с 1.70 до 6.50 за один день, потом шорт в течение недели до 4.50, и сегодня опять вверх.
Все это происходит каждый день среди 10 000 акций, торгующихся на американском рынке, добавьте сюда еще торгующиеся фонды, опционы, single futures, то есть всего инструментов до 15 000, и все они колбасятся каждый день, триллионными и биллионными деньгами. На эти активные движения действует огромное количество факторов, начиная с новостей, аналитических прогнозов, изменения рейтингов, политических всплесков активности, воен, нефтерешений, % ставок, выступлений директоров FED, Гринспена, Буша, аналитиков Мерил Линч etc., программной торговли, покупки крупных пакетов институционалами, раскрутки бумаг маркет-мейкерами, выпусков IPO и корпоративных бондов, корреляции отраслевых индексов, перелив денег из европейских рынков в американские или наоборот в течение суток, перелив из акций в бонды или золото, просто настроения рынка, эффект "января", "октября" и "дней недели", пересечение индексами 200-дневной МА, достижение саппортов и резистенсов, и наконец, просто спекуляции и пр. пр. пр. Это вам не неск.пар валют с MACD, MA и стохастиками, но и доходность соответствующая.
Вопрос: как среди всего этого найти те самые CKCM, NAVI, MKTG в нужное время и по наилучшей цене. Просчитайте доходность за день, за два дня, за неделю по приведенным примерам от лонгов и шортов, предполагая использование плеча 1:3.
Не говорю уже про более сложные стратегии с использованием фьючерсов, опционов.
Современные рынки - это самые последние технологии.
Еще один пример. Есть хедж-фонд, показвший за прошедший год доходность более 3000%. Фонд этот был создан таким образом: собрались вместе несколько аналитиков, математиков и программистов, и разработали кучу стратегий с учетом вышеперечисленных мною факторов для разных фаз и состояний рынка. Писались эти стратегии, конечно же, не на Трейдстейшн и Метасток - программах для домохозяек. Соответственно, кому нужны нейросети, Fuzzy Logic и Data Mining...
<b>
germes </b> to alex2003
Есть в Киеве такая компания "ИНЭКС", которая разрабатывала на базе нечеткой логики программы для прогнозирования валютных курсов, для принятия решений на финансовых рынках. Вы, случайно, не имеете к ней отношения?
<b>
SS-20 </b> germes пишет:
цитата
--------------------------------------------------------------------------------
Это вам не неск.пар валют с MACD, MA и стохастиками, но и доходность соответствующая.
--------------------------------------------------------------------------------
И что Вы все так упираете на слово НЕСКОЛЬКО. Этих пар сотни, ну наверно по количеству стран как минимум, а если с учетом кроссов... Вопрос в том кто Вам прокотирует монгольские тугрики со 100% ликвидностью. Я не считаю себя специалистом по стокам, хотя ессно имею о них достаточное представление и при случае могу сделать умное лицо. И Ваш обширный пост напомнил мне регулярно повторяемый в последнее время сюжет EuroNews типа "а теперь новости с финансовых рынков коротко" ну и там NYSE и одни и те же физиономии брокеров в спинжаках. Вопрос: а они что все это
germes пишет:
цитата
--------------------------------------------------------------------------------
Все это происходит каждый день среди 10 000 акций, торгующихся на американском рынке, добавьте сюда еще торгующиеся фонды, опционы, single futures, то есть всего инструментов до 15 000, и все они колбасятся каждый день, триллионными и биллионными деньгами. На эти активные движения действует огромное количество факторов, начиная с новостей, аналитических прогнозов, изменения рейтингов, политических всплесков активности, воен, нефтер
Страницы: 1
Ответить
Читают тему (гостей: 1)

Вход