Пластичность волатильности:Корреляция разностей — различия между версиями

Материал из synset
Перейти к: навигация, поиск
(Выделение гладкой нестационарности)
Строка 44: Строка 44:
 
Как для окончательного прояснения ситуации с <math>\textstyle \rho_1(\delta v)</math>, так и для целей дальнейших исследований нам необходима методология выделения гладкой нестационарной составляющей волатильности.
 
Как для окончательного прояснения ситуации с <math>\textstyle \rho_1(\delta v)</math>, так и для целей дальнейших исследований нам необходима методология выделения гладкой нестационарной составляющей волатильности.
  
==Выделение гладкой нестационарности==
 
 
Для выделения медленно меняющейся составляющей во временном ряду <math>\textstyle x_k=x(t_k)</math> мы будем использовать фильтр Ходрика-Прескотта (далее HP-фильтр). Гладкая составляющая <math>\textstyle s_k</math> ряда находится в результате минимизации квадратов её отклонений от эмпирических данных <math>\textstyle x_k</math>, одновременно с требованием минимальности кривизны <math>\textstyle s_k</math>:
 
 
{| width="100%"
 
| width="90%" align="center"|<math> \sum^n_{k=1} ( x_k-s_k)^2 + \lambda \cdot \sum^{n-1}_{k=2} (\nabla^2 s_k)^2 = min, </math>
 
| <div width="10%" align="right" style="color:#0000CC">'''(EQN)'''</div>
 
|}
 
 
где вторая производная в разностях равна <math>\textstyle \nabla^2 s_k=(s_{k+1}-s_k)-(s_{k}-s_{k-1})</math>. Степень гладкости <math>\textstyle s_k</math> будет тем выше, чем больше параметр <math>\textstyle \lambda</math>. Значения <math>\textstyle \lambda</math> варьируются в очень широком диапазоне, поэтому мы будем приводить его десятичный логарифм <math>\textstyle \nu</math>, представляя <math>\textstyle \lambda = 10^\nu</math>.
 
 
При сглаживании сильно зашумлённых данных всегда присутствует произвол в выборе параметра <math>\textstyle \lambda</math>. Если <math>\textstyle \lambda</math> мал, существует опасность обнаружить нестационарность там, где её нет. При слабом сглаживании гладкая составляющая будет повторять любые локальные флуктуации, не имеющие к нестационарности ни какого отношения. С другой стороны, при сильном сглаживании мы рискуем упустить важные детали интересующей нас динамики.
 
 
Поэтому нам необходим некоторый статистический критерий степени сглаживания для уменьшения возможного произвола. Как обычно, будем в качестве эталона использовать модель случайного блуждания.
 
 
Среднее значение логарифмической доходности равно относительному изменению цены внутри временного лага <math>\textstyle r_t=\ln C_t/O_t</math>. Волатильность будем восстанавливать по сглаженному среднему модифицированной амплитуды размаха цены внутри лага <math>\textstyle \sigma(t)=\overline{(a-|r|/2)}\cdot\sqrt{2\pi}/3</math>. Говоря о волатильности, всегда подразумеваем волатильность лага (минутную, часовую, дневную и т.д.).
 
 
Если число дискретных блужданий цены внутри лага достаточно велико, то, независимо от их распределения, логарифмические доходности <math>\textstyle r_t</math> будут нескоррелированными ''гауссовыми'' случайными числами. Сгладим их среднее значение <math>\textstyle \bar{r}(t)</math> при помощи HP-фильтра с различными параметрами <math>\textstyle \lambda</math> и вычислим типичную величину <math>\textstyle Err\bigl[\bar{r}(t)\bigr]</math> колебаний <math>\textstyle \bar{r}(t)</math> вокруг среднего <math>\textstyle \bar{r}</math> по всем эмпирическим точкам:
 
 
{| width="100%"
 
| width="90%" align="center"|<math> Err\bigl[\bar{r}(t)\bigr]= \sqrt{\left\langle (\bar{r}(t)-\bar{r})^2\right\rangle }. </math>
 
| <div width="10%" align="right" style="color:#0000CC">'''(EQN)'''</div>
 
|}
 
 
Аналогично определяется ошибка вычисления сглаженной волатильности лага. Численные эксперименты показывают, что эти ошибки, с хорошей степенью точности, убывают с ростом параметра <math>\textstyle \lambda</math> следующим образом:
 
 
{| width="100%"
 
| width="90%" align="center"|<math> Err\bigl[\bar{r}(t)\bigr] \approx \frac{0.50\;\sigma}{\lambda^{1/8}},\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; Err\bigl[\sigma(t)\bigr] \approx \frac{0.15\;\sigma}{\lambda^{1/8}}, </math>
 
| <div width="10%" align="right" style="color:#0000CC">'''(EQN)'''</div>
 
|}
 
 
и практически не зависят от числа эмпирических точек <math>\textstyle n</math>. Более того, ошибки не зависят и от типа распределения (в случае дискретной модели лагового блуждания). Малая степень 1/8 объясняет причину необходимости использования широкого диапазона для изменения параметра <math>\textstyle \lambda</math>.
 
 
Соотношения () задают типичный коридор колебаний сглаженных величин <math>\textstyle \bar{r}(t)</math> и <math>\textstyle \sigma(t)</math>, которые являются флуктуациями и статистически не значимы ''в случае постоянства'' волатильности. Поэтому они будут нашими ориентирами, по крайней мере, на горизонтальных участках <math>\textstyle \sigma(t)</math>.
 
 
Приведём типичный пример численного моделирования (<math>\textstyle \sigma=1</math>, <math>\textstyle n=1000</math>) для трёх значений <math>\textstyle \lambda</math> (<math>\textstyle \nu=\log_{10}\lambda</math>): \includegraphics{pic/hp_err_av.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: Сглаженное среднее гауссового шума} Более жирная линия соответствует <math>\textstyle \lambda=1000000</math> (<math>\textstyle \nu=6</math>), а тонкая - <math>\textstyle \lambda=1000</math> (<math>\textstyle \nu=3</math>). Сплошные горизонтальные "уровни значимости" определяют двойную ошибку <math>\textstyle \pm 2 Err[\bar{r}(t)]</math> в случае <math>\textstyle \nu=6</math>, а пунктирные - для <math>\textstyle \nu=3</math> и <math>\textstyle \nu=9</math>. В отличие от уровней значимости корреляционных коэффициентов, мы имеем гладкую величину <math>\textstyle \bar{r}(t)</math>, которая может некоторое время "жить" вне заданного ошибкой диапазона. Тем не менее, соотношения () характеризуют значение типичных колебаний сглаженной величины для случайных данных.
 
 
Однако в ситуации нестационарности, которая нас, собственно, и интересует, необходимо выдерживать баланс между гладкостью и отсутствием излишнего сглаживания. Так, если <math>\textstyle \sigma(t)=1+0.5\cdot \sin (2\pi t/T)</math>, где <math>\textstyle T</math> - общая длительность эксперимента, получаем следующие варианты сглаживания волатильности, оцененной по модифицированной амплитуде размаха: \includegraphics{pic/hp_err_av_si_sin.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: Сглаженная волатильность блуждания с <math>\textstyle \sigma(t)=1+0.5\cdot \sin (2\pi t/T)</math>} В данном случае оптимальным значением была <math>\textstyle \nu=6</math>, так как <math>\textstyle \nu=3</math> испытывает шумящие колебания вокруг истинной волатильности, а <math>\textstyle \nu=9</math> - фактически не "ловит" синусоиду. Однако ситуация сильно ухудшается, если волатильность испытывает скачок. Так, пусть половину из <math>\textstyle n=1000</math> "торговых дней" волатильность была <math>\textstyle \sigma=1\%</math>, а вторую половину <math>\textstyle \sigma=2\%</math>. Тогда сглаживания с различными <math>\textstyle \lambda</math> дают такие результаты: \includegraphics{pic/hp_err_av_si_step.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: Сглаженная волатильность блуждания <math>\textstyle \sigma(t)</math> ступеньки} Видно, что в этом случае <math>\textstyle \nu=6</math> существенно размывает ступеньку. Сглаживание с <math>\textstyle \nu=3</math> размывает скачок волатильности существенно меньше, но зато даёт шумящие и незначимые колебания при постоянстве <math>\textstyle \sigma</math>.
 
  
 
=== Примчания ===
 
=== Примчания ===

Версия 18:52, 27 февраля 2010

Нестационарная статистика << Оглавление >> Выделение гладкой нестационарности

Простейший способ устранения относительно гладких нестационарностей во временных рядах - это переход к разностям величин. Если испытывает локально постоянный снос, то это будет приводить к появлению автокорреляций. Разность двух последовательных величин подобный снос устраняет. Даже, если тренд данных медленно изменяет своё направление, то в рамках восходящих и нисходящих участков значения разностей меняются незначительно и становятся локально квазистационарными.

Рассмотрим изменение модифицированной амплитуды размаха цены:

(EQN)

В качестве данных возьмём ежедневную статистику по фондовому индексу S\&P500 за период 1990-2008 (4791 торговый день) и курса EURUSD (1999-2008, 2495 дня, исключая праздники). Построим сначала автокорреляционные коэффициенты амплитуд ежедневного размаха цены : \includegraphics{pic/sp_delta.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: S\&P500 и EURUSD коррелограммы амплитуд размаха цены} Как обычно, коэффициенты достаточно высокие, однако автокорреляции для индекса S\&P500 более значительны, чем для курса EURUSD, и имеют меньшие колебания.

Перейдём теперь к разностям амплитуд двух соседних дней. Их автокорреляция тут же резко падает: \includegraphics{pic/sp_delta2.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: S\&P500 и EURUSD коррелограммы после перехода к разностям} Отличия разительны. Второй автокорреляционный коэффициент в случае индекса S\&P500 падает в 24 раза, со значения 0.618 до величины 0.026. Для курса EURUSD снижение составляет 17 раз - с 0.449 до 0.027

Пунктирные линии на всех рисунках означают двойную стандартную ошибку, равную для индекса S\&P500 и для EURUSD.

Наглядно исчезновение корреляционной зависимости можно продемонстрировать на точечных диаграммах связи последовательных значений и .

Ниже на точечных диаграммах явно видны "корреляции" между индекса S\&P500 и их отсутствие для : \includegraphics{pic/sp_base_delta.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: Точечные диаграммы для S\&P500 до и после перехода к разностям} На рисунке слева точки заполняют область с характерной формой веника, тогда как справа мы имеем симметричное облако с нулевой корреляцией. Похожие результаты обнуления автокорреляционных коэффициентов получаются также для модулей логарифмической доходности , и других финансовых инструментов.

Заметим, правда, что для разностей существует высокая отрицательная автокорреляция со сдвигом в один день . В примере выше она равна -0.49 для S\&P500 и -0.53 для EURUSD. Однако её происхождение связано не со стохастической динамикой волатильности, а с эффектом перекрытия. Поясним это на следующем примере. Предположим, что справедлива простейшая модель:

(EQN)

где , а - независимые стационарные положительные случайные числа, возникающие по причине ошибок конечности выборки по которой измеряется волатильность. В этом случае изменения имеют нулевое среднее . Первый автоковариационный коэффициент равен:

(EQN)

где - дисперсия случайных величин . Среднее квадрата возникает в слагаемом , которое и ответственно за эффект перекрытия. Аналогичным образом получается дисперсия разности . Поэтому первый автокорреляционный коэффициент в точности равен , что и наблюдается выше. Корреляции со сдвигами будут нулевыми, так как перекрытия уже не возникает.

Тот факт, что для автокорреляций разностей с хорошей степенью точности выполняются соотношения и при свидетельствует в пользу модели (). Однако, если бы параметр был константой, то не возникало бы корреляций между последовательными значениями волатильности (в силу независимости ). Она может возникать, как мы показали выше, в результате плавного изменения величины со временем. Таким образом, фактически , и является гладкой функцией времени.

Как для окончательного прояснения ситуации с , так и для целей дальнейших исследований нам необходима методология выделения гладкой нестационарной составляющей волатильности.


Примчания


Нестационарная статистика << Оглавление >> Выделение гладкой нестационарности