Пластичность волатильности:Корреляция разностей — различия между версиями

Материал из synset
Перейти к: навигация, поиск
 
(не показаны 3 промежуточные версии этого же участника)
Строка 11: Строка 11:
 
{| width="100%"  
 
{| width="100%"  
 
  | width="90%" align="center"|<math> \delta v_t=v_t-v_{t-1}. </math>
 
  | width="90%" align="center"|<math> \delta v_t=v_t-v_{t-1}. </math>
  | <div width="10%" align="right" style="color:#0000CC">'''(EQN)'''</div>
+
  | <div width="10%" align="right" style="color:#0000CC">'''(16)'''</div>
 
  |}
 
  |}
  
В качестве данных возьмём ежедневную статистику по фондовому индексу S\&P500 за период 1990-2008 (4791 торговый день) и курса EURUSD (1999-2008, 2495 дня, исключая праздники). Построим сначала автокорреляционные коэффициенты амплитуд ежедневного размаха цены <math>\textstyle \rho_s(v)=cor(v_t, v_{t-s})</math>: \includegraphics{pic/sp_delta.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: S\&P500 и EURUSD коррелограммы амплитуд размаха цены} Как обычно, коэффициенты <math>\textstyle \rho_s</math> достаточно высокие, однако автокорреляции для индекса S\&P500 более значительны, чем для курса EURUSD, и имеют меньшие колебания.
+
В качестве данных возьмём ежедневную статистику по фондовому индексу S\&P500 за период 1990-2008 (4791 торговый день) и курса EURUSD (1999-2008, 2495 дня, исключая праздники). Построим сначала автокорреляционные коэффициенты амплитуд ежедневного размаха цены <math>\textstyle \rho_s(v)=cor(v_t, v_{t-s})</math>:
  
Перейдём теперь к разностям амплитуд двух соседних дней. Их автокорреляция <math>\textstyle \rho_s(\delta v)</math> тут же резко падает: \includegraphics{pic/sp_delta2.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: S\&P500 и EURUSD коррелограммы после перехода к разностям} Отличия разительны. Второй автокорреляционный коэффициент в случае индекса S\&P500 падает в 24 раза, со значения 0.618 до величины 0.026. Для курса EURUSD снижение составляет 17 раз - с 0.449 до 0.027
+
<center>[[File:volat_pic14.png]]</center>
 +
 
 +
Как обычно, коэффициенты <math>\textstyle \rho_s</math> достаточно высокие, однако автокорреляции для индекса S\&P500 более значительны, чем для курса EURUSD, и имеют меньшие колебания.
 +
 
 +
Перейдём теперь к разностям амплитуд двух соседних дней. Их автокорреляция <math>\textstyle \rho_s(\delta v)</math> тут же резко падает:  
 +
 
 +
<center>[[File:volat_pic15.png]]</center>
 +
 
 +
Отличия разительны. Второй автокорреляционный коэффициент в случае индекса S\&P500 падает в 24 раза, со значения 0.618 до величины 0.026. Для курса EURUSD снижение составляет 17 раз - с 0.449 до 0.027
  
 
Пунктирные линии на всех рисунках означают двойную стандартную ошибку, равную <math>\textstyle 0.03 = 2/\sqrt{4791}</math> для индекса S\&P500 и <math>\textstyle 0.04 = 2/\sqrt{2495}</math> для EURUSD.
 
Пунктирные линии на всех рисунках означают двойную стандартную ошибку, равную <math>\textstyle 0.03 = 2/\sqrt{4791}</math> для индекса S\&P500 и <math>\textstyle 0.04 = 2/\sqrt{2495}</math> для EURUSD.
Строка 22: Строка 30:
 
Наглядно исчезновение корреляционной зависимости можно продемонстрировать на точечных диаграммах связи последовательных значений <math>\textstyle v_t</math> и <math>\textstyle v_{t-s}</math>.
 
Наглядно исчезновение корреляционной зависимости можно продемонстрировать на точечных диаграммах связи последовательных значений <math>\textstyle v_t</math> и <math>\textstyle v_{t-s}</math>.
  
Ниже на точечных диаграммах явно видны "корреляции" между <math>\textstyle \{v_t, v_{t-1}\}</math> индекса S\&P500 и их отсутствие для <math>\textstyle \{\delta v_t, \delta v_{t-2}\}</math>: \includegraphics{pic/sp_base_delta.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: Точечные диаграммы для S\&P500 до и после перехода к разностям} На рисунке слева точки заполняют область с характерной формой веника, тогда как справа мы имеем симметричное облако с нулевой корреляцией. Похожие результаты обнуления автокорреляционных коэффициентов получаются также для модулей логарифмической доходности <math>\textstyle |r_t|</math>, и других финансовых инструментов.
+
Ниже на точечных диаграммах явно видны "корреляции" между <math>\textstyle \{v_t, v_{t-1}\}</math> индекса S\&P500 и их отсутствие для <math>\textstyle \{\delta v_t, \delta v_{t-2}\}</math>:  
 +
 
 +
<center>[[File:volat_pic16.png]]</center>
 +
 
 +
Точечные диаграммы для S\&P500 до и после перехода к разностям} На рисунке слева точки заполняют область с характерной формой веника, тогда как справа мы имеем симметричное облако с нулевой корреляцией. Похожие результаты обнуления автокорреляционных коэффициентов получаются также для модулей логарифмической доходности <math>\textstyle |r_t|</math>, и других финансовых инструментов.
  
 
Заметим, правда, что для разностей <math>\textstyle \delta v_t</math> существует высокая отрицательная автокорреляция со сдвигом в один день <math>\textstyle \rho_1(\delta v)=cor(\delta v_t, \delta v_{t-1})</math>. В примере выше она равна -0.49 для S\&P500 и -0.53 для EURUSD. Однако её происхождение связано не со стохастической динамикой волатильности, а с эффектом перекрытия. Поясним это на следующем примере. Предположим, что справедлива простейшая модель:
 
Заметим, правда, что для разностей <math>\textstyle \delta v_t</math> существует высокая отрицательная автокорреляция со сдвигом в один день <math>\textstyle \rho_1(\delta v)=cor(\delta v_t, \delta v_{t-1})</math>. В примере выше она равна -0.49 для S\&P500 и -0.53 для EURUSD. Однако её происхождение связано не со стохастической динамикой волатильности, а с эффектом перекрытия. Поясним это на следующем примере. Предположим, что справедлива простейшая модель:
Строка 28: Строка 40:
 
{| width="100%"  
 
{| width="100%"  
 
  | width="90%" align="center"|<math> v_t = \sigma \cdot \theta_t, </math>
 
  | width="90%" align="center"|<math> v_t = \sigma \cdot \theta_t, </math>
  | <div width="10%" align="right" style="color:#0000CC">'''(EQN)'''</div>
+
  | <div width="10%" align="right" style="color:#0000CC">'''(17)'''</div>
 
  |}
 
  |}
  
Строка 35: Строка 47:
 
{| width="100%"  
 
{| width="100%"  
 
  | width="90%" align="center"|<math> \left\langle \delta v_t \cdot \delta v_{t-1}\right\rangle =\sigma^2 \left\langle (\theta_t-\theta_{t-1}) \cdot (\theta_{t-1}-\theta_{t-2})\right\rangle = - \sigma^2 \cdot \left[\;\overline{\theta^2} - \overline{\theta}^{\,2}\;\right] = -\sigma^2\cdot \sigma^2_\theta, </math>
 
  | width="90%" align="center"|<math> \left\langle \delta v_t \cdot \delta v_{t-1}\right\rangle =\sigma^2 \left\langle (\theta_t-\theta_{t-1}) \cdot (\theta_{t-1}-\theta_{t-2})\right\rangle = - \sigma^2 \cdot \left[\;\overline{\theta^2} - \overline{\theta}^{\,2}\;\right] = -\sigma^2\cdot \sigma^2_\theta, </math>
  | <div width="10%" align="right" style="color:#0000CC">'''(EQN)'''</div>
+
  | <div width="10%" align="right" style="color:#0000CC">'''(18)'''</div>
 
  |}
 
  |}
  
 
где <math>\textstyle \sigma^2_\theta</math> - дисперсия случайных величин <math>\textstyle \theta</math>. Среднее квадрата возникает в слагаемом <math>\textstyle -\left\langle \theta_{t-1}\cdot \theta_{t-1}\right\rangle = \overline{\theta^2}</math>, которое и ответственно за эффект перекрытия. Аналогичным образом получается дисперсия разности <math>\textstyle \left\langle \delta v^2_{t}\right\rangle = 2\sigma^2 \sigma^2_\theta</math>. Поэтому первый автокорреляционный коэффициент в точности равен <math>\textstyle \rho_1(\delta v)=-0.5</math>, что и наблюдается выше. Корреляции со сдвигами <math>\textstyle s>1</math> будут нулевыми, так как перекрытия уже не возникает.
 
где <math>\textstyle \sigma^2_\theta</math> - дисперсия случайных величин <math>\textstyle \theta</math>. Среднее квадрата возникает в слагаемом <math>\textstyle -\left\langle \theta_{t-1}\cdot \theta_{t-1}\right\rangle = \overline{\theta^2}</math>, которое и ответственно за эффект перекрытия. Аналогичным образом получается дисперсия разности <math>\textstyle \left\langle \delta v^2_{t}\right\rangle = 2\sigma^2 \sigma^2_\theta</math>. Поэтому первый автокорреляционный коэффициент в точности равен <math>\textstyle \rho_1(\delta v)=-0.5</math>, что и наблюдается выше. Корреляции со сдвигами <math>\textstyle s>1</math> будут нулевыми, так как перекрытия уже не возникает.
  
Тот факт, что для автокорреляций разностей с хорошей степенью точности выполняются соотношения <math>\textstyle \rho_1(\delta v)=-0.5</math> и <math>\textstyle \rho_s(\delta v)=0</math> при <math>\textstyle s>1</math> свидетельствует в пользу модели (). Однако, если бы параметр <math>\textstyle \sigma</math> был константой, то не возникало бы корреляций между последовательными значениями волатильности <math>\textstyle \rho_s( v)=0</math> (в силу независимости <math>\textstyle \theta_t</math>). Она может возникать, как мы показали выше, в результате ''плавного'' изменения величины <math>\textstyle \sigma</math> со временем. Таким образом, фактически <math>\textstyle \sigma=\sigma(t)</math>, и является гладкой функцией времени.
+
Тот факт, что для автокорреляций разностей с хорошей степенью точности выполняются соотношения <math>\textstyle \rho_1(\delta v)=-0.5</math> и <math>\textstyle \rho_s(\delta v)=0</math> при <math>\textstyle s>1</math> свидетельствует в пользу модели (17). Однако, если бы параметр <math>\textstyle \sigma</math> был константой, то не возникало бы корреляций между последовательными значениями волатильности <math>\textstyle \rho_s( v)=0</math> (в силу независимости <math>\textstyle \theta_t</math>). Она может возникать, как мы показали выше, в результате ''плавного'' изменения величины <math>\textstyle \sigma</math> со временем. Таким образом, фактически <math>\textstyle \sigma=\sigma(t)</math>, и является гладкой функцией времени.
  
 
Как для окончательного прояснения ситуации с <math>\textstyle \rho_1(\delta v)</math>, так и для целей дальнейших исследований нам необходима методология выделения гладкой нестационарной составляющей волатильности.
 
Как для окончательного прояснения ситуации с <math>\textstyle \rho_1(\delta v)</math>, так и для целей дальнейших исследований нам необходима методология выделения гладкой нестационарной составляющей волатильности.
  
==Выделение гладкой нестационарности==
 
 
Для выделения медленно меняющейся составляющей во временном ряду <math>\textstyle x_k=x(t_k)</math> мы будем использовать фильтр Ходрика-Прескотта (далее HP-фильтр). Гладкая составляющая <math>\textstyle s_k</math> ряда находится в результате минимизации квадратов её отклонений от эмпирических данных <math>\textstyle x_k</math>, одновременно с требованием минимальности кривизны <math>\textstyle s_k</math>:
 
 
{| width="100%"
 
| width="90%" align="center"|<math> \sum^n_{k=1} ( x_k-s_k)^2 + \lambda \cdot \sum^{n-1}_{k=2} (\nabla^2 s_k)^2 = min, </math>
 
| <div width="10%" align="right" style="color:#0000CC">'''(EQN)'''</div>
 
|}
 
 
где вторая производная в разностях равна <math>\textstyle \nabla^2 s_k=(s_{k+1}-s_k)-(s_{k}-s_{k-1})</math>. Степень гладкости <math>\textstyle s_k</math> будет тем выше, чем больше параметр <math>\textstyle \lambda</math>. Значения <math>\textstyle \lambda</math> варьируются в очень широком диапазоне, поэтому мы будем приводить его десятичный логарифм <math>\textstyle \nu</math>, представляя <math>\textstyle \lambda = 10^\nu</math>.
 
 
При сглаживании сильно зашумлённых данных всегда присутствует произвол в выборе параметра <math>\textstyle \lambda</math>. Если <math>\textstyle \lambda</math> мал, существует опасность обнаружить нестационарность там, где её нет. При слабом сглаживании гладкая составляющая будет повторять любые локальные флуктуации, не имеющие к нестационарности ни какого отношения. С другой стороны, при сильном сглаживании мы рискуем упустить важные детали интересующей нас динамики.
 
 
Поэтому нам необходим некоторый статистический критерий степени сглаживания для уменьшения возможного произвола. Как обычно, будем в качестве эталона использовать модель случайного блуждания.
 
 
Среднее значение логарифмической доходности равно относительному изменению цены внутри временного лага <math>\textstyle r_t=\ln C_t/O_t</math>. Волатильность будем восстанавливать по сглаженному среднему модифицированной амплитуды размаха цены внутри лага <math>\textstyle \sigma(t)=\overline{(a-|r|/2)}\cdot\sqrt{2\pi}/3</math>. Говоря о волатильности, всегда подразумеваем волатильность лага (минутную, часовую, дневную и т.д.).
 
 
Если число дискретных блужданий цены внутри лага достаточно велико, то, независимо от их распределения, логарифмические доходности <math>\textstyle r_t</math> будут нескоррелированными ''гауссовыми'' случайными числами. Сгладим их среднее значение <math>\textstyle \bar{r}(t)</math> при помощи HP-фильтра с различными параметрами <math>\textstyle \lambda</math> и вычислим типичную величину <math>\textstyle Err\bigl[\bar{r}(t)\bigr]</math> колебаний <math>\textstyle \bar{r}(t)</math> вокруг среднего <math>\textstyle \bar{r}</math> по всем эмпирическим точкам:
 
 
{| width="100%"
 
| width="90%" align="center"|<math> Err\bigl[\bar{r}(t)\bigr]= \sqrt{\left\langle (\bar{r}(t)-\bar{r})^2\right\rangle }. </math>
 
| <div width="10%" align="right" style="color:#0000CC">'''(EQN)'''</div>
 
|}
 
 
Аналогично определяется ошибка вычисления сглаженной волатильности лага. Численные эксперименты показывают, что эти ошибки, с хорошей степенью точности, убывают с ростом параметра <math>\textstyle \lambda</math> следующим образом:
 
 
{| width="100%"
 
| width="90%" align="center"|<math> Err\bigl[\bar{r}(t)\bigr] \approx \frac{0.50\;\sigma}{\lambda^{1/8}},\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; Err\bigl[\sigma(t)\bigr] \approx \frac{0.15\;\sigma}{\lambda^{1/8}}, </math>
 
| <div width="10%" align="right" style="color:#0000CC">'''(EQN)'''</div>
 
|}
 
 
и практически не зависят от числа эмпирических точек <math>\textstyle n</math>. Более того, ошибки не зависят и от типа распределения (в случае дискретной модели лагового блуждания). Малая степень 1/8 объясняет причину необходимости использования широкого диапазона для изменения параметра <math>\textstyle \lambda</math>.
 
 
Соотношения () задают типичный коридор колебаний сглаженных величин <math>\textstyle \bar{r}(t)</math> и <math>\textstyle \sigma(t)</math>, которые являются флуктуациями и статистически не значимы ''в случае постоянства'' волатильности. Поэтому они будут нашими ориентирами, по крайней мере, на горизонтальных участках <math>\textstyle \sigma(t)</math>.
 
 
Приведём типичный пример численного моделирования (<math>\textstyle \sigma=1</math>, <math>\textstyle n=1000</math>) для трёх значений <math>\textstyle \lambda</math> (<math>\textstyle \nu=\log_{10}\lambda</math>): \includegraphics{pic/hp_err_av.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: Сглаженное среднее гауссового шума} Более жирная линия соответствует <math>\textstyle \lambda=1000000</math> (<math>\textstyle \nu=6</math>), а тонкая - <math>\textstyle \lambda=1000</math> (<math>\textstyle \nu=3</math>). Сплошные горизонтальные "уровни значимости" определяют двойную ошибку <math>\textstyle \pm 2 Err[\bar{r}(t)]</math> в случае <math>\textstyle \nu=6</math>, а пунктирные - для <math>\textstyle \nu=3</math> и <math>\textstyle \nu=9</math>. В отличие от уровней значимости корреляционных коэффициентов, мы имеем гладкую величину <math>\textstyle \bar{r}(t)</math>, которая может некоторое время "жить" вне заданного ошибкой диапазона. Тем не менее, соотношения () характеризуют значение типичных колебаний сглаженной величины для случайных данных.
 
 
Однако в ситуации нестационарности, которая нас, собственно, и интересует, необходимо выдерживать баланс между гладкостью и отсутствием излишнего сглаживания. Так, если <math>\textstyle \sigma(t)=1+0.5\cdot \sin (2\pi t/T)</math>, где <math>\textstyle T</math> - общая длительность эксперимента, получаем следующие варианты сглаживания волатильности, оцененной по модифицированной амплитуде размаха: \includegraphics{pic/hp_err_av_si_sin.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: Сглаженная волатильность блуждания с <math>\textstyle \sigma(t)=1+0.5\cdot \sin (2\pi t/T)</math>} В данном случае оптимальным значением была <math>\textstyle \nu=6</math>, так как <math>\textstyle \nu=3</math> испытывает шумящие колебания вокруг истинной волатильности, а <math>\textstyle \nu=9</math> - фактически не "ловит" синусоиду. Однако ситуация сильно ухудшается, если волатильность испытывает скачок. Так, пусть половину из <math>\textstyle n=1000</math> "торговых дней" волатильность была <math>\textstyle \sigma=1\%</math>, а вторую половину <math>\textstyle \sigma=2\%</math>. Тогда сглаживания с различными <math>\textstyle \lambda</math> дают такие результаты: \includegraphics{pic/hp_err_av_si_step.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: Сглаженная волатильность блуждания <math>\textstyle \sigma(t)</math> ступеньки} Видно, что в этом случае <math>\textstyle \nu=6</math> существенно размывает ступеньку. Сглаживание с <math>\textstyle \nu=3</math> размывает скачок волатильности существенно меньше, но зато даёт шумящие и незначимые колебания при постоянстве <math>\textstyle \sigma</math>.
 
  
 
=== Примчания ===
 
=== Примчания ===

Текущая версия на 20:34, 6 марта 2010

Нестационарная статистика << Оглавление >> Выделение гладкой нестационарности

Простейший способ устранения относительно гладких нестационарностей во временных рядах - это переход к разностям величин. Если испытывает локально постоянный снос, то это будет приводить к появлению автокорреляций. Разность двух последовательных величин подобный снос устраняет. Даже, если тренд данных медленно изменяет своё направление, то в рамках восходящих и нисходящих участков значения разностей меняются незначительно и становятся локально квазистационарными.

Рассмотрим изменение модифицированной амплитуды размаха цены:

(16)

В качестве данных возьмём ежедневную статистику по фондовому индексу S\&P500 за период 1990-2008 (4791 торговый день) и курса EURUSD (1999-2008, 2495 дня, исключая праздники). Построим сначала автокорреляционные коэффициенты амплитуд ежедневного размаха цены :

Volat pic14.png

Как обычно, коэффициенты достаточно высокие, однако автокорреляции для индекса S\&P500 более значительны, чем для курса EURUSD, и имеют меньшие колебания.

Перейдём теперь к разностям амплитуд двух соседних дней. Их автокорреляция тут же резко падает:

Volat pic15.png

Отличия разительны. Второй автокорреляционный коэффициент в случае индекса S\&P500 падает в 24 раза, со значения 0.618 до величины 0.026. Для курса EURUSD снижение составляет 17 раз - с 0.449 до 0.027

Пунктирные линии на всех рисунках означают двойную стандартную ошибку, равную для индекса S\&P500 и для EURUSD.

Наглядно исчезновение корреляционной зависимости можно продемонстрировать на точечных диаграммах связи последовательных значений и .

Ниже на точечных диаграммах явно видны "корреляции" между индекса S\&P500 и их отсутствие для :

Volat pic16.png

Точечные диаграммы для S\&P500 до и после перехода к разностям} На рисунке слева точки заполняют область с характерной формой веника, тогда как справа мы имеем симметричное облако с нулевой корреляцией. Похожие результаты обнуления автокорреляционных коэффициентов получаются также для модулей логарифмической доходности , и других финансовых инструментов.

Заметим, правда, что для разностей существует высокая отрицательная автокорреляция со сдвигом в один день . В примере выше она равна -0.49 для S\&P500 и -0.53 для EURUSD. Однако её происхождение связано не со стохастической динамикой волатильности, а с эффектом перекрытия. Поясним это на следующем примере. Предположим, что справедлива простейшая модель:

(17)

где , а - независимые стационарные положительные случайные числа, возникающие по причине ошибок конечности выборки по которой измеряется волатильность. В этом случае изменения имеют нулевое среднее . Первый автоковариационный коэффициент равен:

(18)

где - дисперсия случайных величин . Среднее квадрата возникает в слагаемом , которое и ответственно за эффект перекрытия. Аналогичным образом получается дисперсия разности . Поэтому первый автокорреляционный коэффициент в точности равен , что и наблюдается выше. Корреляции со сдвигами будут нулевыми, так как перекрытия уже не возникает.

Тот факт, что для автокорреляций разностей с хорошей степенью точности выполняются соотношения и при свидетельствует в пользу модели (17). Однако, если бы параметр был константой, то не возникало бы корреляций между последовательными значениями волатильности (в силу независимости ). Она может возникать, как мы показали выше, в результате плавного изменения величины со временем. Таким образом, фактически , и является гладкой функцией времени.

Как для окончательного прояснения ситуации с , так и для целей дальнейших исследований нам необходима методология выделения гладкой нестационарной составляющей волатильности.


Примчания


Нестационарная статистика << Оглавление >> Выделение гладкой нестационарности