Пластичность волатильности:Корреляция разностей — различия между версиями

Материал из synset
Перейти к: навигация, поиск
Строка 5: Строка 5:
 
|}
 
|}
 
----
 
----
 +
Простейший способ устранения относительно гладких нестационарностей во временных рядах - это переход к разностям величин. Если <math>\textstyle v_t</math> испытывает локально постоянный снос, то это будет приводить к появлению автокорреляций. Разность двух последовательных величин подобный снос устраняет. Даже, если тренд данных <math>\textstyle v_t</math> медленно изменяет своё направление, то в рамках восходящих и нисходящих участков значения разностей меняются незначительно и становятся локально квазистационарными.
  
 +
Рассмотрим изменение модифицированной амплитуды размаха цены:
  
 +
{| width="100%"
 +
| width="90%" align="center"|<math> \delta v_t=v_t-v_{t-1}. </math>
 +
| <div width="10%" align="right" style="color:#0000CC">'''(EQN)'''</div>
 +
|}
 +
 +
В качестве данных возьмём ежедневную статистику по фондовому индексу S\&P500 за период 1990-2008 (4791 торговый день) и курса EURUSD (1999-2008, 2495 дня, исключая праздники). Построим сначала автокорреляционные коэффициенты амплитуд ежедневного размаха цены <math>\textstyle \rho_s(v)=cor(v_t, v_{t-s})</math>: \includegraphics{pic/sp_delta.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: S\&P500 и EURUSD коррелограммы амплитуд размаха цены} Как обычно, коэффициенты <math>\textstyle \rho_s</math> достаточно высокие, однако автокорреляции для индекса S\&P500 более значительны, чем для курса EURUSD, и имеют меньшие колебания.
 +
 +
Перейдём теперь к разностям амплитуд двух соседних дней. Их автокорреляция <math>\textstyle \rho_s(\delta v)</math> тут же резко падает: \includegraphics{pic/sp_delta2.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: S\&P500 и EURUSD коррелограммы после перехода к разностям} Отличия разительны. Второй автокорреляционный коэффициент в случае индекса S\&P500 падает в 24 раза, со значения 0.618 до величины 0.026. Для курса EURUSD снижение составляет 17 раз - с 0.449 до 0.027
 +
 +
Пунктирные линии на всех рисунках означают двойную стандартную ошибку, равную <math>\textstyle 0.03 = 2/\sqrt{4791}</math> для индекса S\&P500 и <math>\textstyle 0.04 = 2/\sqrt{2495}</math> для EURUSD.
 +
 +
Наглядно исчезновение корреляционной зависимости можно продемонстрировать на точечных диаграммах связи последовательных значений <math>\textstyle v_t</math> и <math>\textstyle v_{t-s}</math>.
 +
 +
Ниже на точечных диаграммах явно видны "корреляции" между <math>\textstyle \{v_t, v_{t-1}\}</math> индекса S\&P500 и их отсутствие для <math>\textstyle \{\delta v_t, \delta v_{t-2}\}</math>: \includegraphics{pic/sp_base_delta.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: Точечные диаграммы для S\&P500 до и после перехода к разностям} На рисунке слева точки заполняют область с характерной формой веника, тогда как справа мы имеем симметричное облако с нулевой корреляцией. Похожие результаты обнуления автокорреляционных коэффициентов получаются также для модулей логарифмической доходности <math>\textstyle |r_t|</math>, и других финансовых инструментов.
 +
 +
Заметим, правда, что для разностей <math>\textstyle \delta v_t</math> существует высокая отрицательная автокорреляция со сдвигом в один день <math>\textstyle \rho_1(\delta v)=cor(\delta v_t, \delta v_{t-1})</math>. В примере выше она равна -0.49 для S\&P500 и -0.53 для EURUSD. Однако её происхождение связано не со стохастической динамикой волатильности, а с эффектом перекрытия. Поясним это на следующем примере. Предположим, что справедлива простейшая модель:
 +
 +
{| width="100%"
 +
| width="90%" align="center"|<math> v_t = \sigma \cdot \theta_t, </math>
 +
| <div width="10%" align="right" style="color:#0000CC">'''(EQN)'''</div>
 +
|}
 +
 +
где <math>\textstyle \sigma=const</math>, а <math>\textstyle \theta_t</math> - независимые стационарные положительные случайные числа, возникающие по причине ошибок конечности выборки по которой измеряется волатильность. В этом случае изменения <math>\textstyle \delta v_t = \sigma\cdot(\theta_t-\theta_{t-1})</math> имеют нулевое среднее <math>\textstyle \overline{\delta v_t} = 0</math>. Первый автоковариационный коэффициент равен:
 +
 +
{| width="100%"
 +
| width="90%" align="center"|<math> \left\langle \delta v_t \cdot \delta v_{t-1}\right\rangle =\sigma^2 \left\langle (\theta_t-\theta_{t-1}) \cdot (\theta_{t-1}-\theta_{t-2})\right\rangle = - \sigma^2 \cdot \left[\;\overline{\theta^2} - \overline{\theta}^{\,2}\;\right] = -\sigma^2\cdot \sigma^2_\theta, </math>
 +
| <div width="10%" align="right" style="color:#0000CC">'''(EQN)'''</div>
 +
|}
 +
 +
где <math>\textstyle \sigma^2_\theta</math> - дисперсия случайных величин <math>\textstyle \theta</math>. Среднее квадрата возникает в слагаемом <math>\textstyle -\left\langle \theta_{t-1}\cdot \theta_{t-1}\right\rangle = \overline{\theta^2}</math>, которое и ответственно за эффект перекрытия. Аналогичным образом получается дисперсия разности <math>\textstyle \left\langle \delta v^2_{t}\right\rangle = 2\sigma^2 \sigma^2_\theta</math>. Поэтому первый автокорреляционный коэффициент в точности равен <math>\textstyle \rho_1(\delta v)=-0.5</math>, что и наблюдается выше. Корреляции со сдвигами <math>\textstyle s>1</math> будут нулевыми, так как перекрытия уже не возникает.
 +
 +
Тот факт, что для автокорреляций разностей с хорошей степенью точности выполняются соотношения <math>\textstyle \rho_1(\delta v)=-0.5</math> и <math>\textstyle \rho_s(\delta v)=0</math> при <math>\textstyle s>1</math> свидетельствует в пользу модели (). Однако, если бы параметр <math>\textstyle \sigma</math> был константой, то не возникало бы корреляций между последовательными значениями волатильности <math>\textstyle \rho_s( v)=0</math> (в силу независимости <math>\textstyle \theta_t</math>). Она может возникать, как мы показали выше, в результате ''плавного'' изменения величины <math>\textstyle \sigma</math> со временем. Таким образом, фактически <math>\textstyle \sigma=\sigma(t)</math>, и является гладкой функцией времени.
 +
 +
Как для окончательного прояснения ситуации с <math>\textstyle \rho_1(\delta v)</math>, так и для целей дальнейших исследований нам необходима методология выделения гладкой нестационарной составляющей волатильности.
 +
 +
==Выделение гладкой нестационарности==
 +
 +
Для выделения медленно меняющейся составляющей во временном ряду <math>\textstyle x_k=x(t_k)</math> мы будем использовать фильтр Ходрика-Прескотта (далее HP-фильтр). Гладкая составляющая <math>\textstyle s_k</math> ряда находится в результате минимизации квадратов её отклонений от эмпирических данных <math>\textstyle x_k</math>, одновременно с требованием минимальности кривизны <math>\textstyle s_k</math>:
 +
 +
{| width="100%"
 +
| width="90%" align="center"|<math> \sum^n_{k=1} ( x_k-s_k)^2 + \lambda \cdot \sum^{n-1}_{k=2} (\nabla^2 s_k)^2 = min, </math>
 +
| <div width="10%" align="right" style="color:#0000CC">'''(EQN)'''</div>
 +
|}
 +
 +
где вторая производная в разностях равна <math>\textstyle \nabla^2 s_k=(s_{k+1}-s_k)-(s_{k}-s_{k-1})</math>. Степень гладкости <math>\textstyle s_k</math> будет тем выше, чем больше параметр <math>\textstyle \lambda</math>. Значения <math>\textstyle \lambda</math> варьируются в очень широком диапазоне, поэтому мы будем приводить его десятичный логарифм <math>\textstyle \nu</math>, представляя <math>\textstyle \lambda = 10^\nu</math>.
 +
 +
При сглаживании сильно зашумлённых данных всегда присутствует произвол в выборе параметра <math>\textstyle \lambda</math>. Если <math>\textstyle \lambda</math> мал, существует опасность обнаружить нестационарность там, где её нет. При слабом сглаживании гладкая составляющая будет повторять любые локальные флуктуации, не имеющие к нестационарности ни какого отношения. С другой стороны, при сильном сглаживании мы рискуем упустить важные детали интересующей нас динамики.
 +
 +
Поэтому нам необходим некоторый статистический критерий степени сглаживания для уменьшения возможного произвола. Как обычно, будем в качестве эталона использовать модель случайного блуждания.
 +
 +
Среднее значение логарифмической доходности равно относительному изменению цены внутри временного лага <math>\textstyle r_t=\ln C_t/O_t</math>. Волатильность будем восстанавливать по сглаженному среднему модифицированной амплитуды размаха цены внутри лага <math>\textstyle \sigma(t)=\overline{(a-|r|/2)}\cdot\sqrt{2\pi}/3</math>. Говоря о волатильности, всегда подразумеваем волатильность лага (минутную, часовую, дневную и т.д.).
 +
 +
Если число дискретных блужданий цены внутри лага достаточно велико, то, независимо от их распределения, логарифмические доходности <math>\textstyle r_t</math> будут нескоррелированными ''гауссовыми'' случайными числами. Сгладим их среднее значение <math>\textstyle \bar{r}(t)</math> при помощи HP-фильтра с различными параметрами <math>\textstyle \lambda</math> и вычислим типичную величину <math>\textstyle Err\bigl[\bar{r}(t)\bigr]</math> колебаний <math>\textstyle \bar{r}(t)</math> вокруг среднего <math>\textstyle \bar{r}</math> по всем эмпирическим точкам:
 +
 +
{| width="100%"
 +
| width="90%" align="center"|<math> Err\bigl[\bar{r}(t)\bigr]= \sqrt{\left\langle (\bar{r}(t)-\bar{r})^2\right\rangle }. </math>
 +
| <div width="10%" align="right" style="color:#0000CC">'''(EQN)'''</div>
 +
|}
 +
 +
Аналогично определяется ошибка вычисления сглаженной волатильности лага. Численные эксперименты показывают, что эти ошибки, с хорошей степенью точности, убывают с ростом параметра <math>\textstyle \lambda</math> следующим образом:
 +
 +
{| width="100%"
 +
| width="90%" align="center"|<math> Err\bigl[\bar{r}(t)\bigr] \approx \frac{0.50\;\sigma}{\lambda^{1/8}},\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; Err\bigl[\sigma(t)\bigr] \approx \frac{0.15\;\sigma}{\lambda^{1/8}}, </math>
 +
| <div width="10%" align="right" style="color:#0000CC">'''(EQN)'''</div>
 +
|}
 +
 +
и практически не зависят от числа эмпирических точек <math>\textstyle n</math>. Более того, ошибки не зависят и от типа распределения (в случае дискретной модели лагового блуждания). Малая степень 1/8 объясняет причину необходимости использования широкого диапазона для изменения параметра <math>\textstyle \lambda</math>.
 +
 +
Соотношения () задают типичный коридор колебаний сглаженных величин <math>\textstyle \bar{r}(t)</math> и <math>\textstyle \sigma(t)</math>, которые являются флуктуациями и статистически не значимы ''в случае постоянства'' волатильности. Поэтому они будут нашими ориентирами, по крайней мере, на горизонтальных участках <math>\textstyle \sigma(t)</math>.
 +
 +
Приведём типичный пример численного моделирования (<math>\textstyle \sigma=1</math>, <math>\textstyle n=1000</math>) для трёх значений <math>\textstyle \lambda</math> (<math>\textstyle \nu=\log_{10}\lambda</math>): \includegraphics{pic/hp_err_av.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: Сглаженное среднее гауссового шума} Более жирная линия соответствует <math>\textstyle \lambda=1000000</math> (<math>\textstyle \nu=6</math>), а тонкая - <math>\textstyle \lambda=1000</math> (<math>\textstyle \nu=3</math>). Сплошные горизонтальные "уровни значимости" определяют двойную ошибку <math>\textstyle \pm 2 Err[\bar{r}(t)]</math> в случае <math>\textstyle \nu=6</math>, а пунктирные - для <math>\textstyle \nu=3</math> и <math>\textstyle \nu=9</math>. В отличие от уровней значимости корреляционных коэффициентов, мы имеем гладкую величину <math>\textstyle \bar{r}(t)</math>, которая может некоторое время "жить" вне заданного ошибкой диапазона. Тем не менее, соотношения () характеризуют значение типичных колебаний сглаженной величины для случайных данных.
 +
 +
Однако в ситуации нестационарности, которая нас, собственно, и интересует, необходимо выдерживать баланс между гладкостью и отсутствием излишнего сглаживания. Так, если <math>\textstyle \sigma(t)=1+0.5\cdot \sin (2\pi t/T)</math>, где <math>\textstyle T</math> - общая длительность эксперимента, получаем следующие варианты сглаживания волатильности, оцененной по модифицированной амплитуде размаха: \includegraphics{pic/hp_err_av_si_sin.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: Сглаженная волатильность блуждания с <math>\textstyle \sigma(t)=1+0.5\cdot \sin (2\pi t/T)</math>} В данном случае оптимальным значением была <math>\textstyle \nu=6</math>, так как <math>\textstyle \nu=3</math> испытывает шумящие колебания вокруг истинной волатильности, а <math>\textstyle \nu=9</math> - фактически не "ловит" синусоиду. Однако ситуация сильно ухудшается, если волатильность испытывает скачок. Так, пусть половину из <math>\textstyle n=1000</math> "торговых дней" волатильность была <math>\textstyle \sigma=1\%</math>, а вторую половину <math>\textstyle \sigma=2\%</math>. Тогда сглаживания с различными <math>\textstyle \lambda</math> дают такие результаты: \includegraphics{pic/hp_err_av_si_step.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: Сглаженная волатильность блуждания <math>\textstyle \sigma(t)</math> ступеньки} Видно, что в этом случае <math>\textstyle \nu=6</math> существенно размывает ступеньку. Сглаживание с <math>\textstyle \nu=3</math> размывает скачок волатильности существенно меньше, но зато даёт шумящие и незначимые колебания при постоянстве <math>\textstyle \sigma</math>.
 +
 +
=== Примчания ===
 +
<references/>
 
----
 
----
 
{| width="100%"   
 
{| width="100%"   

Версия 18:52, 27 февраля 2010

Нестационарная статистика << Оглавление >> Выделение гладкой нестационарности

Простейший способ устранения относительно гладких нестационарностей во временных рядах - это переход к разностям величин. Если испытывает локально постоянный снос, то это будет приводить к появлению автокорреляций. Разность двух последовательных величин подобный снос устраняет. Даже, если тренд данных медленно изменяет своё направление, то в рамках восходящих и нисходящих участков значения разностей меняются незначительно и становятся локально квазистационарными.

Рассмотрим изменение модифицированной амплитуды размаха цены:

(EQN)

В качестве данных возьмём ежедневную статистику по фондовому индексу S\&P500 за период 1990-2008 (4791 торговый день) и курса EURUSD (1999-2008, 2495 дня, исключая праздники). Построим сначала автокорреляционные коэффициенты амплитуд ежедневного размаха цены : \includegraphics{pic/sp_delta.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: S\&P500 и EURUSD коррелограммы амплитуд размаха цены} Как обычно, коэффициенты достаточно высокие, однако автокорреляции для индекса S\&P500 более значительны, чем для курса EURUSD, и имеют меньшие колебания.

Перейдём теперь к разностям амплитуд двух соседних дней. Их автокорреляция тут же резко падает: \includegraphics{pic/sp_delta2.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: S\&P500 и EURUSD коррелограммы после перехода к разностям} Отличия разительны. Второй автокорреляционный коэффициент в случае индекса S\&P500 падает в 24 раза, со значения 0.618 до величины 0.026. Для курса EURUSD снижение составляет 17 раз - с 0.449 до 0.027

Пунктирные линии на всех рисунках означают двойную стандартную ошибку, равную для индекса S\&P500 и для EURUSD.

Наглядно исчезновение корреляционной зависимости можно продемонстрировать на точечных диаграммах связи последовательных значений и .

Ниже на точечных диаграммах явно видны "корреляции" между индекса S\&P500 и их отсутствие для : \includegraphics{pic/sp_base_delta.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: Точечные диаграммы для S\&P500 до и после перехода к разностям} На рисунке слева точки заполняют область с характерной формой веника, тогда как справа мы имеем симметричное облако с нулевой корреляцией. Похожие результаты обнуления автокорреляционных коэффициентов получаются также для модулей логарифмической доходности , и других финансовых инструментов.

Заметим, правда, что для разностей существует высокая отрицательная автокорреляция со сдвигом в один день . В примере выше она равна -0.49 для S\&P500 и -0.53 для EURUSD. Однако её происхождение связано не со стохастической динамикой волатильности, а с эффектом перекрытия. Поясним это на следующем примере. Предположим, что справедлива простейшая модель:

(EQN)

где , а - независимые стационарные положительные случайные числа, возникающие по причине ошибок конечности выборки по которой измеряется волатильность. В этом случае изменения имеют нулевое среднее . Первый автоковариационный коэффициент равен:

(EQN)

где - дисперсия случайных величин . Среднее квадрата возникает в слагаемом , которое и ответственно за эффект перекрытия. Аналогичным образом получается дисперсия разности . Поэтому первый автокорреляционный коэффициент в точности равен , что и наблюдается выше. Корреляции со сдвигами будут нулевыми, так как перекрытия уже не возникает.

Тот факт, что для автокорреляций разностей с хорошей степенью точности выполняются соотношения и при свидетельствует в пользу модели (). Однако, если бы параметр был константой, то не возникало бы корреляций между последовательными значениями волатильности (в силу независимости ). Она может возникать, как мы показали выше, в результате плавного изменения величины со временем. Таким образом, фактически , и является гладкой функцией времени.

Как для окончательного прояснения ситуации с , так и для целей дальнейших исследований нам необходима методология выделения гладкой нестационарной составляющей волатильности.

Выделение гладкой нестационарности

Для выделения медленно меняющейся составляющей во временном ряду мы будем использовать фильтр Ходрика-Прескотта (далее HP-фильтр). Гладкая составляющая ряда находится в результате минимизации квадратов её отклонений от эмпирических данных , одновременно с требованием минимальности кривизны :

(EQN)

где вторая производная в разностях равна . Степень гладкости будет тем выше, чем больше параметр . Значения варьируются в очень широком диапазоне, поэтому мы будем приводить его десятичный логарифм , представляя .

При сглаживании сильно зашумлённых данных всегда присутствует произвол в выборе параметра . Если мал, существует опасность обнаружить нестационарность там, где её нет. При слабом сглаживании гладкая составляющая будет повторять любые локальные флуктуации, не имеющие к нестационарности ни какого отношения. С другой стороны, при сильном сглаживании мы рискуем упустить важные детали интересующей нас динамики.

Поэтому нам необходим некоторый статистический критерий степени сглаживания для уменьшения возможного произвола. Как обычно, будем в качестве эталона использовать модель случайного блуждания.

Среднее значение логарифмической доходности равно относительному изменению цены внутри временного лага . Волатильность будем восстанавливать по сглаженному среднему модифицированной амплитуды размаха цены внутри лага . Говоря о волатильности, всегда подразумеваем волатильность лага (минутную, часовую, дневную и т.д.).

Если число дискретных блужданий цены внутри лага достаточно велико, то, независимо от их распределения, логарифмические доходности будут нескоррелированными гауссовыми случайными числами. Сгладим их среднее значение при помощи HP-фильтра с различными параметрами и вычислим типичную величину колебаний вокруг среднего по всем эмпирическим точкам:

(EQN)

Аналогично определяется ошибка вычисления сглаженной волатильности лага. Численные эксперименты показывают, что эти ошибки, с хорошей степенью точности, убывают с ростом параметра следующим образом:

(EQN)

и практически не зависят от числа эмпирических точек . Более того, ошибки не зависят и от типа распределения (в случае дискретной модели лагового блуждания). Малая степень 1/8 объясняет причину необходимости использования широкого диапазона для изменения параметра .

Соотношения () задают типичный коридор колебаний сглаженных величин и , которые являются флуктуациями и статистически не значимы в случае постоянства волатильности. Поэтому они будут нашими ориентирами, по крайней мере, на горизонтальных участках .

Приведём типичный пример численного моделирования (, ) для трёх значений (): \includegraphics{pic/hp_err_av.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: Сглаженное среднее гауссового шума} Более жирная линия соответствует (), а тонкая - (). Сплошные горизонтальные "уровни значимости" определяют двойную ошибку в случае , а пунктирные - для и . В отличие от уровней значимости корреляционных коэффициентов, мы имеем гладкую величину , которая может некоторое время "жить" вне заданного ошибкой диапазона. Тем не менее, соотношения () характеризуют значение типичных колебаний сглаженной величины для случайных данных.

Однако в ситуации нестационарности, которая нас, собственно, и интересует, необходимо выдерживать баланс между гладкостью и отсутствием излишнего сглаживания. Так, если , где - общая длительность эксперимента, получаем следующие варианты сглаживания волатильности, оцененной по модифицированной амплитуде размаха: \includegraphics{pic/hp_err_av_si_sin.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: Сглаженная волатильность блуждания с } В данном случае оптимальным значением была , так как испытывает шумящие колебания вокруг истинной волатильности, а - фактически не "ловит" синусоиду. Однако ситуация сильно ухудшается, если волатильность испытывает скачок. Так, пусть половину из "торговых дней" волатильность была , а вторую половину . Тогда сглаживания с различными дают такие результаты: \includegraphics{pic/hp_err_av_si_step.eps}\\ {\small Рис.\arabic{myfig}\addtocounter{myfig}{1}: Сглаженная волатильность блуждания ступеньки} Видно, что в этом случае существенно размывает ступеньку. Сглаживание с размывает скачок волатильности существенно меньше, но зато даёт шумящие и незначимые колебания при постоянстве .

Примчания


Нестационарная статистика << Оглавление >> Выделение гладкой нестационарности