Модель аддитивного блуждания

Материал из Synset

Перейти к: навигация, поиск
Многомерное распределение Гаусса << Оглавление >> Случайные процессы

\textstyle \bullet Координата броуновской частицы в воде или цена на финансовом рынке \textstyle x имеют траекторию с очень нерегулярными изломами. Простейшим её описанием будет модель аддитивного независимого дискретного случайного блуждания. Все четыре прилагательных в названии модели отражают базовые свойства процесса.

Предположим, что начальное значение \textstyle x=x_0. Далее \textstyle x испытывает \textstyle t=1,2,... случайных независимых гауссовых изменений ("толчков"), каждое с волатильностью \textstyle \sigma. В результате \textstyle x окажется равным накопленной сумме таких изменений:

 x_t=x_0 + \sigma\cdot(\varepsilon_1+...+\varepsilon_t),
(1.38)

где \textstyle \varepsilon_i\sim N(0,1) — гауссовы числа с нулевым средним и единичной дисперсией. Индекс \textstyle t пока является целым числом, однако в дальнейшем мы перейдём к пределу непрерывного времени.

Удобно ввести дискретную переменную Винера:

 W_t = \varepsilon_1+...+\varepsilon_t = \varepsilon\cdot\sqrt{t}.
(1.39)

Второе равенство мы записали, так как сумма \textstyle t гауссовых чисел снова равна гауссовому числу с волатильностью \textstyle \sqrt{t}. Случайные числа, как с индексами \textstyle \varepsilon_i, так и без них \textstyle \varepsilon, предполагаются нормированными: \textstyle \left\langle \varepsilon\right\rangle =0, \textstyle \left\langle \varepsilon^2\right\rangle =1, т.е. как \textstyle \varepsilon\sim N(0,1). Модель (1.38) теперь выглядит следующим образом: \textstyle x_t=x_0+\sigma\cdot W_t.

Смоделируем такое блуждание при помощи компьютера. Начиная с \textstyle x_0=0, будем генерить случайные числа \textstyle \varepsilon_1, \textstyle \varepsilon_2, ... и строить их накопленную сумму (1-й рисунок):

File:walk_winer.png

Так как изменения \textstyle \varepsilon_k будут каждый раз новыми, то по-разному будут протекать и блуждания траектории \textstyle x_t=x(t) (см. 2-й рисунок). Различные реализации процесса блуждания пересекают вертикальную прямую \textstyle t=const в тех или иных значениях \textstyle x. Совокупность всех этих чисел является случайной величиной.

Поэтому, говоря о процессе \textstyle x(t), мы подразумеваем, что в данный момент времени \textstyle x=x(t) имеет определённое распределение \textstyle P(x). В некоторый другой момент времени распределение может оказаться иным. Поэтому плотность вероятности \textstyle P(x,t), среднее \textstyle \bar{x}(t) и волатильность \textstyle \sigma(t) будут функциями времени.

Волатильность аддитивного блуждания увеличивается, как \textstyle \sqrt{t}. Это наглядно видно на 2-м рисунке с несколькими реализациями \textstyle x_t. Их "пучок" постепенно расширяется. В результате неопределённость будущего значения \textstyle x_t увеличивается. Мы можем обнаружить \textstyle x_t достаточно далеко от начального значения \textstyle x_0=0. Это также проиллюстрировано на 3-м рисунке, где представлены плотности вероятности \textstyle P(x,t), которые с течением времени постепенно "расплываются".

Блуждающие траектории начинаются с определённого начального значения \textstyle x_0=x(t_0) в момент времени \textstyle t_0. Поэтому, говоря о вероятности, мы имеем дело с условной плотностью \textstyle P(x_0, t_0 \Rightarrow x, t). Пока моменты времени \textstyle t_0 и \textstyle t являются целыми числами, соответствующими номеру скачка \textstyle \varepsilon_k на очередном этапе.

Важно понимать, что \textstyle x_t=x(t) не является конкретной траекторией. Это одновременная совокупность всех возможных траекторий случайного процесса. Аналогично, случайное число \textstyle x не подразумевает конкретного значения, а обозначает все возможные реализации, подчиняющиеся некоторому распределению \textstyle P(x). Вероятность получить на \textstyle t-ом шаге \textstyle x_t определяется вероятностями всех изменений \textstyle \varepsilon_i. Так, дискретный винеровский процесс \textstyle W_t определяется плотностью вероятности:

P(\varepsilon_1,...,\varepsilon_t) =  P(\varepsilon_1)\cdot ...\cdot P(\varepsilon_t),

где равенство отражает независимость всех \textstyle \varepsilon_i. Таким образом, \textstyle W_t — фактически, многомерная случайная величина.

Обратим ещё раз внимание на смысл записи: \textstyle \varepsilon_1+...+\varepsilon_t = \varepsilon\cdot\sqrt{t}. Предположим, что в процессе моделирования мы генерим \textstyle t независимых гауссовых чисел \textstyle \varepsilon_1, \varepsilon_2,... и складываем их. Результат будет иметь такие же статистические свойства, как одно гауссово число \textstyle \varepsilon с единичной волатильностью, умноженное на фактор \textstyle \sqrt{t}. При вычислении свойств накопленной суммы вполне достаточно пользоваться величиной \textstyle \varepsilon, а не совместной плотностью \textstyle P(\varepsilon_1,...,\varepsilon_t). В частности, если мы ищем среднее значение, в котором участвует сумма гауссовых чисел, его вычисление можно упростить, используя только одно случайное число. Однако, если нас интересует связь сумм, получаемых в различные моменты времени, то необходимы некоторые ухищрения. Рассмотрим их подробнее.

\textstyle \bullet Для сравнения процесса блуждания с самим собой в различные моменты времени его необходимо разбивать на неперекрывающиеся участки времени. Пусть процесс длится \textstyle s шагов, а затем еще в течение \textstyle t-s. Сравним свойства траекторий в "моменты времени" \textstyle s и \textstyle t (\textstyle s<t):

\begin{array}{l} W_s= \varepsilon_1+...+\varepsilon_s,\ W_t= \varepsilon_1+...+\varepsilon_s+\varepsilon_{s+1}+...+\varepsilon_t.\ \end{array}

Вычитая уравнения, получим сумму \textstyle t-s случайных чисел:

W_t-W_s \;=\; \varepsilon_{s+1}+...+\varepsilon_t = \varepsilon\sqrt{t-s} = W_{t-s}.

Второе равенство является отражением того, что суммарная волатильность \textstyle t-s независимых гауссовых слагаемых будет равна \textstyle \sqrt{t-s}. Фактически, \textstyle W_s и \textstyle W_t можно представить в виде:

 \begin{array}{l} W_s= \varepsilon_a\, \sqrt{s},  \ W_t= \varepsilon_a\, \sqrt{s} + \varepsilon_b\, \sqrt{t-s}, \end{array}
(1.40)

где \textstyle \varepsilon_a, \textstyle \varepsilon_b, как и везде в наших лекциях, — независимые гауссовые числа с нулевым средним и единичной дисперсией. Первое из них — \textstyle \varepsilon_a — эквивалентно накопленной сумме начальных \textstyle s приращений, а второе — \textstyle \varepsilon_b — соответствует независимым от \textstyle \varepsilon_a последующим \textstyle t-s приращениям.

Теперь можно найти ковариацию между \textstyle W_s и \textstyle W_t. Так как \textstyle \overline{W_t}=0, то:

\mathrm{cov}(s,t) = \left\langle  W_sW_t\right\rangle =\left\langle \varepsilon_a\, \sqrt{s} \cdot \bigl(\varepsilon_a\, \sqrt{s} + \varepsilon_b\, \sqrt{t-s}\bigr) \right\rangle  = s,

в силу того, что \textstyle \left\langle \varepsilon_a^2\right\rangle =1 и \textstyle \left\langle \varepsilon_a\varepsilon_b\right\rangle =0. Таким образом, ковариация зависит только от наименьшего числа \textstyle s=\min(s,t), представляющего собой длительность общей для \textstyle W_s и \textstyle W_t истории. Для прояснения смысла этого результата запишем регрессионную прямую (1.25) между \textstyle W_s и \textstyle W_t. Их волатильности равны \textstyle \sqrt{s} и \textstyle \sqrt{t}, а средние — нулю, поэтому:

\frac{W_t}{\sqrt{t}} = \frac{\mathrm{cov}(s,t)}{\sqrt{s}\sqrt{t}}\cdot \frac{W_s}{\sqrt{s}}+\frac{\xi}{\sqrt{t}}\;\;\;\;\;\;\; =>\;\;\;\;\;\;W_t=W_s+\xi.

Таким образом, если известно, что в момент времени \textstyle s сумма равна \textstyle W_s, то наилучшим прогнозом будущего значения \textstyle W_t будет уже известное \textstyle W_s. Из (1.40) следует, что линейная регрессионная модель оказывается в данном случае точной. При этом её "шумом" выступают накопленные после момента времени \textstyle s изменения: \textstyle \xi=\varepsilon_{s+1}+...+\varepsilon_{t}=\varepsilon_b\sqrt{t-s}.

Мы будем часто усреднять гауссовы величины, поэтому в качестве упражнения стоит проверить следующие соотношения (\textstyle i<j<k):

\left\langle W_iW_jW_k\right\rangle =0,\;\;\;\;\;\;\;\left\langle W^2_iW_jW_k\right\rangle = 2i^2+ij\;\;\;\;\;\;\left\langle W_iW^2_jW_k\right\rangle = 3ij.

[Процесс \textstyle W_k необходимо разбить на три интервала.]

\textstyle \bullet В заключение раздела ответим на следующий вопрос. Если \textstyle x=x_1, то какова вероятность обнаружить его на следующем шаге в \textstyle x_2? Очевидно, что она равна вероятности изменения \textstyle x:

P(x_1 \Rightarrow x_2)  = P(\varepsilon) = \frac{e^{-(x_2-x_1)^2/2}}{\sqrt{2\pi}}.

Мы положили \textstyle \sigma=1 и записали в явном виде гауссову плотность вероятности для \textstyle \varepsilon=x_2-x_1. В результате условная вероятность зависит от обоих аргументов, поэтому случайные числа \textstyle x_1 и \textstyle x_2 являются зависимыми.

Дискретная траектория блуждания описывается множеством случайных величин \textstyle x_t=\{x_1,x_2,x_3,...\}, задающих возможные значения \textstyle x на шаге \textstyle t. Индекс можно записать в функциональной форме \textstyle x(t) и говорить о случайной функции, которая пока определена только в дискретных точках. Таким образом, случайная функция — это многомерная величина. Для задания свойств случайного процесса в общем случае необходимо определить плотность вероятности \textstyle P(x_1,x_2,x_3,...) с бесконечным числом аргументов.

Для винеровского процесса ситуация существенно упрощается, так как каждое следующее \textstyle x_{t+1} определяется значением непосредственно предшествующего \textstyle x_t и никак не зависит от более длинной предыстории. Этот факт мы будем записывать в следующем виде:

 P(x_1,...,x_{t} \Rightarrow x_{t+1})  \;=\; P(x_{t} \Rightarrow x_{t+1}).
(1.41)

Если известно \textstyle x_t, то \textstyle x_{t+1} будет определяться значением \textstyle x_t и случайным изменением \textstyle \varepsilon, а не всей историей \textstyle x_1,...,x_{t-1}. Процессы с такой "короткой памятью" называются марковскими процессами. Они представляют собой следующее приближение после независимости случайных величин, для которых \textstyle P(x_1,...,x_{t} \Rightarrow x_{t+1})=P(x_{t+1}).

Марковские процессы позволяют представить совместную вероятность любой размерности в виде цепочки условных вероятностей. Например:

 P(x_1,x_2,x_3) = P(x_1) \cdot P(x_1 \Rightarrow x_2) \cdot P(x_2 \Rightarrow x_3).
(1.42)

Для этого сначала записываем \textstyle P(x_1,x_2, x_3)=P(x_1,x_2) \cdot P(x_1,x_2 \Rightarrow x_3) по определению условной вероятности. Затем используем определение для \textstyle P(x_1,x_2)=P(x_1)P(x_1\Rightarrow x_2) и марковское условие короткой памяти: \textstyle P(x_1,x_2\Rightarrow x_3)=P(x_2\Rightarrow x_3). Таким образом, чтобы произошло \textstyle x_1,x_2,x_3, необходимо, чтобы свершилось \textstyle x_1. При условии, что это произошло, далее реализовалось \textstyle x_2, и т.д.


Многомерное распределение Гаусса << Оглавление >> Случайные процессы

Стохастический мир - простое введение в стохастические дифференциальные уравнения