Единственность решений

Материал из Synset

Перейти к: навигация, поиск
Интегрирование стохастических уравнений << Оглавление >> Метод последовательных приближений


Стохастические уравнения записывают, чтобы описать динамику некоторой реальной системы. Если соответствующие уравнения адекватны, то вопрос о единственности их решений обычно отходит на второй план. Тем не менее, он рано или поздно встаёт перед исследователем и является достаточно важным. Мы рассмотрим обыкновенные дифференциальные уравнения, а затем перейдём к их стохастическому аналогу. Однако сначала вспомним некоторые утверждения из анализа.

\textstyle \bullet Мы называем функцию \textstyle f(x) непрерывной в точке \textstyle x=c, если пределы при стремлении к ней слева \textstyle x\to c-0 и справа \textstyle x\to c+0 существуют и равны друг другу. Так, \textstyle f(x)=1/x непрерывна во всех точках, кроме \textstyle x=0. Разность \textstyle f(x+0)-f(x-0) называется разрывом функции. Для \textstyle f(x)=1/x в \textstyle x=0 он равен бесконечности.

Непрерывная на интервале функция непрерывна в каждой его точке. В этом случае она имеет ограниченные значения и всегда существует такое конечное \textstyle M, что

 { \;\bigl|f(x)\bigr| \leqslant M},\;\;\;\;\;\;\;\alpha\leqslant x\leqslant \beta.
(5.23)

Это неравенство, например, не выполняется для функций \textstyle f(x)=1/x, \textstyle f(x)=\mathrm{tg}(x) на интервале \textstyle -2\leqslant x\leqslant 2.

Разрывная функция может как удовлетворять этому неравенству (если имеет конечный разрыв), так и не удовлетворять (для бесконечного разрыва). Непрерывная функция, не обращаясь в бесконечность на конечном интервале, всегда ему удовлетворяет. Другое эквивалентное свойство — непрерывная функция на интервале всегда имеет конечное минимальное и максимальное значения.

\textstyle \bullet Теорема Ролля утверждает, что, если \textstyle f(\alpha)=f(\beta) и в интервале \textstyle [\alpha...\beta] производная \textstyle f'(x) непрерывна, то всегда существует такая точка \textstyle \gamma: \textstyle \alpha\leqslant \gamma\leqslant \beta, в которой \textstyle f'(\gamma)=0. Интуитивно это понятно. Если функция не постоянная и \textstyle f(\alpha)=f(\beta), то внутри \textstyle [\alpha...\beta] она всегда достигнет минимума или максимума, в которых производная обратится в ноль (левый рисунок):

File:rollya.png

Важно существование на \textstyle \alpha\leqslant x \leqslant \beta конечной производной. Например, для \textstyle f(x)=1-x^{2/3} (рисунок справа) выполняется \textstyle f(-1)=f(1). Однако \textstyle f'(x)=-(2/3)/x^{1/3} нигде в интервале \textstyle [-1...1] в ноль не обращается.

\textstyle \bullet Формула конечных приращений Лагранжа непосредственно следует из теоремы Ролля. Если \textstyle f(\alpha)\neq f(\beta), то для \textstyle F(x)=f(x)+\lambda x всегда можно подобрать такое \textstyle \lambda, что:

F(\alpha)=F(\beta)\;\;\;\;\;\;\;=>\;\;\;\;\;\;\lambda = -\frac{f(\beta)-f(\alpha)}{\beta-\alpha}.

Поэтому по теореме Ролля существует такое \textstyle \gamma, что \textstyle F'(\gamma)=f'(\gamma)+\lambda=0, и, следовательно:

 {\; f(\beta)-f(\alpha) = (\beta-\alpha) \cdot f'(\gamma)},\;\;\;\;\;\;\;\;\alpha\leqslant \gamma\leqslant \beta.
(5.24)

Естественно, такая точка \textstyle \gamma может быть и не одна, и мы знаем о ней только то, что она находится где-то внутри отрезка \textstyle [\alpha...\beta].

\textstyle \bullet Лемма Гронуолла - Беллмана: если для констант \textstyle A, \textstyle B>0 на \textstyle [\alpha...\beta] справедливо первое неравенство (5.25), то тогда выполняется и второе:

 \;f(x) \leqslant A + B \int\limits^x_\alpha f(s)\,ds\;\;\;\;\;\;\;\;\;=>\;\;\;\;\;\;\;\;\;\;f(x) \leqslant A\, e^{B\cdot(x-\alpha)}\;.
(5.25)

Для доказательства введём функцию:

g(x) = \int\limits^x_\alpha f(s)\,ds \;\;\;\;\;\;\;\;\;=>\;\;\;\;\;\;\;g'(x) \leqslant A + B\, g(x),

где мы взяли производную от \textstyle g(x) и воспользовались первым неравенством (5.25). Неравенство, которому удовлетворяет \textstyle g(x), похоже на неоднородное линейное дифференциальное уравнение. Поступая аналогично этому случаю и вводя функцию \textstyle C(x), имеем:

g(x)=C(x)\,e^{Bx}\;\;\;\;\;\;\;\;\;\;\;\;\;\;=>\;\;\;\;\;\;\;\;\;\;\;\;\;\;C'(x) \leqslant A\, e^{-B\,x}.

Интегрируя его от \textstyle \alpha до \textstyle x и учитывая, что \textstyle g(\alpha)=0 и \textstyle C(\alpha)=0, получаем:

C(x) \leqslant \frac{A}{B}\left(e^{-B \alpha}-e^{-B x} \right) \;\;\;\;\;=>\;\;\;\;\;g(x)\leqslant \frac{A}{B}\left(e^{B (x-\alpha)}-1 \right).

Дифференцируя последнее неравенство \textstyle g'(x)=f(x), мы приходим к (5.25). В частном случае \textstyle A=0 имеем такую форму леммы:

 \;f(x) \leqslant B \int\limits^x_\alpha f(s)\,ds\;\;\;\;\;\;\;\;\;=>\;\;\;\;\;\;\;\;\;\;\;\;\;\;f(x) \leqslant 0\;.
(5.26)

Поэтому, если \textstyle f(x)\geqslant 0 и она удовлетворяет первому неравенству (5.26), то это означает, что функция равна нулю: \textstyle f(x)=0.

\textstyle \bullet Рассмотрим теперь обыкновенное дифференциальное уравнение:

 \frac{dx}{dt} = a(x,t).
(5.27)
Для него справедлива теорема о существовании и единственности:
Если в открытой области \textstyle G на плоскости \textstyle (x,t) функция \textstyle a(x,t) непрерывна и имеет непрерывную производную по \textstyle x, то через любую точку \textstyle G проходит одно и только одно решение (5.27).
Если производная непрерывна, то в соответствии с (5.23) она ограничена: \textstyle |\partial a/\partial x| \leqslant M, и по формуле конечных приращений (5.24) мы имеем неравенство Липшица:
 |a(y,t)-a(x,t)| \leqslant M \cdot |y-x|,
(5.28)

Оно является непосредственным следствием непрерывности \textstyle \partial a(x,t)/\partial x.

Докажем единственность решения (5.27), представив его в форме интегрального уравнения:

x(t) = x_0 + \int\limits^t_{t_0} a\bigl(x(\tau), \tau\bigr) \, dt.

Пусть на интервале \textstyle [t_0\, ...\, t] существуют два решения \textstyle x(t) и \textstyle y(t) с одинаковым начальным условием \textstyle x(t_0)=y(t_0)=x_0. Запишем их в интегральной форме и вычтем:

y(t)-x(t) = \int\limits^t_{t_0} \left\{ a\bigl(y(\tau), \tau\bigr)- a\bigl(x(\tau), \tau\bigr) \right\} \, dt.

Так как сумма модулей всегда больше модуля суммы, имеем:

|y(t)-x(t)| \leqslant \int\limits^t_{t_0} \left| a\bigl(y(\tau), \tau\bigr)- a\bigl(x(\tau), \tau\bigr) \right| \, dt \leqslant M\cdot \int\limits^t_{t_0} \left| y(\tau)- x(\tau) \right| \, dt,

где во втором неравенстве мы воспользовались условием Липшица (5.28). В соответствии с леммой Гронуолла - Беллмана (5.26), из этого неравенства следует, что \textstyle |y(t)-x(t)|=0, и, следовательно, решения совпадают.

Подобное доказательство "от противного" типично для многих "неконструктивных" рассуждений в математике. Заметим, что мы доказали, что, если производная \textstyle a(x,t) по \textstyle x непрерывна, то решение единственно. Для разрывной производной может появиться более одного решения.

\textstyle \bullet Большинство уравнений имеют единственное решение. Однако бывают и исключения. Рассмотрим пример:

 \frac{dx}{dt} = 3 x^{2/3}\;\;\;\;\;\;\;\;\;\;=>\;\;\;\;\;\;\;\;\;\;x^{1/3} = x^{1/3}_0 + t-t_0.
(5.29)

Если начальное условие \textstyle x_0=x(0)=0, то формально решение имеет вид \textstyle x=t^3. Однако несложно проверить, что следующая функция также является решением (5.29) и удовлетворяет начальным условиям \textstyle x(0)=0:

File:x3_dif_eq.png

где \textstyle Tпроизвольное число. Причина неоднозначности - в нарушении условия Липшица (бесконечность производной \textstyle a'(x)=2/x^{1/3} в \textstyle x=0). В реальном Мире, если некоторая система описывается (5.29), то она не сдвинется из начального состояния \textstyle x(0)=0, если "решает" уравнение итерациями. Спустя произвольный момент времени \textstyle T может произойти внешнее воздействие (флуктуация), которое "столкнёт" итерационный процесс с нулевой отметки. Это и приведёт к неоднозначному решению (\textstyle \lessdot C).

\textstyle \bullet Кроме неоднозначности, с решениями уравнений может произойти ещё одна неприятность. Рассмотрим следующую задачу:

\frac{dx}{dt} = x^2\;\;\;\;\;\;\;\;\;\;=>\;\;\;\;\;\;\;\;x(t)=\frac{x_0}{1-(t-t_0)x_0}.

Через конечное время \textstyle t-t_0=1/x_0 от начального момента решение обращается в бесконечность. Подобная ситуация называется "взрывом решения". За редкими исключениями подобные модели не соответствуют реальным системам или являются лишь их грубым приближением.

\textstyle \bullet С начальным условием дифференциального уравнения связана одна тонкость. Не любая функция \textstyle x=f(x_0, t_0, t) со значением \textstyle x_0=f(x_0,t_0,t_0) удовлетворяет хоть какому-то дифференциальному уравнению первого порядка. Так, в производной по времени функции \textstyle x=x_0+\sin (t-t_0) никакими заменами и выбором \textstyle a(x,t) не удастся одновременно избавиться и от \textstyle x_0, и от \textstyle t_0. Подставляя в уравнение решение \textstyle x=f(x_0,t_0,t), мы должны так его преобразовать, чтобы константы \textstyle x_0, \textstyle t_0, являющиеся "внешними" к уравнению начальными условиями, сократились.

\textstyle \bullet Перейдём теперь к стохастическим дифференциальным уравнениям. Так как мы работаем со случайными процессами, различные реализации траектории \textstyle x(t) могут отличаться сколь угодно сильно. Говоря о единственности решения, мы подразумеваем единственность плотности вероятности \textstyle P(x_0, t_0 \Rightarrow x, t), которая влечёт за собой единственность среднего значения, волатильности, автоковариационной функции и т.д.

Докажем, что для уравнения

dx = a(x,t)\, dt + b(x,t)\,\delta W

решение будет единственным, если производные по \textstyle x сноса \textstyle a(x,t) и волатильности \textstyle b(x,t) непрерывны. Непрерывность означает, что производные ограничены (нигде не обращаются в бесконечность):

\left|\frac{\partial a(x,t)}{\partial x}\right| \leqslant M_a,\;\;\;\;\;\;\;\;\left|\frac{\partial b(x,t)}{\partial x}\right| \leqslant M_b.

Поэтому в силу формулы Лагранжа каждая из них удовлетворяет неравенству Липшица:

 \begin{array}{lll} |a(y,t)-a(x,t)| &\leqslant &M_a\cdot |y-x|,\\ |b(y,t)\,-b(x,t)| &\leqslant &M_b\cdot |y-x|. \end{array}
(5.30)

Будем действовать так же, как и в детерминированном случае. Перейдём к интегральному уравнению:

x(t) = x_0 + \int\limits^t_{t_0} a\bigl(x(s),s\bigr)\, ds + \int\limits^t_{t_0} b\bigl(x(s),s\bigr)\,\delta W_s.

Пусть существуют две разные случайные функции \textstyle x_t=x(t) и \textstyle y_t=y(t) с одинаковым начальным условием \textstyle x(t_0)=y(t_0)=x_0, которые удовлетворяют этому уравнению. Найдём дисперсию их разности:

File:ito_eq07.png

где \textstyle a_{yx}(s)=a\bigl(y(s),s\bigr)-a\bigl(x(s),s\bigr), \textstyle b_{yx}(s)=b\bigl(y(s),s\bigr)-b\bigl(x(s),s\bigr) - разности сноса или волатильности, вычисленные для каждого решения.

Для двух \textstyle n - мерных векторов \textstyle \{\alpha_1,...,\alpha_n\} и \textstyle \{\beta_1,...,\beta_n\} скалярное произведение всегда меньше, чем произведение их длин (косинус угла между ними меньше единицы). Поэтому справедливо неравенство Коши - Буняковского:

(\alpha_1\beta_1+...+\alpha_n\beta_n)^2 \leqslant (\alpha^2_1+...+\alpha^2_n)\cdot(\beta^2_1+...+\beta^2_n).

Если все \textstyle \beta_i=1, имеем такой вариант этого неравенства:

(\alpha_1+...+\alpha_n)^2 \leqslant n\cdot(\alpha^2_1+...+\alpha^2_n).

В нашем случае \textstyle n=2, поэтому:

File:ito_eq08.png

Для первого интеграла (точнее, его интегральной суммы) снова применим неравенство Коши-Буняковского c \textstyle n=(t-t_0)/\Delta s. Среднее значение квадрата стохастического интеграла по \textstyle \delta W можно записать через среднее от обычного интеграла по времени (5.13), поэтому:

File:ito_eq09.png

Воспользуемся теперь неравенствами Липшица (5.30), возведя их в квадрат. В результате:

\left\langle (y_t-x_t)^2\right\rangle \leqslant M \int\limits^t_{t_0} \left\langle (y_t-x_t)^2 \right\rangle \, ds,

где \textstyle M=2(t-t_0)M^2_a+2M^2_b. Среднее разности решений \textstyle \left\langle (y_t-x_t)^2\right\rangle — это обычная функция времени, поэтому, применяя лемму Гронуолла — Беллмана (5.26), приходим к выводу, что \textstyle \left\langle (y_t-x_t)^2\right\rangle =0.

Среднее является интегралом с положительной плотностью вероятности. Величина \textstyle (y_t-x_t)^2 также положительна. Интеграл от положительной функции может быть равен нулю, только когда она равна нулю. В результате мы приходим к выводу, что \textstyle x(t)=y(t), и решение единственно.


Интегрирование стохастических уравнений << Оглавление >> Метод последовательных приближений

Стохастический мир - простое введение в стохастические дифференциальные уравнения