Линейная зависимость — различия между версиями

Материал из synset
Перейти к: навигация, поиск
(Новая страница: «{| width="100%" | width="40%"|Стохастическая зависимость << ! width="20%"|[[Стохастический мир|Оглавлени…»)
 
Строка 17: Строка 17:
 
:<center><math> \sigma^2_\xi = \left\langle \xi^2\right\rangle  = \left\langle (y-\alpha - \beta\, x)^2\right\rangle  = min. </math></center>
 
:<center><math> \sigma^2_\xi = \left\langle \xi^2\right\rangle  = \left\langle (y-\alpha - \beta\, x)^2\right\rangle  = min. </math></center>
  
Взяв производные по <math>\textstyle \alpha</math> и <math>\textstyle \beta</math>, можно (<math>\textstyle \lessdot</math> H) найти уравнение ''регрессионной прямой''. Её наклон <math>\textstyle \beta</math> равен:
+
Взяв производные по <math>\textstyle \alpha</math> и <math>\textstyle \beta</math>, можно найти уравнение ''регрессионной прямой''. Её наклон <math>\textstyle \beta</math> равен:
  
 
:<center><math> \beta = \frac{\left\langle xy\right\rangle -\left\langle x\right\rangle \left\langle y\right\rangle }{\left\langle x^2\right\rangle -\left\langle x\right\rangle ^2} = \frac{\left\langle (x-\bar{x})(y-\bar{y})\right\rangle }{\sigma^2_x}. </math></center>
 
:<center><math> \beta = \frac{\left\langle xy\right\rangle -\left\langle x\right\rangle \left\langle y\right\rangle }{\left\langle x^2\right\rangle -\left\langle x\right\rangle ^2} = \frac{\left\langle (x-\bar{x})(y-\bar{y})\right\rangle }{\sigma^2_x}. </math></center>

Версия 15:20, 27 января 2010

Стохастическая зависимость << Оглавление >> Характеристическая функция


Простейшая связь между двумя случайными величинами и — это линейная зависимость . В общем случае может существовать третья случайная величина , которую мы интерпретируем, как "внешний" случайный шум. Результирующая модель с константами и имеет вид:

С этого уравнения обычно начинается поиск связей между эмпирическими величинами.

Обычно считают, что среднее шума равно нулю . В противном случае его можно включить в параметр . Потребуем, чтобы дисперсия "шума" (ошибка модели) была минимальной:

Взяв производные по и , можно найти уравнение регрессионной прямой. Её наклон равен:

Итоговое уравнение мы запишем в симметричном виде пропорциональности безразмерных отклонений величин от своих средних:

Коэффициент этой пропорциональности называется корреляцией:

В его числителе находится ковариационный коэффициент ().

Корреляция между двумя величинами , не всегда означает наличие причинной связи или . Например, может существовать третья величина , влияющая и на , и на , синхронизируя их поведение. Так, спад мировой экономики оказывает одинаковое воздействие на две не связанные друг с другом экспортно-ориентированные отрасли экономики. "Ложная" корреляция возникает также, если две величины имеют явно выраженный восходящий или нисходящий тренд (систематический рост или спад). В этом случае между ними будет появляться заметная корреляция. Эта корреляция характеризует наличие детерминированной составляющей роста ( C).

Корреляционный коэффициент определяет наклон регрессионной прямой. Однако важнее то, что он служит мерой прогностических возможностей линейной модели. Покажем это, подставив в значение наклона () исходное уравнение (). Учтём, что и :

Поэтому , что позволяет нам вычислить дисперсию :

Так как , получаем выражение для относительной ошибки модели:

Значение волатильности шума можно рассматривать как ошибку линейной модели . Полезно сравнивать её с волатильностью , которая является типичной ошибкой тривиальной модели . Мы видим, что такая относительная ошибка зависит от корреляционного коэффициента. Чем ближе к единице его квадрат, тем меньше ошибка. При нулевом относительная ошибка равна единице, и, следовательно, линейная модель имеет такую же предсказательную силу, как и тривиальное утверждение о том, что лучшим прогнозом будет его среднее значение. Часто говорят о коэффициенте детерминации . Заметим также, что коэффициент корреляции по модулю всегда меньше единицы .

Уравнение линейной модели () может интерпретироваться по-разному.

1) Прежде всего, это модель прогнозирования , если стало известно (в духе ). В этом случае — это внешний шум или ошибка модели, когда "истинная" зависимость между и не такая простая. В результате шума всегда оказывается случайной величиной. В отношении возможны различные ситуации. Например, при изучении кривой спроса может быть контролируемой и задаваемой исследователем ценой товара (например, с равным шагом). В этом случае она детерминирована. Однако разброс в её значениях позволяет формально определить среднее и волатильность .

2) Часто бывает, что и , и выступают в качестве равноправных случайных величин. Например, на фондовом рынке ежедневные изменения цен акций двух компаний и стохастически связаны друг с другом. Обе величины случайны и не зависят от исследователя.


Стохастическая зависимость << Оглавление >> Характеристическая функция

Стохастический мир - простое введение в стохастические дифференциальные уравнения