Хелпикс

Главная

Контакты

Случайная статья





Линейная регрессия.



Линейная регрессия.

 Линейная регрессия — используемая в статистике регрессионная модель зависимости одной (объясняемой, зависимой) переменной от другой или нескольких других переменных (факторов, регрессоров, независимых переменных) с линейной функцией зависимости.

Пусть (X, У) — двумерная случайная величина, где X и Y — зависимые случайные величины. Оказывается возмож­ным приближенное представление величины Y в виде линейной функции величины X:

 

где а и b — параметры, подлежащие определению. Обычно эти величины определяются с помощью метода наименьших квад­ратов.

Определение 5.Функция (15.27) называется наилучшим при­ближением в смысле метода наименьших квадратов, если ма­тематическое ожидание

 M[Y - g(Х)]2 принимает наименьшее возможное значение. Функцию g(х) называют среднеквадрати­ческой регрессией Y на X.

ТЕОРЕМА Линейная средняя квадратическая регрес­сия Y на X имеет вид

 

где rxy определяется формулой (15.25)

,

my = M(Y) и тх = М(Х) — математические ожидания соответствен­но случайных величин Y и X.

Коэффициент b = rху σух называют коэффициентом ре­грессии Y на X, а прямую

 

реализующую линейную зависимость (15.28) случайной вели­чины Y от случайной величины X, называют прямой сред­неквадратической регрессии Y на X. Поскольку зависимость (15.28) является приближенной, то существует погрешность этого приближения, называемая остаточной дисперсией:

 

Аналогичную форму записи имеет прямая среднеквадрати­ческая регрессия X на Y:

 Пример 3. Найти линейную среднюю квадратическую регрес­сию и остаточную дисперсию случайной величины Yна случай­ную величину Xпо данным примеров 1 и 2.

РЕШЕНИЕ. Для двумерной случайной величины (X, Y), приведенной в примере 1, все необходимые числовые характе­ристики указаны в решении примера2: тх= 2,03, ту= 1,63, rху =-0,023, σх= √D(X)=0,793, σу= √D(Y) =0,483. Из уравнения(15.28) получаем искомое соотношение:

g(Х) =1,63 - 0,014(Х - 2,03).

Остаточная дисперсия рассчитывается по формуле (15.29):

 Для оценки среднеквадратичной погрешности линейной ре­грессии обычно используют величину σу, в нашем случае она составляет σу = 0,483.

 

 



  

© helpiks.su При использовании или копировании материалов прямая ссылка на сайт обязательна.