Теоретическая часть.
Парная регрессионная модель отражает зависимость между двумя переменными Y и X и имеет следующий вид:
Y= f (x) + ε,
Y – зависимая переменная
Х – независимая переменная
ε – случайное возмущение.
Спецификация парной линейной регрессии принимает вид:
Y=α+β*X+ε,
α и β — параметры данной модели, — случайное возмущение, удовлетворяющее предпосылкам Гаусса-Маркова.
Для проверки адекватности парной регрессионной модели необходимо, прежде всего, сформировать из общей выборки, обучающую и контролирующую выборки.
Обучающая выборка составляет около 90-95 % от общей выборки:
Yt |
Xt |
Y1 |
X1 |
Y2 |
X2 |
… |
… |
Yn-1 |
Xn-1 |
Yn |
Xn |
Затем методом наименьших квадратов производится оценка парной регрессионной модели (в частности находятся МНК-оценки параметров α иβ; оценки ско оценок параметров sα и sβ и оценка ско случайного возмущения s. Эту операцию можно выполнить с помощью статистической функции Excel ЛИНЕЙН. Выделяется область в два столбца и 5 строк (для парной линейной регрессии), вызывается мастер функции, в окне функции ЛИНЕЙН выделяется область значений Y, потом область значений X, затем, если присутствует константа, ставится 1, и статистика также задается единицей.
В итоге получается таблица, в которой в первой строке отражены значения оценок параметров модели, во второй строке содержатся оценки их ско.1
Далее, необходимо вычислить границы доверительного интервала для индивидуального значения эндогенной переменной, , из контролирующей выборки: Y-и Y+.
Для построения доверительного интервала используется дробь Стьюдента:
tp=Yp-Ypsр — нормированная ошибка прогноза эндогенной переменной Y,
– оценка дисперсии ошибки прогноза эндогенной переменной в точке t = p.
Применяя стандартную процедуру, перейдём от дроби Стьюдента к интервальной оценке.
Pt< tkp=1-∝ - доверительная вероятность, который выполняется неравенство в круглых скобках2, т.е. с вероятностью
t< tkp⟹
-tkp