В данной теоретико-практической работе будут рассмотрены следующие показатели с 26.06.2014 по 13.11.2014 с периодом в один день: средневзвешенный курс рубля к доллару1 (эндогенный показатель Y), валютные интервенции Центрального Банка2 и объем торгов1 на Единой Торговой Системе1 (экзогенные показатели X и Z). Количество наблюдений - 100. Их выбором послужила текущая ситуация, а именно кризис на Украине и связанный с ней политический и экономический конфликт, а также вытекающие из этого последствия: курс национальной валюты по отношению к доллару начал падать, в ответ на эти действия ЦБ РФ проводил валютные интервенции, чтобы замедлить стремительное падение курса, что также являлось одной из причин увеличения объема торгов на биржевом и внебиржевом рынке в особенности. Эта взаимосвязь и является мотивом моего решения взять в качестве наблюдений вышеописанные показатели.
В 1 задании будут рассмотрены только 2 показателя, т.е. один экзогенный и одни эндогенный.
I. Построим диаграмму рассеивания, используя статистические данные по X и Y:
Здесь мы видим, что Центральный Банк больше всего реагировал, то есть проводил валютные интервенции, при курсе от 34 до 40 (руб./долл.) и, после, заметно сократил выход на рынок, так как данный метод не помогал в сложившейся ситуации, и необходимо было менять тактику. Что собственно и произошло: ЦБ отменил валютный коридор и прекратил проводить частые валютные интервенции, а также предупреждать о них.
II. Рассмотрим эконометрические модели парной регрессии на основе следующих функций:
А) линейной Y=a0+a1X ;
Y=a0+a1X + u
E (u | X) = 0, E (u2 | X) = σu2
Б) степенной Y=a0X;
Y=a0X (u + 1)
E (u | X) = 0, E (u2 | X) = σu2
В) гиперболической Y=a0+a1/X.
Y=a0+a1/X + u
E (u | 1/X) = 0, E (u2 | 1/X) = σu2
где, Y – средневзвешенный курс (руб./долл.),
X1- объем торгов на ЕТС (Единая торговая система) (млн. руб.),
Для каждой модели оценим качество спецификации при помощи F- теста и дадим экономическое объяснение значения R2.
Показатель F вычисляется по формуле:
F = R2k(1- R2)(n-k+1) , где k - количество регрессоров в модели (k = 1), n - объем выборки (n = 100), R2 - коэффициент детерминации находится с помощью функции ЛИНЕЙН в Excel, который стоит в третьей строчке первого столбца.
Показатель Fкрит. вычисляется через функцию в Excel, которая называется FРАСПОБР, где степени свободы вычисляются: v1 = k = 1, v2 = n - (k + 1) = 98 и вероятностью - 0.95. После нахождения F и Fкрит проверяем справедливость неравенства
F ≤ Fкрит
Если оно справедливо, то принять гипотезу (H0: a1 = a2 = ... = ak = 0 - ситуация совершенно плохой спецификации модели) и сделать вывод о неудовлетворительном качестве регрессии, т.е. об отсутствии какой-либо объясняющей способности регрессоров в рамках модели.
Напротив, когда неравенство несправедливо - следует отклонить гипотезу в сторону альтернативы. Другими словами, сделать вывод о том, что качество регрессии удовлетворительно, т.е. регрессоры в рамках линейной модели обладают способностью объяснять значения эндогенной переменной y.
а) В результате проделанных вычислений R2 = 0,27, что говорит о плохой спецификации, но при этом было бы неправильно делать окончательное решение только на основе коэффициента детерминации, т.к. он зависит от выборки (y, X) и поэтому является случайной переменной, поэтому был проведен F-тест, где F = 35,63 > Fкр.= 0,0039, что в свою очередь говорит о том, что регрессор в рамках линейной модели обладает способностью объяснить значение эндогенной переменной Y.
б) В результате проделанных вычислений R2 = 0,26, что говорит о плохой спецификации, но при этом было бы неправильно делать окончательное решение только на основе коэффициента детерминации, т.к. он зависит от выборки (y, X) и поэтому является случайной переменной, поэтому был проведен F-тест, где F = 35,02 > Fкр.= 0,0039, что в свою очередь говорит о том, что регрессор в рамках линейной модели обладает способностью объяснить значение эндогенной переменной Y.
Хочу также отметить, что данный тест предназначен для функций линейного вида, поэтому я "линеаризовал" данное уравнение путем его логарифмирования, который будет описан более подробно в III пункте.
в) В результате проделанных вычислений R2 = 0,23, что говорит о плохой спецификации, но при этом было бы неправильно делать окончательное решение только на основе коэффициента детерминации, т.к. он зависит от выборки (y, X) и поэтому является случайной переменной, поэтому был проведен F-тест, где F = 28,9 > Fкр.= 0,0039, что в свою очередь говорит о том, что регрессор в рамках линейной модели обладает способностью объяснить значение эндогенной переменной Y.
III. Проверка адекватности полученных моделей (с 95-% вероятностью) через интервальное прогнозирование.
Шаг 1. Результаты наблюдений объекта-оригинала (выборку) следует разделить на два класса. В первый класс, именуемый, как известно, обучающей выборкой, включить основной объем результатов наблюдений объекта-оригинала (90 - 95% выборки). Оставшиеся результаты наблюдений (Y13.11.2014; X13.11.2014) составят контролирующую выборку.
Шаг 2. По обучающей выборке (y, X) оценить модель. Найти среднеквадратичную ошибку σu через функцию ЛИНЕЙН в Excel, ошибку прогноза по следующей формуле
Sy0= σu q0+ 1,
и показатели q0 -
q0 = 1n + (x2- x)2i=1n(xi- x)2 - для парной регрессии
q0 = X0 (XTX)-1X0T- для множественной регрессии
Шаг 3. Задаться доверительной вероятностью 1 - а и по значениям регрессоров, входящих в контролирующую выборку (X13.11.2014), построить доверительные интервалы для соответствующих этим регрессорам значений эндогенной переменной модели (Y13.11.2014). Доверительные интервалы рассчитываются по следующим формулам
y0min = y0 - Sy0 * tкр.
y0max = y0 + Sy0 * tкр.
, где tкр. вычисляется через функцию в Excel СТЬЮДРАСПОБР с вероятностью 0,05 v2 = n - (k +1) = 98
Шаг 4. Проверить, попадают ли значения эндогенной переменной из контролирующей выборки (Y13.11.2014) в соответствующие доверительные интервалы (y13.11.2014min, y13.11.2014max). Если да, то признать оцененную модель адекватной, если же нет, то оцененная модель не может быть признана адекватной и подлежит доработке.
а) Y = 32,93+ 0.001X + U
(Sa0= 0.81) (Sa1= 0.00016) (σu = 2.72)
Так как значение Y13.11.2014 = 46,36 эндогенной переменной не попадает в доверительный интервал [31,54; 42,42], то делаем вывод, что оцененная модель не адекватна и, следовательно, не может быть использована.
б) Для степенной функции для начала преобразуем модель путем логарифмирования к модели множественной линейной регрессии.
Y = a0X (1 + u)
E (u| X) = 0, E (u2 | X) = σu2
lnY = lna0 + a1lnX + u
E (u| X) = 0, E (u2 | X) = σu2
Теперь проводим оценку через функцию ЛИНЕЙН как для обычной линейной функции и получаем оцененную модель
lnY = 2.52 + 0.13lnX + U
(Sa0= 0.18) (Sa1= 0.02) (σu = 0.07)
и конечную оцененную модель, преобразованную обратно в степенную
Y = 12, 45 + X0, 13(1 + u)
(Sa0= 2,19) (Sa1= 0.02) (σu = 0.07)
В итоге, так как значение Y13.11.2014 = 3,84 эндогенной переменной не попадает в доверительный интервал [13,4; 13,68], то делаем вывод, что оцененная модель не адекватна и, следовательно, не может быть использована.
в) Y = 42,72 + (-20837)X + U
(Sa0= 0.91) (Sa1= 3665,107) (σu = 2.82)
Так как значение Y13.11.2014 = 46,36 эндогенной переменной не попадает в доверительный интервал [31,82; 43,1], то делаем вывод, что оцененная модель не адекватна и, следовательно, не может быть использована.
IV. Исследование адекватности условий теоремы Гаусса-Маркова для случайных остатков каждой модели из пункта II. Сделать выводы.
Тест Дарбина-Уотсона
Шаг 1. По уравнениям наблюдений объекта следует вычислить МНК - оценки и оценки случайных остатков
Шаг 2. Вычислить величину DW = t=2n(ut-ut-1)2t=1nut2
Шаг 3. Из таблицы, составленной Дарбином и Уотсоном, выбираем две величины dL и dU, исходя из количества уравнений n = 100 и количеству объясняющих переменных k =1. В результате dL = 1,65 и dU = 1,69
Шаг 4. Проверить, в какое из пяти подмножеств M1, M2, M3, M4, M5, интервала (0, 4) попала величина DW. При проведении вышеописанных шагов получилось:
а) Величина DW = 0,29 попала в множество M1 = (0, dL], поэтому принимается альтернативная гипотеза H1: Cov (ui, uj) > 0 при j = i - 1
б) Величина DW = 1,55E-05 попала в множество M1 = (0, dL], поэтому принимается альтернативная гипотеза H1: Cov (ui, uj) > 0 при j = i - 1
в) Величина DW = 0,29 попала в множество M1 = (0, dL], поэтому принимается альтернативная гипотеза H1: Cov (ui, uj) > 0 при j = i - 1
В итоге во всех трех случаях случайные остатки подвержены положительной автокорреляции, что говорит об ошибочной спецификации модели.
Тест Голдфилда-Квандта
Шаг 1.Уравнение наблюдений упорядочим по возрастанию суммы модулей значений предопределенных переменных модели.
Шаг 2. По первым n' упорядоченным уравнениям наблюдений объекта (где n' удовлетворяет условиям: k + 1 < n'; n' 0.3n; k + 1 - количество оцениваемых коэффициентов функции регрессии) вычислить МНК-оценки параметров модели и величину
ESS1 = i=1n'ui2, где ui = yi-yi - МНК - оценка случайного возмущения ui
Шаг 3. По последним n' упорядоченным уравнениям наблюдений вычислить МНК - оценки параметров модели и величину ESS, которую обозначим ESS2
Шаг 4. Вычислить статистику GQ = ESS1ESS2
Шаг 5. Задаться уровнем значимости а (=0.05) и с помощью функции FРАСПОБР Excel при количествах степеней свободы V1, V2, где v1 = v2 = n' - (k + 1), определить (1 - а) - квантиль, Fкрит = F1-a распределения Фишера
Шаг 6. Принять гипотезу о равенстве дисперсий случайных остатков в уравнении наблюдений, если справедливы неравенства:
GQ≤Fкрит
GQ-1≤Fкрит
В нашем случае:
а) Неравенства выглядят следующим образом: GQ = 0,0095 < Fкрит = 0,55; GQ-1 = 10,47 > Fкрит = 0,55, следовательно случайный остаток можно полагать гетероскедастичным.
б) Неравенства выглядят следующим образом: GQ = 0,15 < Fкрит = 0,55; GQ-1 = 6,9 > Fкрит = 0,55, следовательно случайный остаток можно полагать гетероскедастичным.
в) Неравенства выглядят следующим образом: GQ = 0,1 < Fкрит = 0,55; GQ-1 = 10,5 > Fкрит = 0,55, следовательно случайный остаток можно полагать гетероскедастичным.
Тест на нулевое математическое ожидание
В данном случае мы можем вычислить только прогнозное математическое ожидание случайных остатков по формуле:
M(Ut)= u, u = y - y
Соответственно, если данный показатель приближен к нулю, то тест считается выполненным.
а) M= -2,70006E-15 - выполняется
б) M= -10,20928173 - не выполняется
в) M= -0,56049177 - не выполняется
V. Выводы
Линейная |
Степенная |
Гиперболическая |
|
F-тест |
+ |
+ |
+ |
R2 |
- |
- |
- |
Адекватность |
- |
- |
- |
Тест Голдфилда-Квандта |
- |
- |
- |
Тест Дарбина-Уотсона |
- |
- |
- |
M(Ut) 0 |
+ |
- |
- |
Подводя итог, можно утверждать, что ни одна из приведенных моделей не объясняет выбранные показатели. На самом деле экономическая зависимость между выбранными мной показателями существует.
Задание 2.В данном задании был добавлен еще один показатель - валютные интервенции Центрального Банка. Те дни, где ЦБ не осуществлял выхода на рынок, было поставлено значение равное 1. Статистические данные взяты с 26.06.2014 по 13.11.2014. Получившуюся модель множественной регрессии проверим на качественность спецификации и адекватность, используя интервальный метод прогнозирования.
Y=a0+a1X+а2Z+u
E (u | X, Z) = 0, E (u2 | X, Z) = σu2
где Y – средневзвешенный курс (руб./долл.),
X1- объем торгов на ЕТС (Единая торговая система) (млн. руб.),
X2- объем валютных интервенций ЦБ (млн. руб.).
I. Проверка качественности модели с помощью коэффициента детерминации и F-теста.
В результате проделанных вычислений R2 = 0,30, что говорит о "средней или заметной" спецификации, но при этом было бы неправильно делать окончательное решение только на основе коэффициента детерминации, т.к. он зависит от выборки (y, X) и поэтому является случайной переменной, поэтому был проведен F-тест, где F = 41,93 > Fкр.= 0,05, что в свою очередь говорит о том, что регрессор в рамках линейной модели обладает способностью объяснить значение эндогенной переменной Y.
II. Проверка на адекватность линейной модели множественной регрессии интервальным методом.
Методология процесса решения описана в задании 1. Единственное отличие - подсчет показателя q0. В данном случае рассчитывается по формуле для множественной регрессии (см. задание 1 пункт III).
Так как значение Y13.11.2014 = 46,36 эндогенной переменной не попадает в доверительный интервал [24,5; 35,12], то делаем вывод, что оцененная модель не адекватна и, следовательно, не может быть использована.
Y = 33,93 +0,00075X - 0,001Z+ U
(Sa0= 0.89) (Sa1= 0.0002) (Sa1= 0.00044) (σu = 2.66)
В итоге хочу отметить, что статистические данные были взяты за короткий срок, но сама выборка была очень большая, чтобы показать точность наблюдений. Сами показатели: курс рубля, объем торгов на бирже, и валютные интервенции Центрального Банка зависимы, исходя из данных полученных при проверке модели на качество (как в 1, так и во 2 задании), но все же данную спецификацию использовать нельзя, так как модель не адекватна и предпосылки Гаусса-Маркова не выполняются (задание 1). Также можно предположить, что более заметная связь будет если взять не биржевой валютный рынок, а внебиржевой, так как банки, в связи с большими задолженностями по зарубежным кредитам и нехваткой денежных средств (из-за санкций) вынуждены торговать против рубля, что, на мой взгляд, провоцирует его падение и кроме того объемы операций кредитных организаций значительно больше.
Список источников:
http://www.cbr.ru/hd_base/default.aspx?prtid=valint_day&pid=idkp_br&sid=ITM_45393 - сайт ЦБ по объемам валютных интервенций
http://www.cbr.ru/hd_base/?PrtID=micex_doc&pid=finr&sid=m1_4 - сайт ЦБ по курсу (руб./долл.) и объему торгов на ЕТС
Эконометрика: учеб. пособие /В.А. Бывшев. - М.: Финансы и статистика, 2008. - 480 с.: ил.
1 - показатели были взяты с расчетами на "завтра" (сайт ЦБ: http://www.cbr.ru/hd_base/default.aspx?PrtID=micex_doc&pid=finr&sid=m1_4)
2 - (сайт ЦБ) http://www.cbr.ru/hd_base/default.aspx?prtid=valint_day&pid=idkp_br&sid=ITM_45393