Для выполнения данного задания, в первую очередь, необходимо построить спецификацию и собрать необходимые статистические данные. (см. Приложение 1)
По оси Y расположены расходы на оплату обязательных платежей и разнообразных взносов в Краснодарском крае за 2008-2013 гг., а по оси X - среднедушевые денежные доходы населения, соответственно.
Рис.1.1 Диаграмма рассеивания
Рассматривая представленную диаграмму рассеивания, мы можем утверждать, что факторы X и Y имеют ничтожно слабую обратную (наклон линии тренда - отрицательный) связь между собой. Оперируя данными фактами, мы можем выдвинуть гипотезу об отсутствии функциональной зависимости между данными факторами. Об этом свидетельствует сильное отклонение множества точек со значениями (Xi;Yi) от линии тренда, которая максимально возможно показывает возможную корреляцию между X и Y.
Таблица 1.1__
Тип функции |
Спецификация модели |
Преобразование |
а) Линейная функция |
- |
|
б) Степенная функция |
yt=lnYt xt=ln(Xt) |
|
в) Гиперболическая функция |
yt=Yt xt=1/Xt |
После того, как модели были построены, мы можем приступать к их оценке и проведению F-теста, который покажет качество регрессии в наших моделях, а также рассмотрению и экономическому объяснению значения коэффициента детерминации R2, который, в свою очередь, покажет нам тесноту связи данных показателей.
Оцененные модели, полученные посредством использования функции ЛИНЕЙН, выглядят слкдующим образом
а) Линейная
Yt=9,968-0,00004X2++UtMUt=0DUt=1,169б) Степенная
Yt=3,241Xt-0,107+(Ut+1)MUt=0DUt=0,138
в) Гиперболическая
Yt=8,226+13931,045Xt+UtMUt=0DUt=1,173
Для удобства проведения анализа рассчитанных показателей мы представим полученные результаты в виде таблицы:
Таблица 1.2
Функция |
Коэффициент детерминации |
F - тест |
а) Линейная |
R2=0,0632 |
F=4,73>Fкр=0,004 |
б) Степенная |
R2=0,0634 |
F= 4,74>Fкр=0,004 |
в) Гиперболическая |
R2=0,0581 |
F= 4,33>Fкр=0,004 |
Таким образом, как можно увидеть из данных таблицы, условия F-теста выполняются во всех моделях. Это говорит о том, что регрессия в данных моделях представлена качественно. Что абсолютно нельзя сказать о результатах полученных данных коэффициента детерминации. Как известно, R2 может принимать значения от 0 до 1, и чем ближе данный показатель к единице, тем сильнее связь между X и Y. В нашей ситуации, как можно отчетливо видеть, значения данного коэффициента находится около 0,06, что говорит нам об отсутствии (или очень слабой) зависимости между расходами на обязательные платежи и взносы и средним душевым доходом населения.
Для выполнения данного пункта нам потребовалось провести расчеты случайных остатков для каждой модели: Yt~=Yt-(a0+a1Xt).
Как известно, существует три основных условия(предпосылки) теоремы Гаусса-Маркова:
Математическое ожидание случайных остатков равно нулю.
Таблица 1.3
Функция |
Математическое ожидание Ut |
а) Линейная |
MUt= 2,22E-15 |
б) Степенная |
MUt= 5,80E-16 |
в) Гиперболическая |
MUt= 4,22E-15 |
В рамках данной задачи мы не получили ни одного нуля, но, рассмотрев полученные результаты, можно сделать выводы, о том, что эти числа являются очень маленькими (максимально стремятся к нулю), поэтому во всех трех моделях первое условие выполняется в полном объеме.
Проверка остатков на гомо/гетероскедастичность. Тест Голдфельда-Квандта.
Таблица 1.4
Функция |
Fкр |
Тест Голдфельда-Квандта |
|
а) Линейная |
Fкр=2,05 |
> |
GQ=0,61 |
> |
GQ-1=1,64 |
||
б) Степенная |
Fкр=2,05 |
> |
GQ=0,49 |
GQ=1,63 |
|||
> |
GQ-1=0,61 |
Таким образом, данная предпосылка выполняется только для линейной и гиперболической функций. Значит остатки этих моделей гомоскедастичны, а у степенной, у которой тест GQ не выполнен в полном объеме мы можем утверждать о гетероскедастичности остатков.
Проверка остатков на наличие автокорреляции. Тест Дарбина-Уотсена.
В рамках данного теста нами выдвигается гипотеза H1, в которой строится предположение об отсутствии корреляции между остатками модели.
Произведем расчет показателя: DW=(Ut~-Ut-1~)2ESS.
Для проведения теста и определения результата необходимо обратиться к таблице граничных значений dl, du теста Дарбина-Уотсона при уровне значимости 5%, n=72, k=1. (k –количество регрессоров).
а) Линейная функция:
Таблица 1.5
Показатель |
Значение |
Комментарии |
DW |
1,18 |
Данное значение приемлемо (< 2) |
dl |
1,58 |
- |
du |
1,64 |
- |
б) Степенная функция:
Таблица 1.6
Показатель |
Значение |
Комментарии |
DW |
1,18 |
Данное значение приемлемо (< 2) |
dl |
1,58 |
- |
du |
1,64 |
- |
в) Гиперболическая функция
Таблица 1.7
Показатель |
Значение |
Комментарии |
DW |
1,20 |
Данное значение приемлемо (< 2) |
dl |
1,58 |
- |
du |
1,64 |
- |
На основании рассчитанных данных мы можем сделать вывод о том, что ни в одной модели выдвинутая нами гипотеза не подтверждается, т.е. значение DW попадает в интервал M1 , в котором говорится о наличии между остатками положительной автокорреляции. Таким образом, проведя данный тест, мы не можем утверждать, что наши случайные остатки независимы и не связанны между собой.
Для проведения проверка данных моделей на адекватность для указанных периодов пришлось расширить имеющиеся статистические данные, включив в таблицу значения для первых трех месяцев 2014 года.
Так как модель данной задачи представляет собой модель парной регрессии, то мы можем воспользоваться методом интервального прогнозирования:
а) Линейная модель
Рис.1.2 Проверка адекватности линейной модели интервальным методом.
Все три контрольных выборки удовлетворяют условиям адекватности, следовательно мы можем утверждать о том, что данная модель адекватна.
б) Степенная модель
Рис.1.3 Проверка адекватности степенной модели интервальным методом.
В данном случае мы можем увидеть абсолютно обратную картину, степенная модель не является актуальной ни по одному контрольному периоду, поэтому данная модель неадекватная. Таким образом, данная модель не будет допущена к отбору наилучшей.
в) Гиперболическая модель
Рис.1.4 Проверка адекватности гиперболической модели интервальным методом.
Все три контрольных выборки удовлетворяют условиям адекватности, следовательно, мы можем утверждать о том, что данная модель адекватна.
Для проведения сравнительного анализа полученных моделей и выявления лучшей из них в добавок к уже представленным данным необходимо провести оценку качества регрессоров в моделях (t-тест).
Таблица 1.8
Функция |
tкр |
Значение t |
|
а) Линейная |
tкр= 1,99 |
|