МОДЕЛИРОВАНИЕ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ ЕВРЕЙСКОЙ АВТОНОМНОЙ ОБЛАСТИ - Студенческий научный форум

VII Международная студенческая научная конференция Студенческий научный форум - 2015

МОДЕЛИРОВАНИЕ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ ЕВРЕЙСКОЙ АВТОНОМНОЙ ОБЛАСТИ

Сардарян Ш.Г. 1
1Финансовый университет при Правительстве Российской Федерации
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Задание 1.

Используя информацию Росстата по регионам России, рассмотреть ежемесячные данные за 2008-2013 годы по показателям:

Y – расходы населения на оплату обязательных платежей и разнообразных взносов,

X – среднедушевые денежные доходы населения,

построить эконометрическую модель по прогнозированию уровня обязательных платежей в отдельных регионах РФ.

Денежные доходы населения включают доходы лиц, занятых предпринимательской деятельностью, выплаченную заработную плату наемных работников (начисленную заработную плату, скорректированную на изменение просроченной задолженности), социальные выплаты (пенсии, пособия, стипендии, страховые возмещения и прочие выплаты), доходы от собственности в виде процентов по вкладам, ценным бумагам, дивидендов и другие доходы.

Среднедушевые денежные доходы населения (в месяц) исчисляются делением годового объема денежных доходов на 12 и на среднегодовую численность населения.

В структуре использования денежных доходов населения расходы населения на оплату обязательных платежей и разнообразных взносов занимают значимое место, так как к таким платежам относятся налоги, которые в свою очередь является основной статьей дохода бюджета страны.

Сформулируем следующую гипотезу о взаимосвязи среднедушевых денежных доходов населения и среднедушевых расходов населения на обязательные платежи разнообразные взносы на основании вышесказанного и рис. №1:

Чем выше показатель X (среднедушевые денежные доходы населения), тем больше расходов населения на оплату обязательных платежей и разнообразных взносов(Y), предположим, что между нашими переменными наблюдается линейная зависимость.

Чтобы доказать выдвинутую гипотезу, построим несколько типов эконометрических моделей, которые будут характеризовать взаимосвязь Y от X, проанализировав их, выберем самую лучшую модель.

Статистические данные к задаче по субъекту РФ (Еврейская автономная область):

Год

Среднедушевые денежные доходы в месяц (руб.)

Среднедушевые денежные расходы на обязательные платежи и разнообразные взносы (руб.)1

2000

1489

80

2001

2029

116

2002

3081

185

2003

4062

284

2004

4975

363

2005

6269

451

2006

7396

651

2007

8443

887

2008

10877

1240

2009

13646

1324

2010

15348

1458

2011

16525

1801

2012

18450

2122

2013

20417

2450

Таблица №1

Диаграмма рассеивания уровней среднедушевого денежного доходы в месяц и среднедушевых денежных расходов на обязательные платежи и разнообразные взносы Еврейской автономной области, построенная по данным табл. №1

Рисунок № 1

Теперь можно переходить к рассмотрению эконометрических моделей парной регрессии на основе следующих функций:

А) линейной Y=a0+a1X ;

Б) степенной Y=a0X;

В) гиперболической Y=a0+a1/X

Перейдем к сравнительному анализу наших моделей.2

Для каждой модели оценим качество спецификации при помощи F- теста и дадим экономическое объяснение значения R2:

Коэффициент детерминации есть объясненная регрессорами в рамках обучающей выборки доля эмпирической дисперсии эндогенной переменной Y. Величина R2 зависит от выборки и поэтому является случайной переменной. Последнее обстоятельство снижает уровень объективности заключения о качестве спецификации модели, сделанного лишь на основании значения коэффициента детерминации. Чтобы придать суждению о качестве спецификации модели большую объективность, используется F-тест.

Коэффициент детерминации модели равен доле эмпирической дисперсии переменной Y, которая в рамках обучающей выборки объясняется в модели ее регрессорами, в нашем случаи регрессором X.

Величина R2 заключена в неравенство:

Если R2 = 1, то значение Yiпеременной Y полностью объясняется в выборке значениями Xi регрессора X, поскольку ESS = 0 и, следовательно,

при i=1,2,3 …n.

Напротив, когда R2 =0, то спецификация совершенно плоха, так как в рамках модели регрессор X абсолютно неспособен объяснить значения переменной Y.

  1. Y=a0+a1X

Оцененная модель линейной функции выглядит следующим образом:

R2 =0,982,а это значит, что в рамках данной обучающей выборки величина текущих расходов на обязательные платежи и разнообразные взносы(Yt) примерно на 98 % объясняется текущим значением среднедушевого денежного доходы в месяц (Xt). Заметим, что очень большое значение R2 позволяет констатировать хорошее качество спецификации нашей модели (А).

Тем не менее, помня о стохастическом характере R2 , исследуем качество спецификации при помощи F-теста:

F = 652, 13

Fкрит. = 4, 75

Поскольку в данном случае неравенство F ≤ Fкрит. несправедливо, подтверждаем хорошее качество спецификации.

Б) Y=a0X;

Оцененная модель линеаризованной функции выглядит следующим образом:

R2 =0,993, большое значение R2 позволяет констатировать хорошее качество спецификации нашей модели (Б).

Все-таки, помня о стохастическом характере R2 , исследуем качество спецификации при помощи F-теста:

F=1908, 95

Fкрит. =4, 75

Поскольку в данном случае неравенство F ≤ Fкрит. несправедливо, подтверждаем хорошее качество спецификации.

В) Y=a0+a1/X

Оцененная модель линеаризованной функции выглядит следующим образом:

R2 =0, 55, такое значение R2 позволяет констатировать среднее качество спецификации нашей модели (В).

Тем не менее, исследуем качество спецификации при помощи F-теста:

F=14, 5

Fкрит. =4, 75

В данном случае неравенство F ≤ Fкрит. несправедливо, значит, спецификация имеет хорошее качество.

Исследуем адекватность условий теоремы Гаусса-Маркова для случайных остатков каждой модели (А, Б, В).

Условия теоремы Гаусса - Маркова.

Пусть в уравнениях наблюдений,

Утверждение теоремы Гаусса-Маркова:

А)

Прежде чем проводить тест, убедимся, что .

=-8,52651×E-13, значит, предпосылка: E(u1) = E(u2) = ….= E(un) = 0, выполняется.

Тест Голдфела-Квандта гипотезы о гомоскедастичности остатков показал следующие результаты:

 

GQ =0, 03≤ Fкрит. =9, 28

GQ-1=39,8 ≤ Fкрит. =9, 28

Второе неравенство несправедливо, поэтому предпосылку о гомоскедастичности случайного остатка в модели (А) отклоняем.

Б)

Прежде чем проводить тест, убедимся, что .

= -4,44089×E-14, значит, предпосылка: E(u1) = E(u2) = ….= E(un) = 0, выполняется.

Тест Голдфела-Квандта гипотезы о гомоскедастичности остатков показал следующие результаты:

GQ =0, 7 ≤ Fкрит. =9, 28

GQ-1=1,4 ≤ Fкрит. =9, 28

Оба неравенства справедливы, поэтому нет основания полагать неадекватной предпосылку о гомоскедастичности случайного остатка в модели (Б).

Теперь выполним проверку адекватности предпосылки о некоррелированности случайных остатков в системе уравнений нашей модели, т.е. об отсутствии автокорреляции случайного остатка в модели.

Определяем значение статистики:

DW = 1, 3

Выбираем константы при n=14, k=1: dL=1, 05;dU= 1,35.

Проверяем, в какое множество попала статистика.

Статистика DW попала в множество M2=( dL;dU), таким образом ни отклонить, ни принять гипотезу (Cov (ui, uj) = 0 при i ≠ j) при помощи данного теста не удается.

В)

Прежде чем проводить тест, убедимся, что .

=0, значит, предпосылка: E (u1) = E(u2) = ….= E(un) = 0, выполняется.

Тест Голдфела-Квандта гипотезы о гомоскедастичности остатков показал следующие результаты:

GQ =0, 2 ≤ Fкрит. =9, 28

GQ-1=4, 9 ≤ Fкрит. =9, 28

Оба неравенства справедливы, поэтому нет основания полагать неадекватной предпосылку о гомоскедастичности случайного остатка в модели (В).

Теперь выполним проверку адекватности предпосылки о некоррелированности случайных остатков в системе уравнений нашей модели, т.е. об отсутствии автокорреляции случайного остатка в модели.

Определяем значение статистики:

DW = 0, 26

Выбираем константы при n=14, k=1: dL=1, 05;dU= 1,35.

Проверяем, в какое множество попала статистика.

Статистика DW попала в множество M1=(0, dL], таким образом принимается альтернативная гипотеза: Cov (ui, uj) >0 при j=i-1.

Проверим адекватность моделей (с 95% вероятностью) через интервальное прогнозирование для 2013 года.

Доверительный интервал:

[,] – доверительный интервал

А)

Y0=2450 попадает в доверительный интервал: [=1960,=2478].

Так как значение эндогенной переменной из контролирующей выборки попало в доверительный интервал, можно признать нашу модель адекватной.

Б)

y0=7,8 попадает в доверительный интервал: [=7, 6=8,0].

Так как значение эндогенной переменной из контролирующей выборки попало в доверительный интервал, можно признать нашу модель адекватной.

В)

y0=2450 не попадает в доверительный интервал: [=191,5;=2363].

Так как значение эндогенной переменной из контролирующей выборки не попало в доверительный интервал, наша модель не может быть признана адекватной.

Итак, проанализировав модели А, Б, В, можно сделать следующие выводы:

  • Все три модели прошли F-тест, но модели A и Б с высоким показателем R2, а модель В-со средним.

  • Наша гипотеза о линейной зависимости Y и X опровергалась, так как линейная модель не прошла тестирование предпосылок теоремы Гаусса-Маркова о гомоскедастичности и об отсутствии автокорреляции случайных остатков.

  • Модель В (гиперболистическая) оказалось неадекватной при проверки ее через интервальное прогнозирование, а также тест Дарбина-Уотсона показал положительную автокорреляцию случайного остатка в модели.

  • После проведения сравнительного анализа, 2 модель оказалось наилучшей, она прошла проверку на адекватность через интервальное прогнозирование, хоть и статистика DW попала во множество M2=(dL;dU), т.е. ни отклонить, ни принять гипотезу Cov (ui, uj) = 0 при i ≠ j невозможно с помощью теста Дарбина Уотсона.

Ответ: степенная модель Б-наилучшая, ее оценённый вид:

(0,001) (0, 03) (0,9)

Задание №2

Используя статистические данные 2000-2013 гг для того же субъекта РФ, что и в Задании 1, оценить эконометрическую модель множественной регрессии

Y=a0+a1X1+а2Х2+u,

где Y – среднедушевой доход населения,

X1- реальная среднемесячная начисленная з/пл,

X2- среднегодовая численность безработных граждан по региону (или уровень безработицы в %).

Проверить значимость используемых в модели регрессоров. Исследовать адекватность модели по последнему набору данных.

Собранные статистические данные выглядят следующим образом:

Год

Среднедушевые денежные доходы в месяц (руб.)

Реальная среднемесячная начисленная з/п

(% по отношению к предыдущему году)

Уровень безработицы, %

2000

1489

112,8

15,0

2001

2029

117,7

9,4

2002

3081

126,7

9,1

2003

4062

110,6

6,9

2004

4975

105,7

8,0

2005

6269

108,9

7,9

2006

7396

107,7

9,8

2007

8443

116,4

9,3

2008

10877

109,4

9,6

2009

13646

97,7

8,5

2010

15348

107,9

9,3

2011

16525

105,5

8,5

2012

18450

102,8

8,5

2013

20417

101,2

8,3

Таблица №2

А) Y=a0+a1X1+а2Х2+u

Оцененная модель линейной функции выглядит следующим образом:

R2 =0, 504, такое значение R2 позволяет констатировать среднее качество спецификации нашей модели.

Тем не менее, исследуем качество спецификации при помощи F-теста:

F=5, 6

Fкрит. =3,98

В данном случае неравенство F ≤ Fкрит. несправедливо, значит, спецификация имеет хорошее качество.

Однако, в ходе проверки значимости используемых в модели регрессоров, получились следующие результаты:

=3,8 >tкрит.=2, 2

=2,98> tкрит.=2, 2

=0,72> tкрит.=2, 2

Последние неравенство неверно, а из этого следует, что регрессор (X2) нельзя признать значимым в модели.

Проведем тестирование предпосылок теоремы Гаусса-Маркова.

Убедимся, что .

=0, значит, предпосылка: E (u1) = E(u2) = ….= E(un) = 0, выполняется.

Тест Голдфела-Квандта гипотезы о гомоскедастичности остатков показал следующие результаты:

 

GQ =3,75 ≤ Fкрит. =9, 28

GQ-1=0,26 ≤ Fкрит. =9, 28

Оба неравенства справедливы, поэтому нет основания полагать неадекватной предпосылку о гомоскедастичности случайного остатка в модели.

Теперь выполним проверку адекватности предпосылки о некоррелированности случайных остатков в системе уравнений нашей модели, т.е. об отсутствии автокорреляции случайного остатка в модели.

Определяем значение статистики:

DW = 1, 0

Выбираем константы при n=14, k=2: dL=0, 91;dU= 1,55.

Статистика DW попала в множество M2=( dL;dU), таким образом ни отклонить, ни принять гипотезу (Cov (ui, uj) = 0 при i ≠ j) при помощи данного теста не удается.

Проведем проверку адекватности модели с помощью интервального прогнозирования:

y0=20417 попадает в доверительный интервал: [=1891, 2;=24868,9].

Так как значение эндогенной переменной из контролирующей выборки попало в доверительный интервал, можно признать нашу модель адекватной.

Итак, проанализировав модель можно сделать следующие выводы:

1)Наша выборка обладает средней объясняющей способностью у регрессоров модели, которая измеряется коэффициентом детерминации и исследуется F-тестом.

2)Модель адекватна. Это подтверждено с помощью интервального прогнозирования. Тест Гаусса – Маркова тоже дал положительные результаты, за исключением того, что статистика DW попала в множество M2=(dL;dU), т.е. ни отклонить, ни принять гипотезу Cov (ui, uj) = 0 при i ≠ j невозможно с помощью теста Дарбина - Уотсона.

Однако, t-тест не дал столь позитивных результатов(X2- незначимый в модели).

Таким образом, модель нельзя назвать качественной, поэтому составим иную модель, с одним регрессором, изучив ее поведение.

Б) Y=a0+a1X1+u

Оцененная модель линейной функции выглядит следующим образом:

R2 =0, 48, такое значение R2 позволяет констатировать то,что выборка обладает слабой объясняющей способностью у регрессоров модели.

Тем не менее, исследуем качество спецификации при помощи F-теста:

F=11, 1

Fкрит. =4, 75

В данном случае неравенство F ≤ Fкрит. несправедливо, значит, спецификация имеет хорошее качество.

В ходе проверки значимости используемых в модели регрессоров, получаем следующие результаты:

=3,8 >tкрит.=2, 18

=3,3> tкрит.=2, 18

Проведем тестирование предпосылок теоремы Гаусса-Маркова.

Прежде чем проводить тест, убедимся, что .

=-1,0186×E-10, значит, предпосылка: E (u1) = E(u2) = ….= E(un) = 0, выполняется.

Тест Голдфела-Квандта гипотезы о гомоскедастичности остатков показал следующие результаты:

 

GQ =4, 2 ≤ Fкрит. =9, 28

GQ-1=0, 2 ≤ Fкрит. =9, 28

Оба неравенства справедливы, поэтому нет основания полагать неадекватной предпосылку о гомоскедастичности случайного остатка в модели.

Теперь выполним проверку адекватности предпосылки о некоррелированности случайных остатков в системе уравнений нашей модели, т.е. об отсутствии автокорреляции случайного остатка в модели.

Определяем значение статистики:

DW = 0, 96

Выбираем константы при n=14, k=1: dL=1,05;dU= 1,35.

Статистика DW попала в множество M1= ( 0; dL], таким образом отклоняем гипотезу (Cov (ui, uj) = 0 при i ≠ j).

Проведем проверку адекватности модели с помощью интервального прогнозирования:

y0=20417 попадает в доверительный интервал: [=2142;=24222,363].

Так как значение эндогенной переменной из контролирующей выборки попало в доверительный интервал, можно признать нашу модель адекватной.

При составлении спецификации с одним регрессором (з/п) выявились следующие результаты:

- выборка обладает слабой объясняющей способностью у регрессоров модели, которая измеряется коэффициентом детерминации и исследуется F-тестом;

- t-тест дал столь позитивные результаты о значимости регрессоров;

- модель неадекватна, исходя из поведенного тестирования предпосылок Гаусса-Маркова;

- модель прошла проверку интервальным прогнозированием.

Так как только одна предпосылка дала сбой в тестировании на адекватность, то возможно стоит изучить нарушения условия методом имитационного моделирования.

1 Статистика получена на основании данных: процента расходов на обязательные платежи и

разнообразные взносы от общего объема денежных доходов.

2 При проверке качества спецификации и проведении тестирования предпосылок Гаусса-Маркова используем обучающую выборку с 2000 по 2013 (т.е. включая контрольную выборку -2013 год), из-за нехватки статистических данных.

22

Просмотров работы: 1019