Безработица – это важное экономическое явление. Современная ситуация, кризисы, Covid – 19 – всё это сказывается на безработице. Число экономически занятых становится меньше, валовый региональный продукт уменьшается. ВРП показывает объем произведенных товаров и услуг внутри региона, он показывает экономический рост того или иного региона.
Состояние национальной экономики зависит от каждого региона. Это можно проследить с помощью различных показателей.
В данной работе безработица будет выступать как эономический показатель, который показывает какая часть активного населения не занята в экономике.
Цель данной работы – это экономерический анализ зависимости безработицы от валового регионального продукта и общего числа занятых в экономике.
Объектом будут выступать отдельные регионы Российской Федерации.
Предметом является оценка количества безработных в зависимости от валового регионального продукта и занятых в регионе.
Для построения модели была взята статистика Росстата [3] с учетом следующих показателей:
Эндогенная переменная:
Y– количество безработных, тыс. человек.
Экзогенные переменные:
х1 – внутренний региональный продукт (ВРП) на 1000 человек;
х2 – занятые в экономике, тыс. человек. [2]
Объем выборки составил 82 значения. 5% - это контролирующая, равная 4, тогда обучающая 78.
Составление модели множественной регрессии:
C помощью функции ЛИНЕЙН были получены следующие МНК – оценки:
Табл. 1. МНК - оценки
Функция ЛИНЕЙН |
||||
a2 |
0.056744 |
-0.00839 |
16.86421 |
a0 |
Sa2 |
0.005834 |
0.002605 |
4.138699 |
Sa0 |
R^2 |
0.730196 |
25.28199 |
#Н/Д |
сигма |
F-статистика |
106.9023 |
79 |
#Н/Д |
степени свободы n-(k+1) |
RSS |
136659.5 |
50495.15 |
#Н/Д |
ESS |
Далее была проверена модель по каждому типу симптомов возможных ошибок.
Для начала составлена диаграмма рассеивания:
Рис. 1. Диаграмма рассеивания
По диаграмме видно, что есть некоторые выбросы, которые позже будут исключены из обучающей выборки для удобства рассчетов.
Далее была составлена функция ЛИНЕЙН для всей выборки:
Табл. 1. Функция линейн для всей выборки
Функция ЛИНЕЙН |
||||
a2 |
0.05674418 |
-0.008387156 |
16.86421 |
a0 |
Sa2 |
0.00583415 |
0.00260459 |
4.138699 |
Sa0 |
R^2 |
0.73019558 |
25.28199287 |
#Н/Д |
сигма |
F-статистика |
106.902345 |
79 |
#Н/Д |
степени свободы n-(k+1) |
RSS |
136659.503 |
50495.15391 |
#Н/Д |
ESS |
Как видно, из таблицы коэффициент детерминации R2 = 0.73. Это говорит о сильном влиянии иксов на Y, другими словами, объясняющая способность модели высокая.
Также был рассчитан Fкрит :
F.ОБР.ПХ (0.05,2,79) = 3.11
Сравнивая его с F-статистикой, получаем, что:
106.902 > 3.11 => F-статистика > Fкрит
Это говорит о том, что модель качественная.
Для третьего симптома статистическая выборка была поделена на две равные части, где n1 = n2 = 41. Также были рассчитаны границы по формуле:
Получились следующие значения:
Для n1:
Табл. 2. Функция Линейн для n2
Функция ЛИНЕЙН |
||||
a2 |
0.0546842 |
-0.008336304 |
16.10445 |
a0 |
Sa2 |
0.0088615 |
0.004005796 |
6.00889 |
Sa0 |
R^2 |
0.7825248 |
26.44301519 |
#Н/Д |
сигма |
F-статистика |
68.366287 |
38 |
#Н/Д |
степени свободы n-(k+1) |
RSS |
95607.935 |
26570.856 |
#Н/Д |
ESS |
В таком случае границы будут:
Табл. 3. Левые и правые границы для n1
По а0 |
По а1 |
По а2 |
|
Левая граница |
0.045822732 |
-0.0123421 |
10.09556453 |
правая граница |
0.063545705 |
-0.004330508 |
22.11334543 |
Для n2 :
Табл. 4. Функция Линейн для n2
Функция ЛИНЕЙН |
||||
a2 |
0.0642699 |
-0.00694 |
11.78392 |
a0 |
Sa2 |
0.0082427 |
0.003477612 |
6.558347 |
Sa0 |
R^2 |
0.6661074 |
23.88618971 |
#Н/Д |
сигма |
F-статистика |
37.904517 |
38 |
#Н/Д |
степени свободы n-(k+1) |
RSS |
43252.849 |
21680.90224 |
#Н/Д |
ESS |
Границы будут выглядеть так:
Табл. 5. Левые и правые границы для n2
По а0 |
По а1 |
По а2 |
|
Левая граница |
0.056027236 |
-0.010417117 |
5.225576386 |
правая граница |
0.072512661 |
-0.003461893 |
18.3422705 |
Теперь необходимо проверить, насколько они отличаются, и входят ли в диапазон друг друга.
Для n1:
a0(= 16.104) принадлежит промежутку (5.225; 18.342);
a1 (= - 0.008) принадлежит промежутку (-0.0104; - 0.003);
a2 (= 0.547) не принадлежит промежутку (0.056; 0.073). При этом этот параметр меньше левой границы на 0.009, что принимается как незначительное отклонение.
Для n2:
a0(= 11.784) принадлежит промежутку (10.096; 22.113);
a1 (= -0.007) принадлежит промежутку (-0.012; -0.004);
a2 (= 0.0642) принадлежит промежутку (0.046; 0.0635). Как видно, в данном случае также имеется незначителное отклонение на 0.0007.
Далее была рассмотрена ошибка второго типа. Для этого было рассчитано tкрит по формуле СТЬЮДЕНТ.ОБР.2Х (0.05,79) = 1.99.
Далее были сравнены дробь каждого регрессора со значением tкрит по формуле:
Для a0 :
4.077 > 1.99
Для a1 :
3.22 > 1.99
Для a2 :
9.726 > 1.99
Следовательно, все регрессоры являются значимыми.
По итогу проверок лишних регрессоров не было выявлено, а также не было пропущено никаких важных.
Далее был проведен тест Чоу [1]. В итоге получены следующие результаты статистики теста и ее критического уровня:
Z = 0.869; F = 5.143 0.869 < 5.143
В таком случае говорят о том, что сдвига в данных нет, то есть параметры модели сохраняют стабильность.
Далее были протестированы предпосылки теоремы Гаусса – Маркова.
Предпосылка о линейной независимости столбцов Х выполняется.
Предпосылка о нулевом математическом ожидании также выполняется, что было проверено с помощью среднего значения случайных остатков.
Предпосылка о гомоскедастичности случайных остатков также выполняется.
Для этого был проведен тест Голдфелда – Квандта.
Для начала была посчитана сумма модулей х1 и х2, после чего выборка была отсортирована от наименьшего к наибольшему.
Так как объем статистики небольшой, было принято решение поделить выборку на две равные части. n1 = n2 = 41.
Для n1 была рассчитана функция Линейн:
Табл. 6. Функция линейн для n1
Функция ЛИНЕЙН |
||||
a2 |
0.098632 |
-0.07053 |
14.19815 |
a0 |
Sa2 |
0.029604 |
0.03445 |
8.393535 |
Sa0 |
R^2 |
0.22869 |
22.93361 |
#Н/Д |
сигма |
F-статистика |
5.63343 |
38 |
#Н/Д |
степени свободы n-(k+1) |
RSS |
5925.809 |
19986.11 |
#Н/Д |
ESS1 |
Для n2 также была рассчитана функция Линейн:
Табл. 7. Функция Линейн для n2
Функция ЛИНЕЙН |
||||
a2 |
0.050468 |
-0.00676 |
26.19426 |
a0 |
Sa2 |
0.007256 |
0.002911 |
7.415837 |
Sa0 |
R^2 |
0.736935 |
26.71902 |
#Н/Д |
сигма |
F-статистика |
53.22554 |
38 |
#Н/Д |
степени свободы n-(k+1) |
RSS |
75996.04 |
27128.42 |
#Н/Д |
ESS2 |
Далее был рассчитан GQ = ESS1 / ESS2 = 199986.11 / 27128.42 = 0.737
После чего получилось, что 1 / GQ = 1.357
Fкрит = F.ОБР.ПХ (0.05; 2 ; 38) = 3.245
GQ < Fкрит – выполняется
1/GQ < Fкрит – выполняется
Следовательно, гипотеза о постоянстве дисперсии принимается как правильная. Случайные остатки гомоскедастичны.
Предпосылка об отсутствии автокорреляции случайных остатков была нарушена.
Для проверки был сделан тест Дарбина – Уотсона.
Были рассчитаны случайные остатки, случайные остатки в квадрате и (ut-ut-1)^2.
Далее был рассчитан DW = TSS / ESS = 1.201
Для n = 82, k = 2 были найдены dL = 1.59, dU = 1.69.
DW принадлежит I1.
Это говорит о том, что Cov > 0, то есть присутствует положительная автокорреляция.
Для её устранения необходимо воспользоваться алгоритмом Хилдрета – Лу.
При подсчетах получилось, что получено оптимальное значение p = 0.4.
Для проверки, устранилась ли автокорреляция, был повторно проведен тест Дабина – Уотсона.
DW = TSS / ESS = 2.105.
То есть DW принадлежит I3.
Это говорит о том, что Cov = 0, то есть автокорреляция отсутствует.
Также мы видим, что R2 увеличилось, и стало равным 0,81. Это говорит о том, что модель стала качественнее.
С учётом автокорреляции имеется следующая спецификация модели:
Тогда МНК – оценки для этой модели будут выглядеть следующим образом:
Табл. 8. Функция линейн для новой спецификации
Функция ЛИНЕЙН |
|||||
b2 |
0.0584387 |
-0.0093431 |
16.4360691 |
0 |
a0 |
Sb2 |
0.0048302 |
0.00218157 |
4.99414188 |
#Н/Д |
Sa0 |
R^2 |
0.8618152 |
23.2997006 |
#Н/Д |
#Н/Д |
сигма |
F-статистика |
162.15379 |
78 |
#Н/Д |
#Н/Д |
степени свободы n-(k+1) |
RSS |
264088.232 |
42344.3318 |
#Н/Д |
#Н/Д |
ESS |
Для проверки адекватности была выбрана следующая контрольная выборка:
Табл. 9. Контрольная выборка
Краснодарский край |
137.60 |
0.60 |
2188.10 |
2346.74 |
г. Москва |
248.00 |
0.60 |
17657.29 |
6904.72 |
г.Санкт-Петербург |
110.35 |
0.60 |
4127.80 |
2904.36 |
Тюменская область |
26.19 |
0.60 |
7879.41 |
1101.19 |
Для субъектов, входящих в контролирующую выборку получены следующие значения прогнозов.
Табл. 10. Расчет интервального прогноза для субъектов «город Санкт – Петербург» и « Тюменская область»
q |
0.081674373 |
Y |
139.9514002 |
S |
24.15069539 |
Yфакт |
110.35 |
tкрит |
1.992543495 |
Y- |
91.83008916 |
Y+ |
2804.937165 |
q |
0.347148093 |
Y |
-31.46991821 |
S |
26.95187851 |
Yфакт |
26.19 |
tкрит |
1.992543495 |
Y- |
-85.17270842 |
Y+ |
674.39978 |
Табл. 11. Расчет интервального прогноза для субъектов «город Москва» и « Краснодарский край»
q |
0.634546737 |
Y |
209.9568644 |
S |
29.68793848 |
Yфакт |
248.00 |
tкрит |
1.992543495 |
Y- |
150.8023557 |
Y+ |
7572.642797 |
q |
0.080136352 |
Y |
202.2562153 |
S |
24.13351948 |
Yфакт |
159.16 |
tкрит |
1.992543495 |
Y- |
154.1691281 |
Y+ |
4043.226508 |
Итак, получилось, что во всех четырех выборках Yфакт входит в промежуток от Y- до Y+.
Это говорит о том, что рассматриваемая модель адекватная с 95% вероятностью. В оцененном виде она выглядит следующим образом:
Yt = 16.436t – 0.009*b1t + 0.058*b2t+ ut
(4.994) (0.002) (0.005) (23.2997)
По итогам проведенного исследования можно сделать вывод о том, что существует зависимость числа безработных в регионе от ВРП и числа занятых в экономике.
Литературные источники:
Бывшев В.А. Эконометрика: Учебное пособие.– М.: «Финансы и статистика», 2008. – 480 стр.
Викулина Е.А. Влияние экономических и социальных факторов на уровень региональной безработицы // Хроноэкономика // 2020 год. URL: https://www.elibrary.ru/item.asp?id=42584517& (дата обращения 14.12.2020).
Росстат. URL: https://rosstat.gov.ru/ (дата обращения 15.12.2020)