ПРОГНОЗИРОВАНИЕ УРОВНЯ РЕГИОНАЛЬНОЙ БЕЗРАБОТИЦЫ

Токарева Е.А. 1

1Финансовый университет при Правительстве РФ

Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Безработица – это важное экономическое явление. Современная ситуация, кризисы, Covid – 19 – всё это сказывается на безработице. Число экономически занятых становится меньше, валовый региональный продукт уменьшается. ВРП показывает объем произведенных товаров и услуг внутри региона, он показывает экономический рост того или иного региона.

Состояние национальной экономики зависит от каждого региона. Это можно проследить с помощью различных показателей.

В данной работе безработица будет выступать как эономический показатель, который показывает какая часть активного населения не занята в экономике.

Цель данной работы – это экономерический анализ зависимости безработицы от валового регионального продукта и общего числа занятых в экономике.

Объектом будут выступать отдельные регионы Российской Федерации.

Предметом является оценка количества безработных в зависимости от валового регионального продукта и занятых в регионе.

Для построения модели была взята статистика Росстата [3] с учетом следующих показателей:

Эндогенная переменная:

Y– количество безработных, тыс. человек.

Экзогенные переменные:

х₁ – внутренний региональный продукт (ВРП) на 1000 человек;

х₂ – занятые в экономике, тыс. человек. [2]

Объем выборки составил 82 значения. 5% - это контролирующая, равная 4, тогда обучающая 78.

Составление модели множественной регрессии:

C помощью функции ЛИНЕЙН были получены следующие МНК – оценки:

Табл. 1. МНК - оценки

Функция ЛИНЕЙН
a2	0.056744	-0.00839	16.86421	a0
Sa2	0.005834	0.002605	4.138699	Sa0
R^2	0.730196	25.28199	#Н/Д	сигма
F-статистика	106.9023	79	#Н/Д	степени свободы n-(k+1)
RSS	136659.5	50495.15	#Н/Д	ESS

Далее была проверена модель по каждому типу симптомов возможных ошибок.

Для начала составлена диаграмма рассеивания:

Рис. 1. Диаграмма рассеивания

По диаграмме видно, что есть некоторые выбросы, которые позже будут исключены из обучающей выборки для удобства рассчетов.

Далее была составлена функция ЛИНЕЙН для всей выборки:

Табл. 1. Функция линейн для всей выборки

Функция ЛИНЕЙН
a2	0.05674418	-0.008387156	16.86421	a0
Sa2	0.00583415	0.00260459	4.138699	Sa0
R^2	0.73019558	25.28199287	#Н/Д	сигма
F-статистика	106.902345	79	#Н/Д	степени свободы n-(k+1)
RSS	136659.503	50495.15391	#Н/Д	ESS

Как видно, из таблицы коэффициент детерминации R² = 0.73. Это говорит о сильном влиянии иксов на Y, другими словами, объясняющая способность модели высокая.

Также был рассчитан F_крит :

F.ОБР.ПХ (0.05,2,79) = 3.11

Сравнивая его с F-статистикой, получаем, что:

106.902 > 3.11 => F-статистика > F_крит

Это говорит о том, что модель качественная.

Для третьего симптома статистическая выборка была поделена на две равные части, где n₁= n₂= 41. Также были рассчитаны границы по формуле:

Получились следующие значения:

Для n₁:

Табл. 2. Функция Линейн для n₂

Функция ЛИНЕЙН
a2	0.0546842	-0.008336304	16.10445	a0
Sa2	0.0088615	0.004005796	6.00889	Sa0
R^2	0.7825248	26.44301519	#Н/Д	сигма
F-статистика	68.366287	38	#Н/Д	степени свободы n-(k+1)
RSS	95607.935	26570.856	#Н/Д	ESS

В таком случае границы будут:

Табл. 3. Левые и правые границы для n₁

	По а0	По а1	По а2
Левая граница	0.045822732	-0.0123421	10.09556453
правая граница	0.063545705	-0.004330508	22.11334543

Для n₂:

Табл. 4. Функция Линейн для n₂

Функция ЛИНЕЙН
a2	0.0642699	-0.00694	11.78392	a0
Sa2	0.0082427	0.003477612	6.558347	Sa0
R^2	0.6661074	23.88618971	#Н/Д	сигма
F-статистика	37.904517	38	#Н/Д	степени свободы n-(k+1)
RSS	43252.849	21680.90224	#Н/Д	ESS

Границы будут выглядеть так:

Табл. 5. Левые и правые границы для n₂

	По а0	По а1	По а2
Левая граница	0.056027236	-0.010417117	5.225576386
правая граница	0.072512661	-0.003461893	18.3422705

Теперь необходимо проверить, насколько они отличаются, и входят ли в диапазон друг друга.

Для n₁:

a₀(= 16.104) принадлежит промежутку (5.225; 18.342);

a₁(= - 0.008) принадлежит промежутку (-0.0104; - 0.003);

a₂(= 0.547) не принадлежит промежутку (0.056; 0.073). При этом этот параметр меньше левой границы на 0.009, что принимается как незначительное отклонение.

Для n₂:

a₀(= 11.784) принадлежит промежутку (10.096; 22.113);

a₁(= -0.007) принадлежит промежутку (-0.012; -0.004);

a₂(= 0.0642) принадлежит промежутку (0.046; 0.0635). Как видно, в данном случае также имеется незначителное отклонение на 0.0007.

Далее была рассмотрена ошибка второго типа. Для этого было рассчитано t_крит по формуле СТЬЮДЕНТ.ОБР.2Х (0.05,79) = 1.99.

Далее были сравнены дробь каждого регрессора со значением t_крит по формуле:

Для a₀ :

4.077 > 1.99

Для a₁ :

3.22 > 1.99

Для a₂ :

9.726 > 1.99

Следовательно, все регрессоры являются значимыми.

По итогу проверок лишних регрессоров не было выявлено, а также не было пропущено никаких важных.

Далее был проведен тест Чоу [1]. В итоге получены следующие результаты статистики теста и ее критического уровня:

Z = 0.869; F = 5.143 0.869 < 5.143

В таком случае говорят о том, что сдвига в данных нет, то есть параметры модели сохраняют стабильность.

Далее были протестированы предпосылки теоремы Гаусса – Маркова.

Предпосылка о линейной независимости столбцов Х выполняется.

Предпосылка о нулевом математическом ожидании также выполняется, что было проверено с помощью среднего значения случайных остатков.

Предпосылка о гомоскедастичности случайных остатков также выполняется.

Для этого был проведен тест Голдфелда – Квандта.

Для начала была посчитана сумма модулей х1 и х2, после чего выборка была отсортирована от наименьшего к наибольшему.

Так как объем статистики небольшой, было принято решение поделить выборку на две равные части. n₁= n₂= 41.

Для n₁была рассчитана функция Линейн:

Табл. 6. Функция линейн для n₁

Функция ЛИНЕЙН
a2	0.098632	-0.07053	14.19815	a0
Sa2	0.029604	0.03445	8.393535	Sa0
R^2	0.22869	22.93361	#Н/Д	сигма
F-статистика	5.63343	38	#Н/Д	степени свободы n-(k+1)
RSS	5925.809	19986.11	#Н/Д	ESS1

Для n₂также была рассчитана функция Линейн:

Табл. 7. Функция Линейн для n₂

Функция ЛИНЕЙН
a2	0.050468	-0.00676	26.19426	a0
Sa2	0.007256	0.002911	7.415837	Sa0
R^2	0.736935	26.71902	#Н/Д	сигма
F-статистика	53.22554	38	#Н/Д	степени свободы n-(k+1)
RSS	75996.04	27128.42	#Н/Д	ESS2

Далее был рассчитан GQ = ESS1 / ESS2 = 199986.11 / 27128.42 = 0.737

После чего получилось, что 1 / GQ = 1.357

F_крит = F.ОБР.ПХ (0.05; 2 ; 38) = 3.245

GQ < Fкрит – выполняется

1/GQ < Fкрит – выполняется

Следовательно, гипотеза о постоянстве дисперсии принимается как правильная. Случайные остатки гомоскедастичны.

Предпосылка об отсутствии автокорреляции случайных остатков была нарушена.

Для проверки был сделан тест Дарбина – Уотсона.

Были рассчитаны случайные остатки, случайные остатки в квадрате и (ut-ut-1)^2.

Далее был рассчитан DW = TSS / ESS = 1.201

Для n = 82, k = 2 были найдены d_L = 1.59, d_U = 1.69.

DW принадлежит I₁.

Это говорит о том, что Cov > 0, то есть присутствует положительная автокорреляция.

Для её устранения необходимо воспользоваться алгоритмом Хилдрета – Лу.

При подсчетах получилось, что получено оптимальное значение p = 0.4.

Для проверки, устранилась ли автокорреляция, был повторно проведен тест Дабина – Уотсона.

DW = TSS / ESS = 2.105.

То есть DW принадлежит I₃.

Это говорит о том, что Cov = 0, то есть автокорреляция отсутствует.

Также мы видим, что R² увеличилось, и стало равным 0,81. Это говорит о том, что модель стала качественнее.

С учётом автокорреляции имеется следующая спецификация модели:

Тогда МНК – оценки для этой модели будут выглядеть следующим образом:

Табл. 8. Функция линейн для новой спецификации

Функция ЛИНЕЙН
b2	0.0584387	-0.0093431	16.4360691	0	a0
Sb2	0.0048302	0.00218157	4.99414188	#Н/Д	Sa0
R^2	0.8618152	23.2997006	#Н/Д	#Н/Д	сигма
F-статистика	162.15379	78	#Н/Д	#Н/Д	степени свободы n-(k+1)
RSS	264088.232	42344.3318	#Н/Д	#Н/Д	ESS

Для проверки адекватности была выбрана следующая контрольная выборка:

Табл. 9. Контрольная выборка

Краснодарский край	137.60	0.60	2188.10	2346.74
г. Москва	248.00	0.60	17657.29	6904.72
г.Санкт-Петербург	110.35	0.60	4127.80	2904.36
Тюменская область	26.19	0.60	7879.41	1101.19

Для субъектов, входящих в контролирующую выборку получены следующие значения прогнозов.

Табл. 10. Расчет интервального прогноза для субъектов «город Санкт – Петербург» и « Тюменская область»

q	0.081674373
Y	139.9514002
S	24.15069539
Yфакт	110.35
tкрит	1.992543495
Y-	91.83008916
Y+	2804.937165

q	0.347148093
Y	-31.46991821
S	26.95187851
Yфакт	26.19
tкрит	1.992543495
Y-	-85.17270842
Y+	674.39978

Табл. 11. Расчет интервального прогноза для субъектов «город Москва» и « Краснодарский край»

q	0.634546737
Y	209.9568644
S	29.68793848
Yфакт	248.00
tкрит	1.992543495
Y-	150.8023557
Y+	7572.642797

q	0.080136352
Y	202.2562153
S	24.13351948
Yфакт	159.16
tкрит	1.992543495
Y-	154.1691281
Y+	4043.226508

Итак, получилось, что во всех четырех выборках Yфакт входит в промежуток от Y- до Y+.

Это говорит о том, что рассматриваемая модель адекватная с 95% вероятностью. В оцененном виде она выглядит следующим образом:

Y_t = 16.436t – 0.009*b₁_t + 0.058*b₂_t+ u_t

(4.994) (0.002) (0.005) (23.2997)

По итогам проведенного исследования можно сделать вывод о том, что существует зависимость числа безработных в регионе от ВРП и числа занятых в экономике.

Литературные источники:

Бывшев В.А. Эконометрика: Учебное пособие.– М.: «Финансы и статистика», 2008. – 480 стр.

Викулина Е.А. Влияние экономических и социальных факторов на уровень региональной безработицы // Хроноэкономика // 2020 год. URL: https://www.elibrary.ru/item.asp?id=42584517& (дата обращения 14.12.2020).

Росстат. URL: https://rosstat.gov.ru/ (дата обращения 15.12.2020)

Просмотров работы: 17

Код для цитирования:

XIII Международная студенческая научная конференция Студенческий научный форум - 2021

ПРОГНОЗИРОВАНИЕ УРОВНЯ РЕГИОНАЛЬНОЙ БЕЗРАБОТИЦЫ

Студенческий научный форум - 2021
XIII Международная студенческая научная конференция