Анализ зависимости численности населения Краснодарского края от объёма ВРП и средней зарплаты на душу населения - Студенческий научный форум

XII Международная студенческая научная конференция Студенческий научный форум - 2020

Анализ зависимости численности населения Краснодарского края от объёма ВРП и средней зарплаты на душу населения

Лепёхин Р.И. 1
1Финансовый университет при Правительстве РФ
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

С 1939 по 2019 годы численность постоянного населения Краснодарского края увеличилась почти в два раза (на 2 млн 759 тыс. человек). Этот показатель стабильно растёт, и в настоящий момент в регионе проживает 5 млн 650 тысяч человек. Причём, рост населения идёт в основном за счёт миграции.

Как сообщает региональный Росстат, в период с 1939 по 2019 годы Кубань остается регионом привлекательным для миграции как внутрироссийской, так и из стран ближнего зарубежья. 

Мигранты в основном селятся в крупных городах. Здесь население выросло в четыре раза, а в сельских поселениях только на 17%. Краснодар — город мигрантов. Краснодар показывает наибольший прирост населения среди всех городов Юга России. Его население выросло в 60 раз!

По данным Росстата, в 1871 году в Екатеринодаре проживали 17,6 тысяч горожан. В 1920 году городское население увеличилось в 8 раз. В 1970 году численность населения кубанской столицы перевалила за 500 тысяч.

Затем ежегодно до 2011 года в городе появлялись по 100 тысяч новых жителей. В этом году Краснодар считается городом-миллионником, по данным Росстата. В ведомстве обещают уточнить эту цифру после Всероссийской переписи населения в 2020 году.

Актуальностью моей работы является анализ количества мигрантов в Краснодарском крае, так как в большей степени они образовывают прирост в населении.

Ввиду того, что предметом изучения эконометрики является изучение этой количественной стороны экономических явлений и процессов средствами математического и статистического анализа, необходимо определить факторы, оказывающие наиболее существенное влияние на численность населения Краснодарского края. Конечно, на численность населения влияет ряд факторов, такие как уровень валового регионального продукта и величина средней зарплаты на душу населения.

Целью данной работы является составление эконометрической модели зависимости численности населения Краснодарского края от объёма ВРП и средней зарплаты на душу населенияи анализ данной модели относительно применимости ее на практике.

В соответствии с целью, можно выделить ряд задач:

1. Анализ связи между переменными;

2. Составление спецификации модели;

3. Проверка модели на адекватность и качество спецификации;

4. Проверка справедливости предпосылок теоремы Гаусса-Маркова;

5. Формулировка выводов относительно возможности применения модели на практике.

Таким образом, в данной работе будет проведен детальный теоретический анализ проблемы, который в сопоставлении с выводами математики и статистики, основанными на данных Росстата, позволит не только проанализировать текущее положение дел, но и сделать прогнозы в данной сфере.

1. Определение взаимосвязи между численностью населения и её факторами

Перед непосредственным построением эконометрической модели, необходимо обозначить переменные, которые будут в ней использованы.

Численность населения Краснодарского края был выбран в качестве эндогенной переменной для построения модели. В данном ключе необходимо обосновать не просто выбор данной переменной, но и роль численности населения в экономической ситуации региона. Городское население Краснодарского края постоянно изменяется. Так, одни города развиваются опережающими темпами (например, Краснодар, Новороссийск, Сочи). Другие находятся в состоянии застоя (например, Апшеронск, Гулькевичи, Кропоткин, Курганинск, Новокубанск, Темрюк), третьи теряют свое население и постепенно превращаются в села (Крымск, Лабинск, Приморско-Ахтарск).

В территориальной организации расселения Краснодарского края есть своя особенность. Она заключается в высокой концентрации административных, финансовых, промышленных и торговых предприятий в одном городе региона – Краснодаре и фактически остаточном подходе к развитию малых и средних го- родов, что обусловило моноцентрический характер краевой системы расселения. При моноцентрической сети городских поселений, при которой на фоне равномерного распределения небольших городов выделяется один центр – Краснодар.

Результатом быстрого увеличения городского населения Краснодарского края стало значительное повышение плотности населения, которое в 2014 г. составляло 71,59 тыс. чел на 1 км2. Плотность городского населения

При анализе структуры экономики малых городов края был использован показатель «численность занятых» в различных отраслях (на основе баланса трудовых ресурсов). Следует отметить сложности получения необходимых информационных данных для исследования состояния малых городов Краснодарского края. Из 11 малых городов края только один – Горячий Ключ – является муниципальным образованием городской округ. Остальные 10 малых городов – это городские поселения в составе муниципальных районов. Официальная статистика представляет данные по городским округам и муниципальным районам, но по городским и сельским поселениям она крайне ограничена.

2. Составление спецификации модели

Итак, как становится понятно из выбранных для использования в модели переменных, в данной работе будет рассматриваться простейшая модель линейной парной регрессии, которая в общем виде записывается как:

Y = a0 + a1*X1+ a2*X2 + u, где

Y – зависимая величина, состоящая из неслучайной составляющей (а01Х, где Х – объясняющая (независимая) переменная, а а0 и а1 – параметры уравнения) и случайного члена u.

В нашем случае в качестве переменной Y будет выступать численность населения Краснодарского края, а Х1 – объем ВРП, Х2-средняя зарплата на душу населения.

Стоит отдельно остановиться на случайном члене. Его существование обусловлено тем, что часто невозможно включить в модель все факторы, которые оказывают влияние на эндогенные переменные. Случайные остатки помогают выявить наличие тех или иных ошибок в построении модели.

Важным условием при составлении эконометрической модели является учет временного фактора.

Так, наша модель принимает вид:

Yt = a0 + a1*X1t+ a2*X2t + ut

Так, на основе полученных данных, можно записать финальный вид модели:

Целью регрессионного анализа является объяснение поведения зависимой переменной Yt. В любой данной выборке Yt оказывается сравнительно низким в одних наблюдениях и сравнительно высоким — в других. Мы хотим определить причинно-следственные связи этого явления.

Для определения качественности модели необходимо вычислить коэффициент детерминации R2. Разложим дисперсию Ii, учитывая, что ковариация ŷiиеrравна нулю получим.

; ;

Максимальное значение коэффициента R2 равно единице. Это происходит в том случае, когда линия регрессии точно соответствует всем наблюдениям, так что Ii= ŷiдля всех i и все остатки равны нулю. Тогда

Var (у) = Vari), Var (er) = 0 и R2=1.

Если в выборке отсутствует видимая связь между I и , то коэффициент R2 будет близок к нулю. Чем больше R2, тем более качественной является модель. На практике коэффициент детерминации вычисляют с помощью функции Excel ЛИНЕЙН, которая дает результаты в виде таблицы размером n x 5 (n равно количеству столбцов данных статистики, в нашем случае n=2).

   
   

R2

 

F

 

TSS

ESS

3. Теорема Гаусса-Маркова

Свойства коэффициентов регрессии в значительной степени зависят от свойств случайного члена. Для того, чтобы регрессионный анализ давал наилучшие результаты, случайный член должен удовлетворять четырем предпосылкам теоремы Гаусса-Маркова. Если корректирующие действия возможны, то аналитик должен быть в состоянии их выполнить. Если ситуацию исправить невозможно, исследователь должен быть способен оценить, насколько серьезно это может повлиять на результаты.

Первая предпосылка теоремы Гаусса—Маркова заключается в том, что математическое ожидание E(ut) = 0 для всех наблюдений. Иногда случайный член будет положительным, иногда отрицательным, но он не должен иметь систематического смещения ни в одном из двух возможных направлений. Данное условие означает, что случайное отклонение в среднем не оказывает влияния на зависимую переменную. Для проверки данной предпосылки необходимо провести F-тест, то есть проверить качество регрессии.

Вторая предпосылка теоремы Гаусса-Маркова заключается в том, что дисперсия Var (ut) = σu2 и постоянна для всех наблюдений. Для проверки этой предпосылки, а также гомоскедастичности случайных остатков, используется тест Голдфелда-Квандта.

Третья предпосылка – Сov (ui;uj) = 0 (ij) – говорит о том, что случайные остатки независимы друг от друга. Если данное условие выполняется, то говорят об отсутствии автокорреляции. Проверка данной предпосылки осуществляется при помощи теста Дарбина-Уотсона.

Четвертая предпосылка – cov (ui; xki) = 0 – говорит о том, что случайное отклонение должно быть независимо от объясняющей переменной. Это условие выполняется, если объясняющая переменная не случайна в данной модели.

При соблюдении вышеперечисленных предпосылок оценки, полученные по МНК, являются несмещенными (отсутствует систематическая ошибка при определении положения линии регрессии), состоятельными (с ростом объёма выборки растёт надежность оценок) и эффективными (имеют наименьшую дисперсию по сравнению с любыми другими оценками данных параметров, линейными относительно величин Yi).

Для построения эконометрических моделей необходимо придерживаться общей схемы:

1. Построение спецификации модели.

2. Сбор статистических данных по всем переменным модели кроме случайных.

3. Вычисление (оценка) значений всех параметров модели.

4. Проверка адекватности оцененной модели, ее качества и выполнения предпосылок теоремы Гаусса-Маркова.

4. Оценивание параметров модели и анализ качества спецификации

Итак, мы имеем модель зависимости численности населения Краснодарского края от средней зарплаты и объёма ВРП:

Для оценки параметров данной модели из статистики, приведенной в Таблице 1, возьмем обучающую выборку в размере 112 наборов данных, с января 2010 года по октябрь 2019 года. Остальные 6 значени возьмем в качестве контрольной выборки.

Далее мы будем работать по обучающей выборке. По ней же проводим оценку модели методом наименьших квадратов в Excel при помощи функции ЛИНЕЙН. Получаем набор оценок параметров:

То есть оцененный вид модели записывается следующим образом:

Как видим, стандартные ошибки коэффициента a1 находятся на достаточно низком уровне, однако мы видим достаточно высокий уровень у a0, что заставляет нас предполагать, что модель не пройдет все тесты.

Для того, чтобы провести исследование качества регрессии, необходимо провести R2-тест и F-тест для обучающей выборки.

Начнем с R2-теста. Коэффициент детерминации R2 получаем из результатов функции ЛИНЕЙН. В данном случае он равен 0,9861, что говорит о высоком уровне связи между эндогенной и экзогенной переменными, так как R2 при округлении до десятых входит в промежуток от 0,7 до 1. Значение коэффициента говорит о том, что уравнением регрессии объясняется приблизительно 98,61% дисперсии результативного признака, а на долю прочих факторов приходится 1,39% её дисперсии (остаточная дисперсия). Следовательно, модель является приемлемой по качеству.

В F-тесте мы сравниваем значения F, полученного при расчете функции ЛИНЕЙН, и F критического, полученного путем расчета в Excel через функцию =F.ОБР.ПХ(α=0,05; v1=k=2; v2=n-(k+1)=108).

Так, F = 3884,9418, что больше Fкр, равного 3,0796. Из этого следует, что спецификация является качественной.

Итак, оба теста подтвердили качественность данной спецификации.

5. Исследование предпосылок теоремы Гаусса-Маркова

Первая предпосылка теоремы Гаусса-Маркова гласит, что математическое ожидание случайных возмущений во всех наблюдениях равно нулю:

E(ut) = 0

Для того, чтобы выполнялось данное условие, необходимо, чтобы:

≈ 0

Для проверки предпосылки рассчитаем для t = 1; 2; 3 … 112, используя формулу получаем значения .

Считаем =-0,0000000001746≈ 0. Значит, первая предпосылка теоремы Гаусса-Маркова выполняется.

Вторая предпосылка теоремы гласит, что дисперсия случайных возмущений во всех равна константе, то есть:

Var (ut) = σu2

Для проверки данной предпосылки проведем тест Голдфелда-Квандта.

Сперва упорядочим наблюдения по возрастанию регрессора П.

Разделим массив на две равные части: n'=112/2=56 (условие n' > k+1 выполнено, так как k=2)

По первым упорядоченным уравнениям оценим методом минимальных квадратов модель и вычислим = 18057,71. Аналогично по последним упорядоченным уравнениям вычислим =13462,3021.

Рассчитаем по формулам значение статистики GQ:

GQ = = 1,3414

= = 0,7455

Рассчитаем

Так как и , то вторая предпосылка теоремы выполняется. Значит, проявляется гомоскедастичность случайных остатков, а также это указывает на адекватность модели.

Третья предпосылка теоремы гласит, что ковариация между парами случайных возмущений в наблюдениях равны нулю, то есть случайные возмущения в наблюдениях независимы:

Сov (ui ;uj) = 0 (i≠j)

Для подтверждения данной предпосылки проведем тест Дарбина-Уотсона. Сначала необходимо рассчитать значение статистики DW:

DW = = 0,78252

Для вычисления статистики мы воспользовались данными из Таблицы 2.

Теперь по параметрам n = 100 и k=2 определяем (dL; dU) по таблице, приведенной в учебнике: dL=1,63; dU=1,72.

Построим интервалы:

Значение статистики DW попадает в интервал М1, что говорит о существовании связи, наличии автокорреляции случайных остатков, то есть
Сov (ui ;uj) > 0 (i≠j). Третья предпосылка теоремы не выполняется.

Данный тест показал нам, что между случайными остатками существует положительная автокорреляция. Это может свидетельствовать о том, что имеются еще факторы, которые оказывают влияние на численность населения Краснодарского края. В данном случае их также стоило бы добавить в модель, но определить истинные причины регионально-экономических решений достаточно сложно.

Четвертая предпосылка теоремы заключается в том, что ковариация между вектором регрессоров и вектором случайных переменных равна нулю, то есть регрессоры и случайные возмущения независимы.

Cov (ui; xki) = 0

Так как xki – константа, то это априори справедливо.

То есть четвертая предпосылка теоремы Гаусса-Маркова выполняется.

Таким образом, все, кроме третьей, предпосылки теоремы Гаусса-Маркова выполняются.

6. Проверка модели на адекватность

Проверим адекватность модели при помощи метода интервального прогнозирования. В качестве контролирующей выборки были взять данные с января 2010 года по март 2019 года (6 наборов - 5% из 118):

Метод интервального прогнозирования заключается в сравнении показателя It из контрольного набора с интервалом, граничными значениями, которого являются и . Данные значения определяются по следующим формулам:

где:

– оцененное значение эндогенной переменной для контролирующей выборки

. – критическое значение функции, распределённой по закону Стьюдента, рассчитываемое в Excel по формуле СТЬЮДЕНТ.ОБР.2Х (α = 0,05; v2 = 48) = 1,98197

– средняя квадратическая ошибка прогноза, рассчитываемая по формуле:

Для начала найдем оцененные значения It по всем наборам значений контролирующей выборки:

Y(10) = 5172,6474

Y(11) = 5246,3846

Y(13) = 5373,4293

Y(14) = 5426,913

Y(17)= 5576,6489

Y(19)= 5685,1075

Далее найдем для каждого набора значения q0 по формуле для линейной парной регрессии:

q0(10) = 0,078

q0(11)= 0,026

q0(13)= 0,024

q0(14)= 0,011

q0(17) = 0,018

q0(19) = 0,032

По полученным значениям q0 можно рассчитать среднеквадратическую ошибку прогноза:

= 18,93

= 18,80

= 18,66

= 18,65

= 18,72

= 18,86

Теперь рассчитаем границы интервалов и сравним с показателями из контрольного набора:

.

На основании полученных данных можно прийти к выводу, что модель адекватна, так как значения из контролирующей выборки попадают в свои прогнозные интервалы

7. Установление ошибок в модели

Одной из наиболее часто встречающихся ошибок в эконометрических моделях является неправильно выбранный тип связи. Проверить правильность выбора связи в модели можно по графику случайных остатков. (Рис 1) В данном случае диаграмма рассеивания показывает, что значения случайных остатков колеблются справа и слева от нуля, то есть наблюдается непостоянство знаков. На основе этого можно утверждать, что тип связи был выбран верно.

Рис. 1. Диаграмма рассеяния случайных остатков.

Второй распространенной ошибкой является несоответствие в оценках параметров. Для проверки на ее наличие отсортируем нашу выборку по значениям регрессора (по возрастанию) и поделим ее на две равные части. Оценим их методом МНК.

Сравним полученные оцененные значения a0 и a1:

       

Для 1 выборки

0,0035

0,0013

4854,17

Для 2 выборки

0,0036

0,0012

4891,19

Сильных отличий между оценками для а0, а1, а3 не наблюдается.

Третий тип ошибки, который часто встречается при построении эконометрических моделей – это неправильность выбора регрессоров. Проверить наличие этой ошибки можно при помощи t-критерия Стьюдента. Для этого проверяем выполняемость неравенства:

Данное неравенство не выполняется ни для одного i, следовательно, регрессоры для модели были выбраны верно.

а0/S0

а1/S1

а2/S2

tкрит

640,6849166

3,305831275

55,5692424

1,98196749

все регрессоры значимые

Заключение

Краснодар ежегодно входит в топ-5 городов России по комфорту и качеству жизни, в то время как непосредственно сам Краснодарский край является одним из наиболее динамично развивающихся регионов России, демонстрирующим даже в периоды экономического спада стабильный прирост валового регионального продукта и средних зарплат населения, несмотря на общие для всей страны негативные тенденции. В связи с этим, большой интерес для предметного размышления вызывает вопрос: насколько сильно развитие экономического потенциала данного субъекта РФ и уровня оплаты труда сказывается на динамике населения? Именно изучению этого вопроса было посвящено вышеизложенное исследование. Подведём некоторые итоги анализа зависимости численности населения Краснодарского края от уровня ВРП и средней зарплаты на душу населения

Составленная модель зависимости является адекватной, а ее спецификация - качественной. Коэффициент детерминации показывает на высокий уровень связи между переменными.

В изначально сформированной модели соблюдаются первая, вторая четвертая – предпосылки теоремы Гаусса-Маркова о равенстве математических ожиданий и независимости регрессоров и случайных возмущений соответственно. Имеет место ложная автокорреляция, что при условии гомоскедастичности случайных остатков указывает на то, что использовать модель на практике, при прогнозировании, можно только при учете ее неточности.

Данная модель также была проверена на наличие типичных ошибок: неправильно выбранный тип связи и наличие незначащих регрессоров. В результате можно прийти к выводу о том, что данная модель является вполне качественной и объясняет наличие взаимосвязи между переменными. Также стоит отметить, что регрессоры для модели были выбраны верно, что подтвердил t-критерий Стьюдента.

Цель работы была достигнута, а задачи выполнены, то есть в ходе ее реализации усвоены и закреплены полученные знания. Модель была разработана, оценена и проверена по критериям качественности и адекватности, так же проверены предпосылки теоремы Гаусса-Маркова. В итоге можно сделать вывод, что модель оказалась более ли менее правдивой и работоспособной.

Анализ модели не исключает возможность использования других более значимых факторов. Также, возможно, имеет место ошибка изменения параметрами модели своих значений вследствие структурных сдвигов в экономике, так как данные были взять не по субъектному, а по временному критерию.

 

Список литературы

В.А. Бывшев / Эконометрика: учебное пособие. – М.: Финансы и статистика, 2008. — 480 С.

А.В. Верников / Доля иностранного капитала в банковском секторе: вопросы методологии. — М: Деньги и кредит №11, 2014. — 9 С.

Лаврова Татьяна Георгиевна Роль и потенциал малых городов в развитии региона (на примере Краснодарского края) // Вестн. Том. гос. ун-та. 2015. №399. URL: https://cyberleninka.ru/article/n/rol-i-potentsial-malyh-gorodov-v-razvitii-regiona-na-primere-krasnodarskogo-kraya (дата обращения: 27.01.2020).

Козлова Елена Ивановна, Новак Максим Андреевич Обзор методик выявления взаимосвязи динамики занятости населения и валового регионального продукта // Инновационная экономика: перспективы развития и совершенствования. 2018. №8 (34). URL: https://cyberleninka.ru/article/n/obzor-metodik-vyyavleniya-vzaimosvyazi-dinamiki-zanyatosti-naseleniya-i-valovogo-regionalnogo-produkta (дата обращения: 27.01.2020).

Управление Федеральной службы государственной статистики по Краснодарскому краю и Республике Адыгея

https://krsdstat.gks.ru (дата обращения: 27.01.2020).

Просмотров работы: 87