Влияние социально-экономических факторов на среднедушевой доход - Студенческий научный форум

XIII Международная студенческая научная конференция Студенческий научный форум - 2021

Влияние социально-экономических факторов на среднедушевой доход

Юрова Л.И. 1, Ященко Н.А. 1
1ФУ при Правительстве РФ
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Учитывая мировые тенденции и рост значимости показателя благосостояния населения, которое учитывает множество факторов экономического, экологического и социального характера, всё большее значение приобретает среднедушевой доход населения.

Часто эксперты берут «Индекс Бигмака» для определения паритета покупательной способности, который столь актуален по нескольким причинам. Прежде всего, сеть McDonalds есть почти во всех странах мира, а Бигмак имеет в составе основные продукты питания любого человека: овощи, мясо, сыр и хлеб.

Можно расценивать, что и среднедушевой доход отражает как минимум усреднённые доходы на человека, если мы не берём данные в разрезе регионов, что в значительной степени отражает уровень жизни по стране.

Влияет на покупательную способность не только доход, но и инфляция, порождающая обесценивание денежных средств граждан. Если вчера человек мог купить на тысячу рублей хороший букет, а сегодня один цветок, то явно стоит корректировать на инфляцию покупательную способность и доходы населения, которые в том числе индексируются.

Итоговая стоимость всех произведённых благ и услуг внутри страны, иначе называемая Валовым внутренним продуктом, как макроэкономический показатель также играет не последнюю роль в определении уровня благосостояния нации и связан с вышеописанным.

Целью данной работы является выявить влияние различных факторов на среднедушевой доход.

Для достижения поставленной цели необходимо выполнить следующие задачи:

Выявить возможные факторы, имеющие влияние на показатель;

Составить спецификацию модели;

Собрать статистику по показателям;

Оценить модель, проверить её на типичные ошибки, предпосылки Гаусса-Маркова, проверить качество;

Проверить адекватность полученной модели с помощью интервального прогнозирования;

Актуальность заключается прежде всего в том, что в условиях политической и экономической неопределённости и высокому уровню глобализации на рассматриваемый показатель могут оказывать влияние множество факторов, среди которых необходимо выделить наиболее понятные и точно объясняющие.

При подсчёте уровня доходов населения наиболее часто используют показатели среднедушевые доходы и расходы. Связанно это с тем, что они наиболее точно отражают реальную картину финансовых средств на одного человека, а также необходимые траты на обеспечение этого человека минимально необходимым набором товаров и услуг.

Для расчёта среднедушевых доходов используют следующие методики:

Предварительно вычисляется совокупный национальный доход страны. Естественно, что это делается первоначально в национальной валюте.

Затем полученную величину делят на численность населения за отчетный период. Учитывают всех, независимо от того, является гражданин работающим или нет. Только таким образом можно действительно оценить, как живут все слои населения, независимо от их возраста.

Итоговая величина и является искомым числом.

Если рассматривать показатели, рассчитанные Росгосстат [2;3]. Можно увидеть, что по федеральным округам среднедушевой доход действительно сильно разнится, но это логично, так как, например, в центральном федеральном округе есть Москва и Московская область, где рассчитанный показатель равен 66377 и 43997 соответственно. Если опускаться до областей, то картина ещё более уточниться, поэтому применить известную фразу «средняя температура по больнице 36,6» уже не получится. Для работы с такими данными можно использовать ВРП, аналог ВВП, но разбитый на регионы/области/федеральные округа.

Логично предположить, что количество произведенных товаров и услуг в стоимостном выражении связано со стоимостью продуктов, которые себе может позволить человек на среднедушевой доход [1;4]. При этом сотрудники предприятий получают заработную плату за производство и предоставление товаров и услуг. В совокупности это влияет и на устанавливаемые уровни прожиточного минимума по стране и по регионам.

Рассмотри также уровень инфляции, величину прожиточного минимум на душу населения и индекс потребительских цен. Инфляция отражает изменение уровня цен в стране за определённый период, например к предыдущему году или кварталу. Так как рост цен в последствии ведет к росту номинальной заработной платы, как и среднедушевых денежных доходов населения. Аналогично и с величиной прожиточного минимума на душу населения. Индекс потребительских цен измеряет среднее изменение цен, уплачиваемых потребителями за корзину товаров и услуг, обычно известное как инфляция. По существу, он пытается количественно оценить совокупный уровень цен в экономике и таким образом измерить покупательную способность денежной единицы страны. Для расчета ИПЦ используется средневзвешенное значение цен на товары и услуги, которое аппроксимирует структуру потребления индивида. Так как данный показатель также отражает финансовое благосостояние одного человека, то рассмотрим его в модели.

Итак, в соответствии с алгоритмом построения эконометрической модели построим спецификацию. За эндогенную переменную Y был взят среднедушевой доход по России. За экзогенные переменные были приняты ВВП, уровень инфляции, величина прожиточного минимума на душу населения и индекс потребительских цен, где ВВП – это х1, уровень инфляции – х2, величина прожиточного минимума на душу населения – х3, индекс потребительских цен – х4. По всем переменным была собрана квартальная статистика за 1 квартал 2006 – 2 квартал 2019 г. В статистику было включено 54 квартала, 3 из которых были отобраны в контролирующую выборку для проверки адекватности модели. А именно наблюдения под номерами 4, 23, 49.

Для исследования среднедушевого дохода была выбрана следующая спецификация:

Линейный вид следует из графика зависимости x и Y

Далее из набора данных были исключены контролирующие наборы и проведена процедура МНК для оценки коэффициентов через функцию ЛИНЕЙН в Excel

Оценённый вид модели:

Далее необходимо проверить модель на ошибки, проверить выполнение предпосылок теоремы Гаусса-Маркова, адекватность и качественность.

Для того, чтобы сказать, что модель действительно рабочая надо провести тестирование на ошибки первого, второго, третьего и четвёртого рода.

Для проверки первой необходимо построить диаграммы рассеивания Y от каждого X отдельно, то есть в данном случае предположим, что зависимость линейная, так как все значения расположены вдоль прямой линии тренда.

Далее изучим ut на предмет постоянства знака по возрастающим Х. В некоторых промежутках есть знакопостоянство, но в целом они чередуются, поэтому однозначный вывод сделать нельзя

Последним этапом в проверке ошибки первого рода служит проверка оценённых коэффициентов по первой и второй половинам выборки. Выборка из 54 значений и делится на две равных выборки по 27 наборов данных.

Таблица 1 Сравнение оценённых коэффициентов двух половин выборки

Полученные значения сильно различаются, однако сказать о наличии ошибки первого рода по ним однозначно нельзя.

Далее изучим ошибку второго рода. Симптом такой ошибки говорит о включении в модель незначимого регрессора. Для этого на уровне значимости 0,05 рассчитаем Tкрит с помощью функции СТЬЮДЕНТРАСПОБР(0,05;52). Так же рассчитаем оценки параметров:

Полученные значения представлены в Таблице 4

Таблица 2. Значения

Tкр

2,01

Оценка а0

-1,7815

Оценка а1

9,0981

Оценка а2

-0,7661

Оценка а3

-0,1375

Оценка а4

2,002

Так как 4 из 5 значения оценок меньше, чем Ткр, то гипотеза о равенстве а0, а2, а3, а4 нулю принимается, а для а1 отвергается, соответственно регрессоры х2t, х3t и х4t признаются не значимыми и их оценки являются не значимыми с точки зрения объяснения эндогенной переменной, поэтому далее перейдём к новому виду модели, который также проверим на наличие ошибок.

Таким образом для исследования среднедушевого дохода была выбрана следующая итоговая спецификация:

Где а0-свободный коэффициент, х1t - ВВП

Линейный вид следует из графика зависимости x и Y

Рис. 1

Далее из набора данных были исключены контролирующие наборы и проведена процедура МНК для оценки коэффициентов через функцию ЛИНЕЙН в Excel. Следует отметить, что по этим двум показателям количество доступных наборов статистики было выше, поэтому выборка была увеличена до 56 значений с данными до 3 квартала 2020 года.

Оценённый вид модели:

Далее необходимо проверить новую модель на ошибки, проверить выполнение предпосылок теоремы Гаусса-Маркова, адекватность и качественность

Для этого разобьём выборку из 56 значений на две по 28 и применим к каждой функцию ЛИНЕЙН

Для проверки первой необходимо построить диаграммы рассеивания Y от X отдельно, Рис. 1 наглядно показывает, что все значения расположены вдоль прямой линии тренда.

Далее изучим ut на предмет постоянства знака по возрастающим Х. В некоторых промежутках есть знакопостоянство, но в целом они чередуются, поэтому однозначный вывод сделать нельзя

Последним этапом в проверке ошибки первого рода служит проверка оценённых коэффициентов по первой и второй половинам выборки.

1 половина

2 половина

1,21233714

3427,417

0,964050406

9078,97

0,079192606

965,9468

0,108435942

2534,132

0,900137041

1550,91

0,752477836

1996,553

234,3567945

26

79,04109833

26

563703615,3

62538379

315075591,4

1,04E+08

Таблица 3 Сравнение оценённых коэффициентов двух половин выборки

Полученные значения различаются, однако сказать о наличии ошибки первого рода по ним однозначно нельзя.

Далее изучим ошибку второго рода. Симптом такой ошибки говорит о включении в модель незначимого регрессора. Для этого на уровне значимости 0,05 рассчитаем Tкрит с помощью функции СТЬЮДЕНТРАСПОБР(0,05;54). Так же рассчитаем оценки параметров:

Полученные значения представлены в Таблице 4

Таблица 4. Значения

Tкр

2,00

Оценка а0

5,971

Оценка а1

32,295

Значения оценок меньше, чем Ткр, гипотеза о неравенстве a0 и а1 отвергается, соответственно регрессоры признаются значимыми и их оценки являются значимыми с точки зрения объяснения эндогенной переменной.

Таким образом для исследования среднедушевого дохода была выбрана данная спецификация.

Проверка симптомов ошибки третьего типа заключается в проведении теста Дарбина-Уотсона. Дело в том, что в эконометрической модели может быть пропуск объясняющей переменной, он аналогичен первому типу ошибок. Различие заключается в том, что в первом случае мы ориентируемся на графический анализ, в то время как в третьем типе мы рассматриваем результаты теста ДУ. Проведём этот тест, для этого рассчитаем сумму квадратов разности текущего и лагового значений случайных остатков и сумму квадратов текущих случайных остатков.

Объём выборки составляет 56 значений с k=1, согласно таблице статистики Дарбина-Уотсона получаем следующие границы:

Рисунок 2. Интервалы теста Дарбина-Уотсона

Где границы определены следующим образом

Таблица 5. Значения dl, du, 4-dl, 4-du

dl

1,53

du

1,6

4-dl

2,47

4-du

2,4

Подставив значение на график можно заметить, что статистика DW попадает чуть левее 2, то есть в интервал М3, согласно которому мы принимаем гипотезу H0 об отсутствии автокорреляции, то есть у нас нет ни положительного, ни отрицательного её проявления.

Последний, но не менее значимый тест на ошибку четвертого типа, проверяющий наличие сдвига. Для этого воспользуемся тестом Чоу.

Предположение заключается в том, что данные взяты в период с 2006 по 2020 год, они включают в себя 2008 год, когда был международный кризис. Поэтому необходимо разбить выборку на две части: с 206 по 2008 и с 2008 по 2020 года.

Таблица 6. МНК оценка выборки до предполагаемого сдвига

До структурного сдвига

n'

до 2008

 

 

1,424733452

1392,543219

0,201310273

1538,025013

0,90923645

699,5169834

50,08819343

5

24509355,66

2446620,05

Таблица 7. МНК оценка выборки после предполагаемого сдвига

После структурного сдвига

n''

после 208

 

 

1,138567097

4825,268268

0,045465515

896,4466422

0,930279831

1919,942235

627,1234402

47

2311688745

173250374,70

Далее рассчитаем Fкрит и Z статистику

Так как Z меньше Fкрит, получается, что тест Чоу не показал структурного сдвига в данных, а следовательно модель должна оцениваться по параметрам всей выборки.

Проверим модель на качественность. Для проверки необходимо осуществить процедуру F-теста, которая требует нахождения F-критического и F-статического, при этом, если Fкр<Fкр, то модель признаётся качественной.

В нашем случае получим следующие данные:

Так как Fкр<Fтест, гипотеза об отсутствии влияния факторов отвергается и принимает альтернатива о значительном влиянии фактора х1, а модель соответственно признаётся качественной.

Так как основные предпосылки МНК ассоциируются с теоремой Гаусса-Маркова и представляют собой перечень условий для случайных отклонений эконометрической модели, выполнение которых обеспечивает статистическую проверку значимости параметров регрессии, проверим эти предпосылки.

Важно отметить, что выполнение предпосылок обеспечивает несмещенность, эффективность полученных оценок и, как минимум, их состоятельность.

Первая предпосылка гласит, что математическое ожидание случайного остатка равно нулю для всех наблюдений. Так как рассмотренная модель включаем коэффициент свободного члена (Constanta), то это условие выполняется априорно. Убедимся в этом рассчитав математическое ожидание, которое действительно оказывается равно нулю.

Для второй предпосылки теоремы Гаусса-Маркова рассмотрим дисперсии случайных остатков. В случае невыполнения предпосылки

Для оценки гомоскедастичности проведем тест Голдфильда-Квандта и рассмотрев диаграмму случайных остатков.

Рисунок 3. Распределение случайных остатков модели

Так как графическое решение нельзя назвать 100% надежным, проведем тест GQ:

Упорядочим статистику по возрастанию регрессора x

Упорядоченные данные разделим на три группы, где n’1=n’2=19 ([56/3])

Найдём через ЛИНЕЙН МНК оценки по первой и третьей выборкам

Таблица 8. Оцененные коэффициенты для n’1 и n’2

Рассчитаем коэффициенты GQ и 1/GQ

=0,527; 1/GQ=1,898

5) Найдём F критическое на уровне значимости 5% и v1=v2=17

F критическое = 2,334

GQ<Fкр и 1/GQ<Fкр

Гипотеза о гомоскедастичности принимается. Значит предпосылка о постоянстве дисперсии случайных остатков является адекватной.

Третья предпосылка: случайные остатки являются независимы друг от друга. В случае невыполнения делается вывод об автокорреляции случайных отклонений. Автокорреляция предполагает корреляционную связь между значениями одного и того же случайного процесса в предшествующий и текущий периоды. Другими словами, отсутствует систематическая связь между любыми случайными отклонениями, т.е. ни величина, ни определенный знак любого случайного отклонения не должны быть причинами величины и знака любого другого отклонения.

Мы уже проверяли автокорреляцию в качестве тестирования на наличие 3 ошибки с помощью теста Дарбина-Уотсона, который показал попадание в М3, те отсутствие данного явления.

Далее рассматривается предпосылка о независимости случайного отклонения от объясняющих переменных. Иначе говоря, случайное отклонение есть величина случайная, а объясняющая – нет. Для этого была построена ковариационная матрица с помощью надстройки «Анализ данных»

 

x

ut

x

45890265,90

 

ut

0,00

3275773,70

Таблица 9. Проверка ковариации

Действительно, между ВВП и случайными остатками ковариация равна нулю.

Еще одной предпосылкой теоремы Гаусса-Маркова является распределение случайного остатка согласно нормальному закону распределения. Для этого была построена следующая диаграмма:

Рисунок 4. Диаграмма распределения случайных остатков

Как известно, нормальное распределение на диаграмме должно приобретать колоколообразный вид, что и наблюдается на рисунке 4.

Ещё одна предпосылка заключается в отсутствии высокой взаимной коррелированности экзогенных переменных. Однако данная предпосылка неактуальна для модели парной регрессии. В самом начале автор уже приводил эту предпосылку как одну из причин отбрасывания тех или иных регрессоров.

Все предпосылки Гаусса-Маркова Маркова являются адекватными для модели, следовательно модель оценена верно при помощи метода наименьших квадратов, а ее оценки обладают свойствами несмещённости и эффективности.

Так как основной целью эконометрической модели является прогнозирование возможных будущих значений эндогенной переменной, то важно, чтобы она была адекватной. Для этого проведём интервальное прогнозирование.

Для этого необходимо осуществить прогноз для каждого уравнения наблюдения контролирующей выборки и получить результаты оценённого Y и стандартную ошибку прогноза

Таблица 10. Проверка адекватности модели с помощью интервального прогнозирования

 

Syi

Y0-

Y0+

Y1=12830,1

1894,66

9031,554

16628,682

Y2=20773,80

1862,292

17040,130

24507,473

Y3=29579,5

1865,793

25839,162

33320,541

Tкрит рассчитывался как CТЬЮДЕНТ.ОБР.2Х(1-0,95;54)

Границы интервалов рассчитывались по следующим формулам для парной регрессии:

Таблица 11. Прогнозирование

y*min

y*max

y

Y1

9031,554

16628,682

12203,0

Y2

17040,130

24507,473

20512,3

Y3

25839,162

33320,541

28750,6

В прогнозные интервалы попадают контролирующие значения Y, поэтому модель признаётся адекватной.

В ходе анализа влияния ВВП на среднедушевой доход населения России было установлено, что для описания вышеприведенной зависимости наиболее подходящим вариантом спецификации является линейная модель парной регрессии.

Отсутствие ошибок в составлении модели дают право доверять результатам дальнейшей работы с ней.

Параметры полученной оцененной модели являются оптимальными, т.е. несмещенными и эффективными. Значит, мы можем использовать процедуру МНК для настройки модели по параметрам обоснованно.

При проведении интервального прогноза были выбраны 3 контролирующие выборки. По результатам все значения попали в прогнозные интервалы, тем самым была установлена адекватность исследуемой модели с 95% уровнем доверия.

Данная модель применима на практике, но есть несколько моментов, которые необходимо учесть при её применении.

Во-первых, полученное прогнозное значение может иметь довольно большое отклонение от фактического.

Во-вторых, для получения более точной модели необходимо работать с гораздо более объёмной выборкой.

В-третьих, модель учитывает только один регрессор и исключает систематическое воздействие на среднедушевые доходы пособий, единоразовых выплат (как в 2017 году с пенсиями), инфляцию и другие менее значимые показатели, имеющие слабую и среднюю степени влияния на рассмотренный фактор.

Список используемой литературы

ЕМИСС Государственная статистика [Электронный ресурс] URL: https://www.fedstat.ru/indicator/57039 (дата обращения 18.12.20)

Федеральная служба государственной статистики [Электронный ресурс] URL:http://old.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/population/level/ (дата обращения 18.12.20)

Федеральная служба государственной статистики [Электронный ресурс] http://old.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/accounts/ (дата обращения 18.12.20)

Инфо таблицы [Электронный ресурс] URL: https://infotables.ru/statistika/31-rossijskaya-federatsiya/790-srednedushevye-denezhnye-dokhody

Приложения

Просмотров работы: 8