Учитывая мировые тенденции и рост значимости показателя благосостояния населения, которое учитывает множество факторов экономического, экологического и социального характера, всё большее значение приобретает среднедушевой доход населения.
Часто эксперты берут «Индекс Бигмака» для определения паритета покупательной способности, который столь актуален по нескольким причинам. Прежде всего, сеть McDonald’s есть почти во всех странах мира, а Бигмак имеет в составе основные продукты питания любого человека: овощи, мясо, сыр и хлеб.
Можно расценивать, что и среднедушевой доход отражает как минимум усреднённые доходы на человека, если мы не берём данные в разрезе регионов, что в значительной степени отражает уровень жизни по стране.
Влияет на покупательную способность не только доход, но и инфляция, порождающая обесценивание денежных средств граждан. Если вчера человек мог купить на тысячу рублей хороший букет, а сегодня один цветок, то явно стоит корректировать на инфляцию покупательную способность и доходы населения, которые в том числе индексируются.
Итоговая стоимость всех произведённых благ и услуг внутри страны, иначе называемая Валовым внутренним продуктом, как макроэкономический показатель также играет не последнюю роль в определении уровня благосостояния нации и связан с вышеописанным.
Целью данной работы является выявить влияние различных факторов на среднедушевой доход.
Для достижения поставленной цели необходимо выполнить следующие задачи:
Выявить возможные факторы, имеющие влияние на показатель;
Составить спецификацию модели;
Собрать статистику по показателям;
Оценить модель, проверить её на типичные ошибки, предпосылки Гаусса-Маркова, проверить качество;
Проверить адекватность полученной модели с помощью интервального прогнозирования;
Актуальность заключается прежде всего в том, что в условиях политической и экономической неопределённости и высокому уровню глобализации на рассматриваемый показатель могут оказывать влияние множество факторов, среди которых необходимо выделить наиболее понятные и точно объясняющие.
При подсчёте уровня доходов населения наиболее часто используют показатели среднедушевые доходы и расходы. Связанно это с тем, что они наиболее точно отражают реальную картину финансовых средств на одного человека, а также необходимые траты на обеспечение этого человека минимально необходимым набором товаров и услуг.
Для расчёта среднедушевых доходов используют следующие методики:
Предварительно вычисляется совокупный национальный доход страны. Естественно, что это делается первоначально в национальной валюте.
Затем полученную величину делят на численность населения за отчетный период. Учитывают всех, независимо от того, является гражданин работающим или нет. Только таким образом можно действительно оценить, как живут все слои населения, независимо от их возраста.
Итоговая величина и является искомым числом.
Если рассматривать показатели, рассчитанные Росгосстат [2;3]. Можно увидеть, что по федеральным округам среднедушевой доход действительно сильно разнится, но это логично, так как, например, в центральном федеральном округе есть Москва и Московская область, где рассчитанный показатель равен 66377 и 43997 соответственно. Если опускаться до областей, то картина ещё более уточниться, поэтому применить известную фразу «средняя температура по больнице 36,6» уже не получится. Для работы с такими данными можно использовать ВРП, аналог ВВП, но разбитый на регионы/области/федеральные округа.
Логично предположить, что количество произведенных товаров и услуг в стоимостном выражении связано со стоимостью продуктов, которые себе может позволить человек на среднедушевой доход [1;4]. При этом сотрудники предприятий получают заработную плату за производство и предоставление товаров и услуг. В совокупности это влияет и на устанавливаемые уровни прожиточного минимума по стране и по регионам.
Рассмотри также уровень инфляции, величину прожиточного минимум на душу населения и индекс потребительских цен. Инфляция отражает изменение уровня цен в стране за определённый период, например к предыдущему году или кварталу. Так как рост цен в последствии ведет к росту номинальной заработной платы, как и среднедушевых денежных доходов населения. Аналогично и с величиной прожиточного минимума на душу населения. Индекс потребительских цен измеряет среднее изменение цен, уплачиваемых потребителями за корзину товаров и услуг, обычно известное как инфляция. По существу, он пытается количественно оценить совокупный уровень цен в экономике и таким образом измерить покупательную способность денежной единицы страны. Для расчета ИПЦ используется средневзвешенное значение цен на товары и услуги, которое аппроксимирует структуру потребления индивида. Так как данный показатель также отражает финансовое благосостояние одного человека, то рассмотрим его в модели.
Итак, в соответствии с алгоритмом построения эконометрической модели построим спецификацию. За эндогенную переменную Y был взят среднедушевой доход по России. За экзогенные переменные были приняты ВВП, уровень инфляции, величина прожиточного минимума на душу населения и индекс потребительских цен, где ВВП – это х1, уровень инфляции – х2, величина прожиточного минимума на душу населения – х3, индекс потребительских цен – х4. По всем переменным была собрана квартальная статистика за 1 квартал 2006 – 2 квартал 2019 г. В статистику было включено 54 квартала, 3 из которых были отобраны в контролирующую выборку для проверки адекватности модели. А именно наблюдения под номерами 4, 23, 49.
Для исследования среднедушевого дохода была выбрана следующая спецификация:
Линейный вид следует из графика зависимости x и Y
Далее из набора данных были исключены контролирующие наборы и проведена процедура МНК для оценки коэффициентов через функцию ЛИНЕЙН в Excel
Оценённый вид модели:
Далее необходимо проверить модель на ошибки, проверить выполнение предпосылок теоремы Гаусса-Маркова, адекватность и качественность.
Для того, чтобы сказать, что модель действительно рабочая надо провести тестирование на ошибки первого, второго, третьего и четвёртого рода.
Для проверки первой необходимо построить диаграммы рассеивания Y от каждого X отдельно, то есть в данном случае предположим, что зависимость линейная, так как все значения расположены вдоль прямой линии тренда.
Далее изучим ut на предмет постоянства знака по возрастающим Х. В некоторых промежутках есть знакопостоянство, но в целом они чередуются, поэтому однозначный вывод сделать нельзя
Последним этапом в проверке ошибки первого рода служит проверка оценённых коэффициентов по первой и второй половинам выборки. Выборка из 54 значений и делится на две равных выборки по 27 наборов данных.
Таблица 1 Сравнение оценённых коэффициентов двух половин выборки
Полученные значения сильно различаются, однако сказать о наличии ошибки первого рода по ним однозначно нельзя.
Далее изучим ошибку второго рода. Симптом такой ошибки говорит о включении в модель незначимого регрессора. Для этого на уровне значимости 0,05 рассчитаем Tкрит с помощью функции СТЬЮДЕНТРАСПОБР(0,05;52). Так же рассчитаем оценки параметров:
Полученные значения представлены в Таблице 4
Таблица 2. Значения
Tкр |
2,01 |
Оценка а0 |
-1,7815 |
Оценка а1 |
9,0981 |
Оценка а2 |
-0,7661 |
Оценка а3 |
-0,1375 |
Оценка а4 |
2,002 |
Так как 4 из 5 значения оценок меньше, чем Ткр, то гипотеза о равенстве а0, а2, а3, а4 нулю принимается, а для а1 отвергается, соответственно регрессоры х2t, х3t и х4t признаются не значимыми и их оценки являются не значимыми с точки зрения объяснения эндогенной переменной, поэтому далее перейдём к новому виду модели, который также проверим на наличие ошибок.
Таким образом для исследования среднедушевого дохода была выбрана следующая итоговая спецификация:
Где а0-свободный коэффициент, х1t - ВВП
Линейный вид следует из графика зависимости x и Y
Рис. 1
Далее из набора данных были исключены контролирующие наборы и проведена процедура МНК для оценки коэффициентов через функцию ЛИНЕЙН в Excel. Следует отметить, что по этим двум показателям количество доступных наборов статистики было выше, поэтому выборка была увеличена до 56 значений с данными до 3 квартала 2020 года.
Оценённый вид модели:
Далее необходимо проверить новую модель на ошибки, проверить выполнение предпосылок теоремы Гаусса-Маркова, адекватность и качественность
Для этого разобьём выборку из 56 значений на две по 28 и применим к каждой функцию ЛИНЕЙН
Для проверки первой необходимо построить диаграммы рассеивания Y от X отдельно, Рис. 1 наглядно показывает, что все значения расположены вдоль прямой линии тренда.
Далее изучим ut на предмет постоянства знака по возрастающим Х. В некоторых промежутках есть знакопостоянство, но в целом они чередуются, поэтому однозначный вывод сделать нельзя
Последним этапом в проверке ошибки первого рода служит проверка оценённых коэффициентов по первой и второй половинам выборки.
1 половина |
2 половина |
||
1,21233714 |
3427,417 |
0,964050406 |
9078,97 |
0,079192606 |
965,9468 |
0,108435942 |
2534,132 |
0,900137041 |
1550,91 |
0,752477836 |
1996,553 |
234,3567945 |
26 |
79,04109833 |
26 |
563703615,3 |
62538379 |
315075591,4 |
1,04E+08 |
Таблица 3 Сравнение оценённых коэффициентов двух половин выборки
Полученные значения различаются, однако сказать о наличии ошибки первого рода по ним однозначно нельзя.
Далее изучим ошибку второго рода. Симптом такой ошибки говорит о включении в модель незначимого регрессора. Для этого на уровне значимости 0,05 рассчитаем Tкрит с помощью функции СТЬЮДЕНТРАСПОБР(0,05;54). Так же рассчитаем оценки параметров:
Полученные значения представлены в Таблице 4
Таблица 4. Значения
Tкр |
2,00 |
Оценка а0 |
5,971 |
Оценка а1 |
32,295 |
Значения оценок меньше, чем Ткр, гипотеза о неравенстве a0 и а1 отвергается, соответственно регрессоры признаются значимыми и их оценки являются значимыми с точки зрения объяснения эндогенной переменной.
Таким образом для исследования среднедушевого дохода была выбрана данная спецификация.
Проверка симптомов ошибки третьего типа заключается в проведении теста Дарбина-Уотсона. Дело в том, что в эконометрической модели может быть пропуск объясняющей переменной, он аналогичен первому типу ошибок. Различие заключается в том, что в первом случае мы ориентируемся на графический анализ, в то время как в третьем типе мы рассматриваем результаты теста ДУ. Проведём этот тест, для этого рассчитаем сумму квадратов разности текущего и лагового значений случайных остатков и сумму квадратов текущих случайных остатков.
Объём выборки составляет 56 значений с k=1, согласно таблице статистики Дарбина-Уотсона получаем следующие границы:
Рисунок 2. Интервалы теста Дарбина-Уотсона
Где границы определены следующим образом
Таблица 5. Значения dl, du, 4-dl, 4-du
dl |
1,53 |
du |
1,6 |
4-dl |
2,47 |
4-du |
2,4 |
Подставив значение на график можно заметить, что статистика DW попадает чуть левее 2, то есть в интервал М3, согласно которому мы принимаем гипотезу H0 об отсутствии автокорреляции, то есть у нас нет ни положительного, ни отрицательного её проявления.
Последний, но не менее значимый тест на ошибку четвертого типа, проверяющий наличие сдвига. Для этого воспользуемся тестом Чоу.
Предположение заключается в том, что данные взяты в период с 2006 по 2020 год, они включают в себя 2008 год, когда был международный кризис. Поэтому необходимо разбить выборку на две части: с 206 по 2008 и с 2008 по 2020 года.
Таблица 6. МНК оценка выборки до предполагаемого сдвига
До структурного сдвига |
|
n' |
до 2008 |
|
|
1,424733452 |
1392,543219 |
0,201310273 |
1538,025013 |
0,90923645 |
699,5169834 |
50,08819343 |
5 |
24509355,66 |
2446620,05 |
Таблица 7. МНК оценка выборки после предполагаемого сдвига
После структурного сдвига |
|
n'' |
после 208 |
|
|
1,138567097 |
4825,268268 |
0,045465515 |
896,4466422 |
0,930279831 |
1919,942235 |
627,1234402 |
47 |
2311688745 |
173250374,70 |
Далее рассчитаем Fкрит и Z статистику
Так как Z меньше Fкрит, получается, что тест Чоу не показал структурного сдвига в данных, а следовательно модель должна оцениваться по параметрам всей выборки.
Проверим модель на качественность. Для проверки необходимо осуществить процедуру F-теста, которая требует нахождения F-критического и F-статического, при этом, если Fкр<Fкр, то модель признаётся качественной.
В нашем случае получим следующие данные:
Так как Fкр<Fтест, гипотеза об отсутствии влияния факторов отвергается и принимает альтернатива о значительном влиянии фактора х1, а модель соответственно признаётся качественной.
Так как основные предпосылки МНК ассоциируются с теоремой Гаусса-Маркова и представляют собой перечень условий для случайных отклонений эконометрической модели, выполнение которых обеспечивает статистическую проверку значимости параметров регрессии, проверим эти предпосылки.
Важно отметить, что выполнение предпосылок обеспечивает несмещенность, эффективность полученных оценок и, как минимум, их состоятельность.
Первая предпосылка гласит, что математическое ожидание случайного остатка равно нулю для всех наблюдений. Так как рассмотренная модель включаем коэффициент свободного члена (Constanta), то это условие выполняется априорно. Убедимся в этом рассчитав математическое ожидание, которое действительно оказывается равно нулю.
Для второй предпосылки теоремы Гаусса-Маркова рассмотрим дисперсии случайных остатков. В случае невыполнения предпосылки
Для оценки гомоскедастичности проведем тест Голдфильда-Квандта и рассмотрев диаграмму случайных остатков.
Рисунок 3. Распределение случайных остатков модели
Так как графическое решение нельзя назвать 100% надежным, проведем тест GQ:
Упорядочим статистику по возрастанию регрессора x
Упорядоченные данные разделим на три группы, где n’1=n’2=19 ([56/3])
Найдём через ЛИНЕЙН МНК оценки по первой и третьей выборкам
Таблица 8. Оцененные коэффициенты для n’1 и n’2
Рассчитаем коэффициенты GQ и 1/GQ
=0,527; 1/GQ=1,898
5) Найдём F критическое на уровне значимости 5% и v1=v2=17
F критическое = 2,334
GQ<Fкр и 1/GQ<Fкр
Гипотеза о гомоскедастичности принимается. Значит предпосылка о постоянстве дисперсии случайных остатков является адекватной.
Третья предпосылка: случайные остатки являются независимы друг от друга. В случае невыполнения делается вывод об автокорреляции случайных отклонений. Автокорреляция предполагает корреляционную связь между значениями одного и того же случайного процесса в предшествующий и текущий периоды. Другими словами, отсутствует систематическая связь между любыми случайными отклонениями, т.е. ни величина, ни определенный знак любого случайного отклонения не должны быть причинами величины и знака любого другого отклонения.
Мы уже проверяли автокорреляцию в качестве тестирования на наличие 3 ошибки с помощью теста Дарбина-Уотсона, который показал попадание в М3, те отсутствие данного явления.
Далее рассматривается предпосылка о независимости случайного отклонения от объясняющих переменных. Иначе говоря, случайное отклонение есть величина случайная, а объясняющая – нет. Для этого была построена ковариационная матрица с помощью надстройки «Анализ данных»
|
x |
ut |
x |
45890265,90 |
|
ut |
0,00 |
3275773,70 |
Таблица 9. Проверка ковариации
Действительно, между ВВП и случайными остатками ковариация равна нулю.
Еще одной предпосылкой теоремы Гаусса-Маркова является распределение случайного остатка согласно нормальному закону распределения. Для этого была построена следующая диаграмма:
Рисунок 4. Диаграмма распределения случайных остатков
Как известно, нормальное распределение на диаграмме должно приобретать колоколообразный вид, что и наблюдается на рисунке 4.
Ещё одна предпосылка заключается в отсутствии высокой взаимной коррелированности экзогенных переменных. Однако данная предпосылка неактуальна для модели парной регрессии. В самом начале автор уже приводил эту предпосылку как одну из причин отбрасывания тех или иных регрессоров.
Все предпосылки Гаусса-Маркова Маркова являются адекватными для модели, следовательно модель оценена верно при помощи метода наименьших квадратов, а ее оценки обладают свойствами несмещённости и эффективности.
Так как основной целью эконометрической модели является прогнозирование возможных будущих значений эндогенной переменной, то важно, чтобы она была адекватной. Для этого проведём интервальное прогнозирование.
Для этого необходимо осуществить прогноз для каждого уравнения наблюдения контролирующей выборки и получить результаты оценённого Y и стандартную ошибку прогноза
Таблица 10. Проверка адекватности модели с помощью интервального прогнозирования
Syi |
Y0- |
Y0+ |
|
Y1=12830,1 |
1894,66 |
9031,554 |
16628,682 |
Y2=20773,80 |
1862,292 |
17040,130 |
24507,473 |
Y3=29579,5 |
1865,793 |
25839,162 |
33320,541 |
Tкрит рассчитывался как CТЬЮДЕНТ.ОБР.2Х(1-0,95;54)
Границы интервалов рассчитывались по следующим формулам для парной регрессии:
Таблица 11. Прогнозирование
№ |
y*min |
y*max |
y |
Y1 |
9031,554 |
16628,682 |
12203,0 |
Y2 |
17040,130 |
24507,473 |
20512,3 |
Y3 |
25839,162 |
33320,541 |
28750,6 |
В прогнозные интервалы попадают контролирующие значения Y, поэтому модель признаётся адекватной.
В ходе анализа влияния ВВП на среднедушевой доход населения России было установлено, что для описания вышеприведенной зависимости наиболее подходящим вариантом спецификации является линейная модель парной регрессии.
Отсутствие ошибок в составлении модели дают право доверять результатам дальнейшей работы с ней.
Параметры полученной оцененной модели являются оптимальными, т.е. несмещенными и эффективными. Значит, мы можем использовать процедуру МНК для настройки модели по параметрам обоснованно.
При проведении интервального прогноза были выбраны 3 контролирующие выборки. По результатам все значения попали в прогнозные интервалы, тем самым была установлена адекватность исследуемой модели с 95% уровнем доверия.
Данная модель применима на практике, но есть несколько моментов, которые необходимо учесть при её применении.
Во-первых, полученное прогнозное значение может иметь довольно большое отклонение от фактического.
Во-вторых, для получения более точной модели необходимо работать с гораздо более объёмной выборкой.
В-третьих, модель учитывает только один регрессор и исключает систематическое воздействие на среднедушевые доходы пособий, единоразовых выплат (как в 2017 году с пенсиями), инфляцию и другие менее значимые показатели, имеющие слабую и среднюю степени влияния на рассмотренный фактор.
ЕМИСС Государственная статистика [Электронный ресурс] URL: https://www.fedstat.ru/indicator/57039 (дата обращения 18.12.20)
Федеральная служба государственной статистики [Электронный ресурс] URL:http://old.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/population/level/ (дата обращения 18.12.20)
Федеральная служба государственной статистики [Электронный ресурс] http://old.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/accounts/ (дата обращения 18.12.20)
Инфо таблицы [Электронный ресурс] URL: https://infotables.ru/statistika/31-rossijskaya-federatsiya/790-srednedushevye-denezhnye-dokhody
Приложения