МНОГОФАКТОРНОЕ МОДЕЛИРОВАНИЕ ОБОРОТА РОЗНИЧНОЙ ТОРГОВЛИ МЕТОДАМИ КОРРЕЛЯЦИОННО-РЕГРЕССИОННОГО АНАЛИЗА - Студенческий научный форум

VIII Международная студенческая научная конференция Студенческий научный форум - 2016

МНОГОФАКТОРНОЕ МОДЕЛИРОВАНИЕ ОБОРОТА РОЗНИЧНОЙ ТОРГОВЛИ МЕТОДАМИ КОРРЕЛЯЦИОННО-РЕГРЕССИОННОГО АНАЛИЗА

Зырянкин А.А. 1
1Российский экономический университет им. Г.В.Плеханова. Москва, Россия
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Введение

Торговля является конечным звеном любой производственной цепочки, а соответственно, именно от широты и разнообразия каналов, а также уровня их развития зависят эффективность, объемы и скорость, с которыми производимые в экономике и ввозимые на территорию страны товары достигают своего потребителя. Развитая и высоко эффективная торговля, диктуя высокие стандарты качества поставщикам и производителям, фактически выступает участником сферы контроля за качеством продукции, попадающей к потребителям.

Одним из основных макроэкономических показателей потребительского рынка является оборот розничной торговли. Его объем, динамика, структура входят в число показателей, характеризующих экономический потенциал страны. По данному показателю проводят различные международные сопоставления. Оборот розничной торговли является базовым показателем для формирования объема конечного потребления при расчетах ВВП методом конечного использования.

Основным вкладом розничной торговли в повышение качества жизни населения является поддержание социальной стабильности и удовлетворение потребностей населения в товарах. Экономическая сущность оборота розничной торговли проявляется в экономических отношениях, связанных с обменом денежных доходов населения на товары.

Федеральная служба государственной статистики осуществляет сбор и обработку данных об обороте розничной торговли на разных уровнях управления с целью выявления общих закономерностей и тенденций, анализирует межрегиональный обмен, социальные и региональные различия душевого уровня оборота розничной торговли.

Обороты розничной торговли используются в большинстве развитых стран, как индикаторы ожидаемого состояния экономики, так как снижение потребительской активности, неминуемо приводящее к падению темпов экономического роста, быстрее всего отражается на динамике розничного товарооборота.

Оборот розничной торговли как статистический показатель включает объем продажи товаров населению через все каналы реализации: на официально учтенных предприятиях, на вещевых, смешанных и продуктовых рынках; во многом характеризует состояние национальной экономики, отражая положение дел в промышленности, сельском хозяйстве, изменение благосостояния населения, конъюнктуру и емкость внутреннего рынка.

Методология исследования

Целью данной работы является разработка многофакторной регрессионной модели прогнозирования оборота розничной торговли РФ.

Для достижения цели в работе поставлены следующие задачи:

- провести логический анализ предметной области, определить факторы, которые могут влиять на оборот розничной торговли;

- провести корреляционный анализ и выявить наиболее значимые факторы;

- проверить выявленные факторы на мультиколлинеарность;

- построить многофакторную регрессионную модель, отвечающую статистическим требованиям значимости;

- апробировать построенную модель, сделать выводы о качестве ее прогностических свойств.

В качестве исследовательского инструментария использованы методы корреляционного и регрессионного анализа, а также табличные и графические методы представления результатов исследования.

Обработка исходной информации проводилась с использованием электронных таблиц и встроенной надстройки «Анализ данных» в Microsoft Excel.

Информационную базу исследования составили официальные статистические данные Федеральной службы государственной статистики РФ.

Работа с исходными данными

Моделируемой переменной в данном исследовании выступает оборот розничной торговли. Далее необходимо определить перечень факторов, которые могут оказывать влияние на моделируемую переменную.

При построении модели регрессии к факторам, включаемым в модель, предъявляется ряд требований:

1) каждый фактор должен быть обоснован теоретически

2) в модель включаются только те факторы, которые могут быть количественно измерены или отождествлены с цифровыми метками (представлены в виде фиктивных переменных);

3) в модель нельзя включать совокупный фактор и факторы, его образующие;

4) факторы должны быть тесно связаны с исследуемой переменной;

5) факторы должны быть линейно независимы друг от друга.

В ходе содержательного анализа предметной области установлено, что на оборот розничной торговли могут оказывать влияние количество потребителей, уровень доходов потребителей, уровень цен, объем импорта, доля городского населения. Уровень доходов потребителей может быть охарактеризован как средней начисленной заработной платой, так и среднедушевыми денежными доходами. Поэтому принято решение рассмотреть 6 факторов. Исходные данные по значениям моделируемого показателя и выбранных факторов имеются за период с 2000 года и представлены в таблице 1.

Таблица 1 – Исходные данные для анализа

Год

Оборот розничной торговли всего, млн. руб.

Среднемесячная номинальная начисленная заработная плата, руб.

Среднедушевые денежные доходы, руб.

Импорт, млн. долларов США

ИПЦ, % к предыдущему году

Среднегодовая численность населения, млн. чел.

Доля городского населения, %

2000

1 735 155

2 223

2 281

42 131

120,18

146,6

73,13

2001

2 294 218

3 240

3 062

51 317

118,58

146,3

73,18

2002

2 842 888

4 360

3 947

58 418

115,06

145,2

73,28

2003

3 454 649

5 499

5 170

73 214

111,99

145

73,34

2004

4 381 551

6 740

6 410

94 244

111,73

144,3

73,5

2005

5 545 798

8 555

8 088

123 839

110,92

143,8

73,1

2006

7 000 310

10 634

10 155

163 187

109

143,2

73,2

2007

9 218 579

13 593

12 540

223 084

111,87

142,8

73,3

2008

12 113 250

17 290

14 864

288 673

113,28

142,8

73,5

2009

12 655 449

18 638

16 895

183 924

108,8

142,7

73,5

2010

14 457 154

20 952

18 958

245 680

108,78

142,8

73,6

2011

16 898 443

23 369

20 780

318 555

106,1

142,9

73,8

2012

19 126 305

26 629

23 221

335 771

106,57

143

73,9

2013

21 453 829

29 792

25 928

341 337

106,47

143,3

74

2014

24 057 249

32 495

27 755

308 026

111,35

143,7

74,2

Источник: составлено автором по данным Центральной базы статистических данных Федеральной службы государственной статистики (http://cbsd.gks.ru/).

Значения указанных выше данных имеются также на ежемесячной и ежеквартальной основе. Однако, значения факторных признаков в течение года изменяются не существенно. Поэтому принято решение использовать ежегодные данные.

Как видно, все показатели измеряются в различных единицах измерения. Для удобства интерпретации и сопоставимости «масштаба» коэффициентов множественной регрессии принято решение привести все показатели к единой единице измерения, представив их в индексной форме. При такой корректировке количество анализируемых периодов сократится на один, поскольку данные за 2009 год отсутствуют, и индексы можно рассчитать только для периодов с 2001 года. Результаты модификации исходных данных представлены в таблице 2.

Таблица 2 – Исходные данные, приведенные к сопоставимым единицам измерения, % к предыдущему году

Год

Оборот розничной торговли всего

Среднемесячная номинальная начисленная заработная плата

Среднедушевые денежные доходы

Импорт

ИПЦ

Среднегодовая численность населения

Доля городского населения

Y

X1

X2

X3

X4

X5

X6

2001

132,22

145,74

134,23

121,80

118,58

99,80

100,07

2002

123,92

134,56

128,91

113,84

115,06

99,25

100,14

2003

121,52

126,10

130,99

125,33

111,99

99,86

100,08

2004

126,83

122,57

123,98

128,72

111,73

99,52

100,22

2005

126,57

126,94

126,18

131,40

110,92

99,65

99,46

2006

126,23

124,30

125,55

131,77

109,00

99,58

100,14

2007

131,69

127,83

123,49

136,70

111,87

99,72

100,14

2008

131,40

127,19

118,53

129,40

113,28

100,00

100,27

2009

104,48

107,79

113,67

63,71

108,80

99,93

100,00

2010

114,24

112,42

112,21

133,58

108,78

100,07

100,14

2011

116,89

111,54

109,61

129,66

106,10

100,07

100,27

2012

113,18

113,95

111,75

105,40

106,57

100,07

100,14

2013

112,17

111,88

111,66

101,66

106,47

100,21

100,14

2014

112,13

109,07

107,05

90,24

111,35

100,28

100,27

Корреляционный анализ

Оценим тесноту связи всех выбранных факторов с помощью расчета корреляционной матрицы (табл. 3).

Таблица 3 – Матрица коэффициентов парной корреляции

 

Y

X1

X2

X3

X4

X5

X6

Y

1

           

X1

0,85727

1

         

X2

0,74609

0,90750

1

       

X3

0,75946

0,49555

0,44066

1

     

X4

0,66874

0,85660

0,74082

0,19828

1

   

X5

-0,57558

-0,65438

-0,76837

-0,34727

-0,49280

1

 

X6

-0,09362

-0,20107

-0,34151

-0,04270

-0,06115

0,27332

1

Как видно, все факторы Х1, Х2, Х3 имеют тесную связь с результирующей переменной Y (0,7 18,307), то в массиве объясняющих переменных существует мультиколлинеарность.

Далее проверим наличие мультиколлинеарности каждой переменной с другими переменными.

Для этого вычислим обратную матрицу R-1 с помощью функции =МОБР() в MS Excel (табл. 6).

Таблица 6 – Обратная матрица межфакторных коэффициентов корреляции R-1

13,79867

-6,90738

-2,64913

-6,33523

-0,31989

-6,90738

8,29063

0,44118

0,89128

2,44270

-2,64913

0,44118

1,80902

1,59294

0,01868

-6,33523

0,89128

1,59294

5,30649

-0,29257

-0,31989

2,44270

0,01868

-0,29257

2,52988

Обозначим диагональные элементы данной матрицы как cij и рассчитаем фактические значения F-критериев по формуле:

Результаты расчета представлены в таблице 7.

Таблица 7 – Фактические значения F-критериев для исследуемых факторов

F1

F2

F3

F4

F5

22,0778

13,2650

2,8944

8,4904

4,0478

Сравним фактические значения F-критериев с табличным значением Fтабл=4,82 при v1=5 и v2=n-k-1=14-5-1=8 степенях свободы и уровне значимости α = 0,05, где k – количество факторов. Так как значения F-критериев для 1, 2 и 4 фактора больше табличного, то эти факторы мультиколлинеарны с другими. Больше других влияет на общую мультиколлинеарность факторов фактор Х1 (наибольшее значение F-критерия), меньше – фактор Х4.

Теперь проверим наличие мультиколлинеарности каждой пары переменных. Для этого вычислим частные коэффициенты корреляции по формуле

где – элементы обратной матрицы межфакторных корреляций (табл. 6).

Результаты расчетов представлены в таблице 8.

Таблица 8 – Матрица частных коэффициентов корреляции

 

Среднемесячная номинальная начисленная заработная плата, % к предыдущему году

Среднедушевые денежные доходы, % к предыдущему году

Импорт, % к предыдущему году

ИПЦ, % к предыдущему году

Среднегодовая численность населения, % к предыдущему году

Среднемесячная номинальная начисленная заработная плата, % к предыдущему году

         

Среднедушевые денежные доходы, % к предыдущему году

0,64580

       

Импорт, % к предыдущему году

0,53023

-0,11392

     

ИПЦ, % к предыдущему году

0,74036

-0,13437

-0,51413

   

Среднегодовая численность населения, % к предыдущему году

0,05414

-0,53337

-0,00873

0,07985

 

Рассчитаем значения t-статистики для каждого частного коэффициента корреляции по формуле:

.

Результаты расчетов представлены в таблице 9.

Таблица 9 – Значения t-статистики для частных коэффициентов корреляции

 

X1

X2

X3

X4

X5

X1

         

X2

2,39241

       

X3

1,76883

-0,32433

     

X4

3,11513

-0,38354

-1,69542

   

X5

0,15336

-1,78344

-0,02470

0,22657

 

Сравним рассчитанные значения t-критериев с табличными значениями tтабл=2,306 при n-k-1=14-5-1=8 степенях свободы и уровне значимости α = 0,05.

В таблице 9 голубым цветом выделены значения t-критерия, которые меньше табличного значения, а в таблице 8 – соответствующие им статистически незначимые коэффициенты частной корреляции. Жирным красным шрифтом выделены значения t-критерия, которые больше табличного значения, и соответствующие им статистически значимые коэффициенты частной корреляции.

Из таблиц 8 и 9 видно, что две пары факторов X1 и Х2, Х1 и Х4 имеют высокую статистически значимую частную корреляцию, то есть являются мультиколлинеарными. Для того, чтобы избавиться от мультиколлинеарности, можно исключить одну из переменных коллинеарной пары. Как видим в обеих парах есть один и тот же фактор – Х1. Поскольку данный фактор имеет наибольшее значение F-критерия (табл. 7), он оказывает наибольшее влияние на общую мультиколлинеарность. Поэтому исключить следует фактор Х1.

Таким образом, в результате проверки теста Фаррара-Глоубера остается четыре фактора для дальнейшего анализа: Х2, Х3, Х4, Х5.

Регрессионный анализ

Уточнение набора факторов, наиболее подходящих для регрессионного анализа, осуществим на основе пошагового отбора факторов методом исключения из модели статистически незначимых переменных.

В соответствии с общим подходом, пошаговый отбор следует начинать с включения в модель всех имеющихся факторов, то есть в нашем случае с шестифакторной регрессии. Но мы не будем включать в модель факторы из заранее известных коллинеарных пар (в связи с наличием коллинеарности ранее был исключен из рассмотрения фактор Х1), а также фактор Х6, имеющий слабую связь с Y. Таким образом, пошаговый отбор факторов начнем с четырехфакторного уравнения. Фрагмент протокола четырехфакторного регрессионного анализа представлен в таблице 10.

Таблица 10 – Фрагмент протокола четырехфакторного регрессионного анализа средствами MS Excel

 

Коэффициенты

Стандартная ошибка

t-статистика

Табличное значение t-критерия при 14-4-1=9 степенях свободы и уровне значимости 0,05

Y-пересечение

184,4546

594,8062

0,3101

 

Переменная X 2

0,0945

0,2644

0,3576

2,2622

Переменная X 3

0,2563

0,0586

4,3745

2,2622

Переменная X 4

1,1100

0,4714

2,3550

2,2622

Переменная X 5

-2,2817

5,8320

-0,3912

2,2622

Статистически незначимыми (|t|

Просмотров работы: 1718