ЭКОНОМЕТРИЧЕСКОЕ МОДЕЛИРОВАНИЕ СТОИМОСТИ ЖИЛЬЯ В СВАО ГОРОДА МОСКВЫ - Студенческий научный форум

VI Международная студенческая научная конференция Студенческий научный форум - 2014

ЭКОНОМЕТРИЧЕСКОЕ МОДЕЛИРОВАНИЕ СТОИМОСТИ ЖИЛЬЯ В СВАО ГОРОДА МОСКВЫ

Виденин Т.О. 1
1Финансовый Университет при Правительстве РФ
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Прикладное использование эконометрического анализа позволяет выстраивать модели ценообразования для построения прогнозов, выявления значимых факторов в рамках любой исследуемой области. Этот факт не может не удивлять и вызывает желание использовать этот метод во всем. Целью данной работы является исследование вторичного рынка недвижимости в СВАО города Москвы на наличие факторов определяющих стоимость жилья, а также построение факторной модели, и ее дальнейший анализ.

Наименование показателей и исходные данные для эконометрического моделирования представлены в Приложении 1.

В соответствии с целью, были поставлены следующие задачи:

  1. Проверить данные на наличие мультиколлинеарности. Исключить переменные, создающие мультиколлинераность в регрессии.

  2. Отобрать факторы в модель множественной регрессии.

  3. Составить модель на основе фиктивных факторов.

  4. Оценить качество модели.

  5. Интерпретировать полученные значения экономически

  1. Проверка данных на наличие мультиколлинеарности

Данные для анализа получены на сайте Индикаторы рынка недвижимости1 по состоянию на 12.12.2013. Было произведено 80 наблюдений на вторичном рынке недвижимости.

Первым шагом необходимо перевести исходные данные в пригодный для анализа формат. Для этого заменяем данные переменных в столбце «Балкон» на 1 если балкон есть, на 0, если он отсутствует.

Также преобразуем фактор “Этаж”. Как показывает рынок недвижимости, наименее привлекательными считаются квартиры, находящиеся на первом, либо последнем этаже здания. Для того, чтобы данный фактор стал фиктивным, необходимо преобразовать его в следующий вид: крайним этажам присвоить значение 0, средним – 1.

Данные переменных в столбце «Удаленность от метро» заменяем следующим образом:

Время в пути, мин.

Расстояние, км.

15 мин пешком

1

12 мин пешком

0,85

10 мин пешком

0,7

8 минут пешком

0,63

7 мин пешком

0,58

5 минут мешком

0,5

3 мин пешком

0,4

2 мин пешком

0,3

1 мин пешком

0,2

10 минут транспортом

6

7 минут транспортом

4,5

5 минут транспортом

3,5

После форматирования данных, можно приступать к проверке данных.

Прежде всего, произведем проверку переменные на мультиколлинеарность методом Фаррара-Глоубера по 1 виду статистических критериев (критерий "хи-квадрат"):

Формула для расчета значения статистики Фаррара-Глоубера:

Определитель матрицы парных корреляций равен 0,081342333.

Расчетное значение FGнабл = 203,65

Табличное значение, при 0,5К(К-1), К=6 FGнабл.таб = 24,99

Расчетное значение больше чем табличное, следовательно, в массиве объясняющих переменных существует мультиколлинераность.

Проведем анализ коэффициентов парной корреляции:

 

Цена, млн. р, Y

Общая площадь м.кв, X1

Жилая площадь м.кв, X2

Этаж, X3

Удаленность от метро, X4

Балкон, X5

Тип дома, X6

Цена, млн. р, Y

1,00

           

Общая площадь м.кв, X1

0,79

1,00

         

Жилая площадь м.кв, X2

0,71

0,92

1,00

       

Этаж, X3

0,49

0,42

0,29

1,00

     

Удаленность от метро, X4

-0,15

0,11

0,06

0,01

1,00

   

Балкон, X5

0,29

0,41

0,36

0,38

0,21

1,00

 

Тип дома, X6

0,21

-0,03

-0,01

-0,01

-0,22

0,00

1,00

Проверим переменные на мультиколлинеарность:

 

Общая площадь м.кв, X1

Жилая площадь м.кв, X2

Этаж, X3

Удаленность от метро, X4

Балкон, X5

Тип дома, X6

Общая площадь м.кв, X1

1,00

0,92

0,42

0,11

0,41

-0,03

Жилая площадь м.кв, X2

0,92

1,00

0,29

0,06

0,36

-0,01

Этаж, X3

0,42

0,29

1,00

0,01

0,38

-0,01

Удаленность от метро, X4

0,11

0,06

0,01

1,00

0,21

-0,22

Балкон, X5

0,41

0,36

0,38

0,21

1,00

0,00

Тип дома, X6

-0,03

-0,01

-0,01

-0,22

0,00

1,00

Коэффициент парной корреляции между Жилой площадью(Х2) и Общей площадью(Х1) больше 0,8, следовательно явление мультиколлинеарности установлено.

Коллинеарные факторы фактически дублируют друг друга в модели, существенно ухудшая качество. Поэтому наименее тесно связанный фактор необходимо убрать. В данном случае Жилая площадь Х2 является наименее тесно связанным фактором.

  1. Отбор факторов в модель множественной регрессии

Отбор факторов, включаемых в регрессию – один из важнейших этапов построения модели регрессии.

Проанализируем влияние факторов без учета фактора Х2 (Жилая площадь).

Построим таблицу матрицы парных корреляций:

 

Цена, млн. р, Y

Общая площадь м.кв, X1

Этаж, X3

Удаленность от метро, X4

Балкон, X5

Тип дома, X6

Цена, млн. р, Y

1,00

         

Общая площадь м.кв, X1

0,79

1,00

       

Этаж, X3

0,49

0,42

1,00

     

Удаленность от метро, X4

-0,15

0,11

0,01

1,00

   

Балкон, X5

0,29

0,41

0,38

0,21

1,00

 

Тип дома, X6

0,21

-0,03

-0,01

-0,22

0,00

1,00

Проанализируем коэффициенты корреляции:

r (Y, X1)

0,79

0,7 до 0,9 - высокая степень взаимосвязи

Связь прямая

 

r (Y, X3)

0,49

0,3 до 0,5 - заметная степень взаимосвязи

Связь прямая

 

r (Y, X4)

-0,15

0,1 до 0,3 - слабая степень взаимосвязи

Связь обратная

Связь слабая, не рекомендуется включать в модель регрессии

r (Y, X5)

0,29

0,1 до 0,3 - слабая степень взаимосвязи

Связь прямая

Связь слабая, не рекомендуется включать в модель регрессии

r (Y, X6)

0,21

0,1 до 0,3 - слабая степень взаимосвязи

Связь прямая

Связь слабая, не рекомендуется включать в модель регрессии

Выведем протокол с помощью функции Excel – Регрессия:

Регрессионная статистика

           

Множественный R

0,85647744

         

R-квадрат

0,73355361

         

Нормированный R-квадрат

0,71555048

         

Стандартная ошибка

1,49552827

         

Наблюдения

80

         
             

Дисперсионный анализ

         
 

df

 

MS

F

Значимость F

 

Регрессия

5

455,662193

91,13243862

40,74588338

6,342E-20

 

Остаток

74

165,508756

2,236604806

     

Итого

79

621,170949

       
             
 

Коэф-ты

Станд. ошибка

t-статистика

P-Значение

Ниж. 95%

Верх.95%

Y-пересечение

0,35432232

0,64276731

0,551245093

0,583126327

-0,926419

1,6350641

Общая площадь м.кв

0,1534109

0,01244278

12,32930628

1,28223E-19

0,1286181

0,1782037

Этаж

-0,422231

0,20554493

-2,054202899

0,043488342

-0,831788

-0,012674

Удаленность от метро

-0,1850744

0,06090354

-3,038811272

0,003281345

-0,306427

-0,063721

Балкон

0,09367627

0,44054744

0,212636054

0,832195505

-0,784134

0,9714862

Тип дома

1,33632655

0,48782532

2,739354622

0,007709448

0,3643134

2,3083397

Сопоставим фактическое значение t-статистики Стьюдента с критическим.

t-стьюдента критическое можно найти при помощи функции CТЬЮДРАСПОБР при α = 0,05 и числа степеней свободы n – k – 1, где n – число наблюдений, k – число факторов в модели.

Общая площадь м.кв, X1

12,32

>1,99

Этаж, X3

2,05

>1,99

Удаленность от метро, X4

3,03

>1,99

Балкон, X5

0,21

1,99

Фактор Х5 («балкон») является незначимым, т.к. фактическое значение t-статистики Стьюдента меньше критического. Фактор Х5 необходимо исключить.

Повторим процедуру без фактора Х5:

Протокол Регрессии:

Регрессионная статистика

           

Множественный R

0,8563824

         

R-квадрат

0,73339081

         

Нормированный R-квадрат

0,71917166

         

Стандартная ошибка

1,48597838

         

Наблюдения

80

         
             

Дисперсионный анализ

         
 

df

 

MS

F

Значимость F

 

Регрессия

4

455,561067

113,8902668

51,577659

8,418E-21

 

Остаток

75

165,609882

2,208131756

     

Итого

79

621,170949

       
             
 

Коэфф-ты

Станд.ошибка

t-статистика

P-Значение

Нижн. 95%

Верх. 95%

Y-пересечение

0,36188378

0,63768469

0,567496422

0,57207181

-0,908449

1,6322168

Общая площадь м.кв

0,15446275

0,01134431

13,61588199

5,79726E-22

0,1318637

0,1770618

Этаж

-0,4175269

0,20304603

-2,056316571

0,043231349

-0,822015

-0,013038

Удаленность от метро

-0,1826296

0,05942655

-3,07319896

0,002951828

-0,301013

-0,064246

Тип дома

1,34233565

0,48389623

2,774015495

0,006983536

0,3783649

2,3063064

t –статистики Стьюдента критическое = 2,056

Таким образом, можно сделать вывод:

1. Нижние и верхние показатели не проходят через 0.

2. Абсолютное значение t-статистики больше чем t-статистики критическое.

Переменные Х1, Х3, Х4, Х6 являются значимыми переменными.

На основе полученных данных, можно составить модель:

Y= 0,361 + 0,154X1 - 0,417X3 - 0,182X4 +1,342X6

3. Оценка качества модели

Проверка значимости уравнения регрессии через коэффициент детерминации, среднюю ошибку аппроксимации и F – критерия Фишера.

Коэффициент детерминации и коэффициент множественной корреляции выдается протоколом в регрессионной статистике.

Множественный R

0,85

R-квадрат

0,73

В многофакторной регрессии добавление дополнительных объясняющих переменных увеличивает коэффициент детерминации. Следовательно, он должен быть скорректирован с учетом числа независимых переменных.

R2 = 1 - (1 - R2)*(n - 1)/(n - k - 1)

Скоррективанный R-квадрат также выдается в протоколе в регрессионной статистики:

Нормированный R-квадрат

0,71

Коэффициент детерминации показывает долю вариации результативного признака, находящего под воздействием изучаемых факторов, т.е. определяет какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов.

Чем ближе R-квадрат к 1, тем выше качество модели.

Теперь перейдем к анализу модели на основе F-критерия Фишера.

F-критерий Фишера расчетный находит по следующей формуле:

F = (R2/K)/((1-R2)/(n-k-1))

F-критерий Фишера табличный находится при помощи формулы в Excel FРАСПОБР.

Результаты:

Критерий Фишера расчетный

51,32

Критерий Фишера табличный

2,49

Расчетное значение больше табличного, модель признается значимой.

Проведем оценку средней относительной ошибки аппроксимации. Средняя относительная ошибка аппроксимации находится по формуле:

Eотн = 1/n∑|Yi-Yiprog|/Yi * 100%

Для этого необходимо при помощи функции регрессии вывести остатки.

Средняя ошибка аппроксимации равна 13,59%, что больше порового значение в 7%. Это говорит о большом рассеянии эмпирических точек вокруг теоретической линии регрессии и свидетельствует о не очень хорошем качестве модели, однако по остальным показателям модель показала положительный результат, и может считаться жизнеспособной.

Проведем оценку влияния отдельных факторов на зависимую переменную на основе модели, а именно – расчет коэффициентов эластичности, Бета коэффициент и Дельта коэффициент. Для этого необходимо рассчитать средние, а также средние квадратичные значения факторов:

 

Цена

Общая площадь

Этаж

Расстояние до метро

Тип дома

Среднее значение

6,74619048

45,86528061

20,26275602

4,526744593

0,899650922

Среднее квадратичное отклонение

2,43971008

18,55872096

95,58649999

14,06845364

6,441994064

Затем рассчитаем коэффициенты по формулам:

Эj=aj*XjY

Коэффициент эластичности показывает, на сколько

процентов изменится значение исследуемой величины

при изменении соответствующего фактора на 1%

βj=aj*SxjSy

Бета-коэффициент показывает, на какую часть своего

СКО изменится значение исследуемой переменной при

изменении соответствующего фактора на 1 СКО

∆j=ry,xj*βjR2

Дельта-коэффициент показывает среднюю долю

влияния соответствующего фактора в совокупном

влиянии всех факторов, включенных в модель

Полученные значения:

 

Общая площадь

Этаж

Расстояние до метро

Тип дома

Коэф. эластичности

1,06262008

-0,073081567

-0,070016337

0,028769987

Бета

0,81507971

-0,125308047

-0,188486689

0,172010771

Дельта

0,87944459

0,027280192

0,043387055

0,050729361

Таким образом, в среднем квартира в панельном здании стоит на 287 700 рублей дешевле, чем аналогичная квартира в кирпичном здании, при прочих равных условиях. При средней стоимости недвижимости в 7,5 млн. каждые 100 метров удаленности от метро приводят к удешевлению стоимости квартиры на 525 000 рублей. В то время как сравнительная стоимость аналогичных квартир на крайнем и на среднем этаже выявит разностьв 547 000 рублей в среднем.

На основе проведенного исследования можно сделать следующие выводы:

  1. В наибольшей степени стоимость недвижимости зависит от ее площади, что вполне предсказуемо, при изменении площади на 1 %, стоимость квартиры изменяется на 1,06%

  2. Наличие балкона, а также соотношение жилой площади к общей площади квартиры не играют роли при ценообразовании.

  3. Влияние этажа, на котором находится квартира, а также расстояния до метро и типа здания несоизмеримо с влиянием площади квартиры на ее стоимость.

  4. Расположение квартиры на крайних этажах играет наименьшую роль в формировании стоимости на жилье, таким образом квартира на первом или последнем этаже в кирпичном здании будет иметь большую стоимость, чем квартира в средних этажах панельного дома.

Приложение 1. Анализируемые данные.

п/п

Цена, млн. р

Общая площадь м.кв

Жилая площадь м.кв

Этаж

Удаленность от метро

Балкон

Тип дома

1

9

63

38

5

15 минут пешком

есть

Панельный

2

9,2

49,1

29,3

2

10 минут пешком

есть

кирпичный

3

4

14,9

9,7

1

5 минут пешком

нет

кирпичный

4

5,9

40

21

12

10 минут транспортом

есть

Панельный

5

8,4

49

30

3

5 минут пешком

есть

Кирпичный

6

5,65

42

27

1

10 минут пешком

нет

Панельный

7

19

92,4

58,4

18

1 минута пешком

есть

Кирпичный

8

8

31

19

1

1 минута пешком

нет

Кирпичный

9

6

44

30

3

5 минут пешком

есть

Панельный

10

7,4

60

42

2

10 минут транспортом

есть

Панельный

11

4,69

32,7

19

8

15 минут пешком

нет

Панельный

12

14

72

52

2

7 минут пешком

есть

Кирпичный

13

4,69

31,2

21

7

8 минут пешком

есть

Панельный

14

6

44

27,7

4

15 минут пешком

нет

Панельный

15

10,5

80

58

1

10 минут транспортом

есть

Панельный

16

4,65

32

19

3

10 минут транспортом

есть

Панельный

17

7,8

59,8

44,8

1

15 минут пешком

есть

Панельный

18

5,99

45

29

2

5 минут транспортом

есть

Панельный

19

5,65

40

24

4

12 минут пешком

есть

Панельный

20

10,3

58

35

3

2 минуты пешком

есть

Панельный

21

7,79

61

40

6

5 минут транспортом

есть

Панельный

22

6,45

45,7

29

1

10 минут транспортом

нет

Панельный

23

5,25

35

21

1

5 минут пешком

нет

Панельный

24

4,79

33

17,5

4

10 минут пешком

нет

Панельный

25

7,1

63

39

8

15 минут транспортом

есть

Панельный

26

16,9

82

45

19

1 минута пешком

есть

Панельный

27

4,5

35

21,5

3

5 минут транспортом

есть

Кирпичный

28

5,8

44,4

29,6

5

3 минуты пешком

есть

Панельный

29

13,45

73

43

10

5 минут пешком

есть

Панельный

30

6,6

42

23,1

3

15 минут пешком

есть

Панельный

31

9,8

52

34

2

5 минут пешком

есть

Кирпичный

32

6,8

56

39

5

8 минут пешком

есть

Панельный

33

6,3

36,3

19

5

10 минут пешком

есть

Панельный

34

6,2

45

31

1

5 минут пешком

нет

Панельный

35

4,7

33

20,4

2

10 минут транспортом

есть

Панельный

36

6,85

60

44

5

5 минут пешком

есть

Панельный

37

2,2

58,3

11,7

2

7 минут транспортом

есть

Панельный

38

10,5

80

58

1

10 минут транспортом

есть

Панельный

39

4

59,3

43,5

8

10 минут транспортом

есть

Панельный

40

6

46

29

3

15 минут пешком

есть

Панельный

41

5,6

34

18

2

7 минут пешком

нет

Панельный

42

8,1

65,3

42

1

10 минут пешком

есть

Панельный

43

6,1

35,4

20,2

9

2 минуты пешком

есть

Панельный

44

12,4

76

43

16

10 минут пешком

есть

Панельный

45

5,2

31

17

4

5 минут пешком

есть

кирпичный

46

6,2

47,1

30,5

2

7 минут транспортом

нет

Панельный

47

4,59

30,4

17,4

4

5 минут пешком

есть

Панельный

48

7,6

62,9

38,7

6

5 минут транспортом

есть

Панельный

49

6,2

38

22

3

10 минут пешком

есть

Панельный

50

5,3

35,2

21,2

6

10 минут транспортом

есть

Панельный

51

5,75

44

29

7

10 минут транспортом

есть

Панельный

52

6,5

50

30

1

10 минут пешком

нет

кирпичный

53

7,2

60

40

2

10 минут транспортом

есть

Панельный

54

6,8

58

33

9

10 минут транспортом

есть

Панельный

55

11,2

50

22

6

10 минут транспортом

есть

Панельный

56

4,65

32,3

20,5

1

1 минута пешком

нет

Панельный

57

8,6

65

45

11

10 минут пешком

есть

Панельный

58

7,4

50,3

34,1

6

2 минуты пешком

есть

Панельный

59

5,2

31

19

3

10 минут транспортом

есть

кирпичный

60

5,45

35

20

4

15 минут пешком

есть

Панельный

61

4,8

32

19

2

7 минут пешком

есть

Панельный

62

5,55

45

26

8

10 минут транспортом

есть

Панельный

63

5

40

21

2

7 минут транспортом

нет

Панельный

64

9

60

43

7

2 минуты пешком

есть

Панельный

65

5,4

34

18

2

10 минут пешком

нет

Панельный

66

6

44,3

27,9

2

15 минут пешком

нет

Панельный

67

4,8

35,1

19,7

3

5 минут транспортом

есть

Панельный

68

8

58,1

44,5

5

10 минут пешком

есть

Панельный

69

5,8

42,3

27

1

5 минут пешком

нет

Панельный

70

6,4

48

30

1

10 минут транспортом

есть

Панельный

71

8,2

60,1

39

7

10 минут транспортом

есть

Панельный

72

7,4

60

45

9

15 минут пешком

есть

кирпичный

73

5,1

35

20

13

7 минут транспортом

есть

Панельный

74

7,55

61

45,5

5

7 минут транспортом

есть

Панельный

75

5

32

21

2

10 минут пешком

нет

Панельный

76

10,3

55

30,4

5

5 минут транспортом

есть

Панельный

77

3,9

35,44

15,07

4

15 минут транспортом

есть

Панельный

78

6,4

45,4

30,8

5

15 минут пешком

есть

Панельный

79

5,7

45

29

2

15 минут пешком

есть

Панельный

80

4,75

33

19

2

10 минут транспортом

нет

Панельный

1 http://www.irn.ru/

Просмотров работы: 1296