"ПОСТРОЕНИЕ ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ ПО ПРОГНОЗИРОВАНИЮ ЦЕН НА ЖИЛЬЕ В РФ" - Студенческий научный форум

VII Международная студенческая научная конференция Студенческий научный форум - 2015

"ПОСТРОЕНИЕ ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ ПО ПРОГНОЗИРОВАНИЮ ЦЕН НА ЖИЛЬЕ В РФ"

Чинь К.А. 1
1Финансовый университет при Правительстве РФ
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Введение

Цель: исследовать влияние средней номинальной заработной платы населения РФ на цены за 1 кв. м. жилья в РФ.

Используемые показатели:

Ежеквартальные данные с 2000 по 2014 (I квартал) года, и того 57 данных для каждого показателя:

Y – Средняя цена за 1 кв. м. жилья в РФ, руб.

Х1 – Средняя номинальная заработная плата населения РФ, руб.

Х2 – Курс рубля по отношению к доллару, руб.

Задачи исследования:

  1. Построить диаграмму рассеивания, используя статистические данные X и Y и сформулировать гипотезу об их функциональной зависимости.

  2. Рассмотреть эконометрические модели парной регрессии на основе следующих функций:

А) линейной Y=a0+a1X1;

Б) степенной Y=a0X1;

В) гиперболической Y=a0+a1/X1.

Для каждой модели оценить качество спецификации при помощи F- теста и дать экономическое объяснение значения R2.

  1. Исследовать адекватность условий теоремы Гаусса-Маркова для случайных остатков каждой модели из п.2).

  2. Проверить адекватность полученных моделей (с 95-% вероятностью) через интервальное прогнозирование для II, III, IV кварталов 2013 года и I квартала 2014 года.

  3. Провести сравнительный анализ полученных результатов в пп.1-4 и выявить наилучшую модель среди рассмотренных.

  4. Оценить эконометрическую модель множественной регрессии:

Y=a0+a1X12Х2+u.

Проверить значимость используемых в модели регрессоров. Исследовать адекватность модели по последнему набору данных.

  1. Диаграмма рассеивания и функциональная зависимость показателей

Построим две диаграммы рассеивания, где в первом мы рассмотрим функциональную зависимость между Y и X1, а во втором между Y и X2:

Рисунок 1

В данной диаграмме (рис. 1) мы можем увидеть тренд и величину достоверности аппроксимации (R2). А также проследить за функциональной зависимостью двух показателей, где в первой половине всего периода мы можем наблюдать как данные очень четко строят тренд, но ближе к нашему дню рассеивание все сильней и сильней. Для того, чтобы сделать простейший прогноз цены на жилье в РФ в зависимости от номинальной зарплаты населения РФ, мы можем ориентироваться на указанный тренд, так как функциональная зависимость достаточно высока, на это нам указывает высокий показатель достоверности аппроксимации (R2), который равен 0,8 (0,8 > 0,7 - минимальный показатель, при котором R2 считается высоким).

Посмотрим на вторую диаграмму (рис. 2). Отклонение квартальных данных показателей от тренда наблюдается за весь период анализа, да и сам по себе тренд выглядит неэффективным. Здесь показатель R2 = 0,0005, практически равен нулю, это говорит о том, что функциональной зависимости между Y и Х2 (курсом рубля по отношению к доллару) практически нет, делать прогноз по составленному тренду не имеет смысла.

Рисунок 2

  1. Эконометрическая модель парной регрессии на основе линейной функции

Рассматривая эконометрическую модель линейной функции Y=a0 + a1*X1, первым делом следует проверить качество спецификации данной модели, рассмотреть влияние случайных величин. Для этого рассчитываются и рассматриваются несколько показателей (рис. 3):

  1. Величина достоверности аппроксимации (или коэффициент детерминации) R2 = 0,801 (входит в промежуток 0,7 – 1, поэтому считается высоким) – указывает на высокую зависимость между ценой на жилье в РФ и номинальной заработной платой населения РФ.

  2. F-критерий Фишера равный 221,6 > F критическое равное 3,17 (Fкр= FРАСПОБР(0,05;2;55)). Это говорит об адекватности модели выборочным данным и о незначительном влиянии случайных факторов.

  3. Сравнение t – показателя = |a0,1/Sа0,а1| с t – критическим позволяет оценить значимость регрессоров в модели.

Рисунок 3.

Модель прошла проверку спецификации, исследуем ее на адекватность условий теоремы Гаусса-Маркова для случайных остатков:

  1. Тест Голдена – Квандта гомоскедастичности случайного остатка:

Шаг 1: рассчитаем ut , ut2 и М(ut). М(ut) стремится к нулю.

Шаг 2: D(ut) = σ2= 54.280.192.

Шаг 3: n’ = 57/3 = 19, Fкр = FРАСПОБР(0,05;17;17) = 2,27

Рисунок 3.

Исходя из полученного результата (рис. 3), мы делаем вывод о гетероскедастичности случайного остатка в линейной модели, случайный остаток не имеет однородности при наблюдении, дисперсия случайной ошибки данной модели непостоянна.

  1. Тест Дарбина – Уотсона отсутствия автокорреляции случайного остатка в модели:

Шаг 1: используя данные ut, ut-1 и ut2 получаем DW = 0,108.

Шаг 2: по количеству n уравнений и количеству k объясняющих переменных выбираем две переменные dL= 1,53 и dU = 1,6.

Шаг 3: Проверяем, в какое из пяти подмножеств M1, M2, M3, M4, M5 интервала (0, 4) попала величина DW (рис. 4):

Рисунок 4.

DW ∈ M1, Cov (ut;ut-1) > 0

Результат говорит о наличии автокорреляции в рассматриваемой модели, что в свою очередь приводит к ухудшению качества МНК-оценок параметров регрессии и искусственному улучшению ее качества.

Проверка адекватности модели через интегральное прогнозирование:

  1. Определимся с имеющейся статистикой:

t  ∈ [2000I – 2013II] – обучающая выборка;

t  ∈ [2013III – 2014I] – контролирующая выборка.

  1. Найдем следующие показатели для 2013III – 2014I (рис. 5):

Y2013(III) = a0 + a1*X2013(III) = 59789,57

q2013(III) = 1/n +(X2013(III) – Х̅ )2/∑(Хt – Х̅ )2 = 0,088

SY2013(III) = σu * √( q2013(III) + 1) = 7414,98

tкр= СТЬЮДРАСПОБР(0,05;52) = 2,006

Ymin = Y2013(III) – SY2013(III) * tкр= 44910,32

Ymax = Y2013(III) + SY2013(III) * tкр= 74668,81

Y2013(III) ∈ (Ymin ; Ymax)

Рисунок 5.

Каждая прогнозируемая данная входит в доверительный интервал (рассчитанный с надежностью в 95%), что говорит об адекватности модели.

  1. Эконометрическая модель парной регрессии на основе степенной функции

Проведем линеаризацию степенной функции Y=a0*X1а1 и пойдем по алгоритму, что применяли для линейной функции:

ln(Y) = ln(a0*X1а1) = ln(a0) + a1*ln(X1), пусть ln(a0) = b0, a1 = b1, тогда получится ln(Y) = b0 + b1*ln(X).

Качество спецификации регрессионной модели (рис. 6):

Рисунок 6.

R2 = 0,938 ∈ (0,7;1) – высокая зависимость показателей.

F = 831, 73 > Fкр = 3,16 – качественная выборка для модели.

По оценке спецификации степенной функции, мы видим, что выводы идентичны оценке линейной функции этих показателей, однако стоит заметить, что коэффициент детерминации тут гораздо выше и близок к единице, а это значит, что использование степенной функции может дать более точные прогнозы в связи с более тесной связью переменных.

Исследование модели на адекватность условий теоремы Гаусса-Маркова для случайных остатков:

  1. Тест Голдена – Квандта гомоскедастичности случайного остатка:

Шаг 1: рассчитаем ut , ut2 и М(ut). М(ut) также стремится к нулю.

Шаг 2: D(ut) = σ2= 0,027.

Шаг 3: n’ = 57/3 = 19, Fкр = FРАСПОБР(0,05;17;17) = 2,27. Эти показатели не изменяются.

Рисунок 7.

GQ = ESS1/ESS2

При данных справедливых неравенствах (рис. 7) мы можем считать случайный остаток в модели гомоскедастичным. Это означает постоянство дисперсии случайной ошибки данной модели и однородность изменения случайного остатка.

  1. Тест Дарбина – Уотсона отсутствия автокорреляции случайного остатка в модели:

Шаг 1: используя данные ut, ut-1 и ut2 получаем DW = 0,146.

Шаг 2: по количеству n уравнений и количеству k объясняющих переменных выбираем две переменные dL= 1,53 и dU = 1,6.

Шаг 3: Проверяем, в какое из пяти подмножеств M1, M2, M3, M4, M5 интервала (0, 4) попала величина DW (рис. 8):

Рисунок 8.

DW ∈ M1, Cov (ut;ut-1) > 0

Рост показателя DW оказался незначительным и также остался в промежутке M1. Искусственное улучшение качества модели при ее оценке и прогнозировании остается неизменным.

Проверка адекватности модели через интегральное прогнозирование:

  1. Определимся с имеющейся статистикой:

t  ∈ [2000I – 2013II] – обучающая выборка;

t  ∈ [2013III – 2014I] – контролирующая выборка.

  1. Найдем следующие показатели для 2013III – 2014I (рис. 9), используя все те же формулы и данные, что использовались для линейной функции:

Рисунок 9.

Y2013(III), Y2013(IV), Y2014(I) ∈ (Ymin ; Ymax)

Каждая прогнозируемая данная входит в доверительный интервал (рассчитанный с надежностью в 95%), что говорит об адекватности модели прогнозируемых данных.

  1. Эконометрическая модель парной регрессии на основе гиперболической функции

Линеаризируем гиперболическую функцию Y=a0 + a1/X1:

пусть 1/Х1 = Z, тогда мы получим линейную функцию Y=a0 + a1*Z.

Качество спецификации регрессионной модели (рис. 10):

Рисунок 10.

Оценка функциональной зависимости и адекватности модели выборочным данным все также сохраняется как в предыдущих случаях, однако коэффициент детерминации равный 0,74 в этом случае самый низкий из трех рассмотренных функций.

Исследование модели на адекватность условий теоремы Гаусса-Маркова для случайных остатков:

  1. Тест Голдена – Квандта гомоскедастичности случайного остатка:

Шаг 1: рассчитаем ut , ut2 и М(ut). М(ut) стремится к нулю.

Шаг 2: D(ut) = σ2= 70485091,7.

Шаг 3: n’ = 57/3 = 19, Fкр = FРАСПОБР(0,05;17;17) = 2,27.

Рисунок 11.

Результат (рис. 11) схож с результатом линейной функции, они обе имеют гетероскедстичный случайный остаток, дисперсия которого непостоянна.

  1. Тест Дарбина – Уотсона отсутствия автокорреляции случайного остатка в модели:

Шаг 1: используя данные ut, ut-1 и ut2 получаем DW = 0,074.

Шаг 2: по количеству n уравнений и количеству k объясняющих переменных выбираем две переменные dL= 1,53 и dU = 1,6.

Шаг 3: Проверяем, в какое из пяти подмножеств M1, M2, M3, M4, M5 интервала (0, 4) попала величина DW (рис. 12):

Рисунок 12.

DW ∈ M1, Cov (ut;ut-1) > 0

В модели, как и во всех остальных, присутствует положительная автокорреляция.

Проверка адекватности модели через интегральное прогнозирование:

  1. Определимся с имеющейся статистикой:

t  ∈ [2000I – 2013II] – обучающая выборка;

t  ∈ [2013III – 2014I] – контролирующая выборка.

  1. Найдем следующие показатели для 2013III – 2014I (рис. 13), используя все те же формулы и данные, что использовались для линейной функции:

Рисунок 13.

Y2013(III), Y2013(IV), Y2014(I) ∈ (Ymin ; Ymax)

Все прогнозируемые данные входят в доверительный интервал (с надежностью в 95%).

5. Оценка эконометрической модели множественной регрессии

Добавим к уравнению еще одну объясняющую переменную Х2 – курс рубля к доллару и получим модель линейной функции множественной регрессии Y=a0+a1*X1+a2*X2+u.

Проверим спецификацию модели и значимость ее регрессоров (рис. 14):

Рисунок 14.

Высокое значение R2 = 0,885 и F > Fкр указывают на то, что спецификация модели качественная. Значения |t0,1,2| = a0,1,2 / Sa0,a1,a3 > tкр = СТЬЮДРАСПОБР(0,05;54) указывают на высокую значимость всех регрессоров, используемых в модели.

Проверка адекватности модели через интегральное прогнозирование:

  1. Определимся с имеющейся статистикой:

t  ∈ [2000I – 2013IV] – обучающая выборка;

t  ∈ [2014I] – контролирующая выборка.

  1. Найдем следующие показатели для 2014I (рис. 15):

Y2014(I) = a0 + a1*X2014(I) (1) + a2*X2014(I) (2)= 53435,37

q2014(I) = x2014(I)T * (ХТ*Х)-1 * x2014(I) = 1,37 * 1019

SY2013(III) = σu * √( q2014(I) + 1) = 7414,98

tкр= СТЬЮДРАСПОБР(0,05;53) = 2,006

Ymin = Y2014(I) – SY2014(I) * tкр= -4,23 * 1013

Ymax = Y2014(I) + SY2014(I) * tкр= 4,23 * 1013

Y2014(I) ∈ (Ymin ; Ymax)

Рисунок 15.

Прогнозируемое значение входит в доверительный интервал, следовательно, оно может быть принято к сведению, а модель можно считать адекватной.

Заключение

В данной работе мы рассмотрели эконометрические модели по прогнозированию цен на жилье в РФ в зависимости от средней номинальной заработной платы населения РФ, основанные на линейной, степенной и гиперболической функциях.

Из рассмотренных моделей, самой точной оказалась модель, основанная на степенной функции, у нее не только самые приближенные к реальному значению прогнозы, но и самый высокий коэффициент детерминации R2=0,938, практически равный единице (хотя равенство единице не дает 100% повода говорить о надежности модели). Также стоит учесть во внимание, что степенная функция, в отличие от всех других рассмотренных, имеет гомоскедастичный случайный остаток, это указывает на отсутствие искусственного завышения качества модели в ходе ее анализа и оценки.

Кроме того, была проведена оценка эконометрической модели множественной регрессии, куда была добавлена дополнительная объясняющая переменная – курс доллара США. Модель оказалась качественной, все ее переменные значимые, прогноз был достаточно точным, однако все равно уступал модели, основанной на степенной функции.

Весь расчет вы можете найти в отдельном Excel файле.

Используемые источники

  1. Средняя цена на 1 кв. м. жилья в Российской Федерации,

Единая Система Государственной Статистики:

http://fedstat.ru/indicator/data.do

  1. Средняя номинальная заработная плата населения РФ, Росстат:

http://www.gks.ru/free_doc/new_site/population/trud/sr-zarplata/t1.doc

  1. Динамика курса валюты Доллар США, Центральный Банк РФ:

http://www.cbr.ru/currency_base/dynamics.aspx?VAL_NM_RQ=R01235&date_req1=01.01.2000&date_req2=26.11.2014&rt=1&mode=1

Просмотров работы: 1277