В данной работе рассматриваются методы оценки параметров моделей для панельных данных на примере построения эконометрической модели зависимости величины инвестиций фирмы от её прибыли в рамках модели со случайным эффектом.
Основными регрессионными моделями, применяемыми к панельным данным, являются [3]:
объединённая модель (pooledmodel), предполагающая, что у экономических единиц нет индивидуальных различий
, , (1)
модель с фиксированным эффектом (fixedeffectmodel,FE), базирующаяся на «уникальности» экономических единиц (индивидуальные различия между экономическими объектами учитываются в параметрах)
, , (2)
модель со случайным эффектом (randomeffectmodel,RE), учитывающая «случайность» попадания объекта в панель в результате выборки из большой совокупности (индивидуальные различия между экономическими объектами учитываются в случайных возмущениях)
, , , (3)
, .
Спецификации записаны для i– ой панели в момент времени t,
(). Обозначения в моделях (1)-(3) следующие: — зависимая переменная, — вектор-строка регрессоров (размерностью k), — случайное возмущение: , , — параметр местоположения — общий для всех экономических объектов во все моменты времени, — параметр местоположения — индивидуальный для каждого экономического объекта, — вектор параметров влияния, — независящая от времени специфическая составляющая ошибки: ,,
, для , для ,
для ,
, ,
. (4)
Автоковариационная матрица вектора случайных возмущений не диагональная, в силу (4). Вектор случайных возмущений v — гетероскедастичный, поэтому для оценки параметров модели (3) следует использовать обобщённый метод наименьших квадратов (ОМНК), в частности, выполнимый ОМНК (ВОМНК), так как значения дисперсий и при решении практических задач, как правило, неизвестны, и необходима их оценка по имеющейся эмпирической информации.
Оценка дисперсии может быть получена в рамках внутригруппового оценивания (withingroup) по переменным , — это центрированные переменные по выборочным средним по времени (,) для каждой панели:
. (5)
Дисперсия специфической составляющей связана с — дисперсией межгруппового оценивания (betweenestimator)1 по переменным , , представляющим собой отклонения средних по каждой панели от общих средних (,). Оценка выполняется по формуле:
. (6)
Выражение для автоковариационной матрицы возмущений имеет вид [4]:
. (7)
Матрицы и , входящие в формулу (7), идемпотентны, поэтому справедливо следующее соотношение
,
в частности, это используется для вычисления обратной матрицы и для случая :
,
, (8)
где
(9)
— параметр корректировки.
ОМНК-оценки параметров модели со случайными эффектами
, (10)
где — параметры местоположения и влияния (постоянные для всех объектов наблюдения во все моменты времени), вычисляются через оценку матрицы :
. (11)
При реализации алгоритма ОМНК в Excel удобно вычислять оценки параметров обычным МНК, но исходную спецификацию (10) подвергнуть преобразованию, с учётом (8):
, (12)
где
, (13)
. (14)
Легко показать, что МНК-оценка параметров модели (12) по преобразованным данным (13), (14), совпадает с ВОМНК-оценкой (11):
.
При практической реализации данного алгоритма параметр корректировки заменяется его оценкой, которая вычисляется через оценки дисперсий (5) и (6).
Оценим в Excel эконометрическую модель зависимости объёмов инвестиций от прибыли предприятия, используя данные по трём предприятиям (число панелей ) за 10 лет (объём выборки по каждому предприятию ) в рамках модели со случайными эффектами. Данные приводятся в таблице 1[5].
Объём инвестиций () и прибыль ().Таблица 1.
Время t |
предприятие 1 |
предприятие 2 |
предприятие 3 |
|||
1 |
13,32 |
12,85 |
20,3 |
22,93 |
8,85 |
8,65 |
2 |
26,3 |
25,69 |
17,47 |
17,96 |
19,6 |
16,55 |
3 |
2,62 |
5,48 |
9,31 |
9,16 |
3,87 |
1,47 |
4 |
14,94 |
13,79 |
18,01 |
18,73 |
24,19 |
24,91 |
5 |
15,8 |
15,41 |
7,63 |
11,31 |
3,99 |
5,01 |
6 |
12,2 |
12,59 |
19,84 |
21,15 |
5,73 |
8,34 |
7 |
14,93 |
16,64 |
13,76 |
16,13 |
26,68 |
22,7 |
8 |
29,82 |
26,45 |
10 |
11,61 |
11,49 |
8,36 |
9 |
20,32 |
19,64 |
19,51 |
19,55 |
18,49 |
15,44 |
10 |
4,77 |
5,43 |
18,32 |
17,06 |
20,84 |
17,87 |
Алгоритм процедуры представим в виде последовательности следующих шагов.
Шаг 1. Оценка межгрупповой регрессии.
Вычисление средних по времени для каждой панели (каждого предприятия) (при помощи функции СРЗНАЧ, категория «Статистические»)
Значения индивидуальных средних по выборке. Таблица 2.
1 |
2 |
3 |
4 |
5 |
1 |
15,502 |
15,397 |
0,405 |
0,435 |
2 |
15,415 |
16,559 |
0,318 |
1,597 |
3 |
14,373 |
12,93 |
-0,724 |
-2,032 |
общие средние |
15,09667 |
14,962 |
По данным столбцов 4 и 5 таблицы 2, используя функцию ЛИНЕЙН (категория «Статистические»), выполняется оценка межгрупповой регрессии:
Выходная информация функции ЛИНЕЙН. Таблица 3.
0,313771 |
0 |
0,090731 |
#Н/Д |
0,856728 |
0,23779 |
11,9595 |
2 |
0,676237 |
0,113088 |
Откуда следует, что .
Шаг 2. Оценка внутригрупповой регрессии.
Центрирование ПД по индивидуальным средним. Можно выполнить путём формирования таблицы 4.
Формирование центрированных данных , . Таблица 4.
номер наблюдения |
||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
1 |
13,32 |
12,85 |
15,502 |
15,397 |
-2,182 |
-2,547 |
2 |
26,3 |
25,69 |
15,502 |
15,397 |
10,798 |
10,293 |
29 |
18,49 |
15,44 |
14,373 |
12,93 |
4,117 |
2,51 |
30 |
20,84 |
17,87 |
14,373 |
12,93 |
6,467 |
4,94 |
Оценка внутригрупповой регрессии по данным 6 и 7 столбцов таблицы 4. (Функция ЛИНЕЙН, категория «Статистические»).
Выходная информация функции ЛИНЕЙН. Таблица 5.
1,102192 |
0 |
0,048024 |
#Н/Д |
0,947818 |
1,652407 |
526,7496 |
29 |
1438,263 |
79,18302 |
Откуда следует, что .
Шаг 3. Вычисление коэффициента корректировки (по формуле (9)):
.
Шаг 4. Корректировка выборочных данных (по формулам (13) и (14).
Корректировка данных: , . Таблица 6.
номер наблюдения |
||||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
||||||
1 |
13,32 |
12,85 |
15,502 |
15,397 |
31,883 |
31,288 |
||||||
2 |
26,3 |
25,69 |
15,502 |
15,397 |
44,863 |
44,128 |
||||||
29 |
18,49 |
15,44 |
14,373 |
12,93 |
35,701 |
30,923 |
||||||
30 |
20,84 |
17,87 |
14,373 |
12,93 |
38,051 |
33,353 |
||||||
|
Шаг 5. Оценка модели со случайным эффектом по данным 6 и 7 столбцов таблицы 6. (Функция ЛИНЕЙН, категория «Статистические»).
Выходная информация функции ЛИНЕЙН. Таблица 7.
1,005458 |
0 |
0,016089 |
#Н/Д |
0,992629 |
2,964243 |
3905,578 |
29 |
34317,29 |
254,8154 |
МНК-Оценки параметров по данным, преобразованным по правилу
, ,
совпадают с МНК-оценками по данным, преобразованным по формулам (13) и (14), а оценку ско возмущения, приведённую в таблице 7 в третьей строке правого столбца, нужно скорректировать:
.
Таким образом, оцененная по данным таблицы 1 модель со случайным эффектом имеет вид
, , .
Как показывают результаты оценивания, оценки параметров всех трёх моделей (1)-(3), отличаются незначительно. Тестирование характера данных говорят в пользу модели (1) [5].
Список используемых источников
Бабешко Л.О. Модели панельных данных: рекуррентный метод оценки параметров. «Страховое дело», 2014, № 8 (257) с.42-50.
Бабешко Л.О. Оценка мультипликативной структуры тарифов в рамках модели с фиксированным эффектом. "Управление риском" — М., 2012 г. № 4, с.26-31.
Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. — М.: Дело, 2007. — 507 с.
Эконометрика: учебник /И.И. Елисеева, С.В. Курышева, Т.В. Костеева и др.; под ред. И.И. Елисеевой. — 2-е изд. — М.: Финансы и статистика, 2008. — 576 с.
В.П. Носко. Эконометрика. Кн.2. Ч.3,4: учебник/ В.П. Носко.—М.: Издательский дом «Дело» РАНиГС, 2011. —576 с. (Сер. «Академический учебник»)
1
9