Для количественной характеристики зависимости между рядами х и у используется линейный коэффициент корреляции. Если рассматриваемые временные ряды имеют тенденцию, коэффициент корреляции будет высоким (положительным в случае совпадения и отрицательным - в случае противоположной направленности тенденций рядов). Высокий коэффициент корреляции в данном случае - это результат того, что ряды х и у содержат тенденцию. При этом одинаковую или противоположную тенденцию могут иметь ряды, совершенно не связанные друг с другом причинно-следственной зависимостью.
Чтобы отличить ложную корреляцию от истинной, прежде всего, нужно обосновать связь по существу. Проблема ложной корреляции почти целиком снимается, если причинная связь обоснована не столько между тенденциями динамики, сколько между колебаниями факторного и результативного признаков. Например, колебания урожайности во влагонедостаточных регионах причинно связаны не с тенденцией изменения суммы осадков, а с ее колебаниями в отдельные годы.
Проанализируем связь между урожайностью зерновых культур и их себестоимостью за 2002-2013 гг. (таблица 1).
Урожайность зерновых культур имела тенденцию роста: в среднем за каждый год она увеличивалась на 1 ц/га. Тренд урожайности: .
Согласно законам экономики, рост урожайности должен приводить к снижению себестоимости единицы продукции. Однако себестоимость тоже увеличивалась: в среднем за каждый год на 16,4 руб./ц. Тренд себестоимости: . Причиной роста себестоимости был рост цен на все элементы затрат на производство: сельхозмашины, энергоносители, удобрения.
Таблица 1 – Корреляция урожайности зерновых культур с их себестоимостью
Год |
Урожай-ность, ц/га |
Себесто- имость, руб./ц |
Тренды |
Отклонения от трендов |
Уравнение регрессии |
||||
x |
y |
ux |
uy |
||||||
2002 |
7,2 |
30 |
9,5 |
21,4 |
-2,3 |
8,6 |
36,0 |
||
2003 |
10,3 |
46 |
10,4 |
37,8 |
-0,1 |
8,2 |
38,4 |
||
2004 |
15,3 |
42 |
11,3 |
54,2 |
4,0 |
-12,2 |
28,6 |
||
2005 |
10,1 |
77 |
12,2 |
70,7 |
-2,1 |
6,3 |
83,7 |
||
2006 |
9,1 |
95 |
13,0 |
87,1 |
-3,9 |
7,9 |
112,1 |
||
2007 |
12,8 |
105 |
13,9 |
103,5 |
-1,1 |
1,5 |
110,7 |
||
2008 |
17,4 |
110 |
14,8 |
120,0 |
2,6 |
-10,0 |
103,5 |
||
2009 |
18,4 |
101 |
15,7 |
136,4 |
2,7 |
-35,4 |
119,2 |
||
2010 |
15,7 |
156 |
16,6 |
152,8 |
-0,9 |
3,2 |
158,4 |
||
2011 |
19,7 |
170 |
17,5 |
169,3 |
2,2 |
0,7 |
155,0 |
||
2012 |
19 |
184 |
18,3 |
185,7 |
0,7 |
-1,7 |
181,5 |
||
2013 |
17,4 |
225 |
19,2 |
202,1 |
-1,8 |
22,9 |
213,8 |
||
Итого |
172,4 |
1341,0 |
172,4 |
1341,0 |
0,0 |
0,0 |
1341,0 |
Корреляционно-регрессионный анализ, проведенный по уровням рядов, приводит к следующим результатам:
Величина коэффициента корреляции показывает наличие сильной прямой зависимости между себестоимостью и урожайностью. Параллельность трендов рядов «погасила» обратную связь их колебаний, что и привело к результату, противоречащему законам экономики.
Чтобы получить коэффициент корреляции, характеризующий причинно-следственную связь между изучаемыми рядами, следует избавиться от ложной корреляции, вызванной наличием в каждом из рядов линейной тенденции.
Для этого воспользуемся одним из методов исключения тенденции: вычислим отклонения уровней урожайности и себестоимости от трендов (табл. 1) и измерим корреляцию колебаний двух признаков.
Подставляя в формулу парного коэффициента корреляции вместо уровней признаков их отклонения от трендов, получаем:
где , .
Таким образом, колебания себестоимости зерновых в области на 52% () были связаны с колебаниями урожайности. Связь обратная, что соответствует экономическому содержанию связи урожайности с себестоимостью.
Уравнение регрессии, построенное по отклонениям от трендов, имеет вид:
В среднем отклонение себестоимости от ее тренда в t-м году составляет 4,26 величины отклонения урожайности от своего тренда с обратным знаком. Значения себестоимости, рассчитанные по модели с учетом тренда себестоимости и колебаний урожайности, приведены в последней графе табл. 1. Полученные по модели (1) уровни себестоимости довольно близки к фактическим.
Модель (1) можно использовать для прогнозирования. Для этого необходимо определить трендовое значение факторного признака , и с помощью одного из методов оценить величину предполагаемого отклонения фактического значения от трендового. Далее по уравнению тренда для результативного признака определяют трендовое значение , а по уравнению регрессии (1) по отклонениям от трендов находят величину отклонения . Затем рассчитывают точечный прогноз фактического значения уtпо формуле:
Если, например, урожайность в 2015 г. окажется на 4,3 ц/га выше уровня тренда для этого года, составляющего 21 ц/га, то себестоимость надо ожидать на 18,3 руб./ц ниже уровня тренда, который для 2015 г. равен 235 руб./ц, т.е. себестоимость составила бы 217 руб./ц. Фактическое значение себестоимости зерновых культур в 2008 г., при превышении урожайности над трендом на 4,3 ц/га, составило 269 руб./ц.
Проанализируем связь между урожайностью и себестоимостью картофеля по Волгоградской области за 2002-2015 гг. (таблица 2).
Таблица 2 – Корреляция урожайности картофеля с его себестоимостью
Год |
Урожай-ность, ц/га |
Себесто- имость, руб./ц |
Тренды |
Отклонения от трендов |
Уравнение регрессии |
||||
x |
y |
ux |
uy |
||||||
2002 |
71,3 |
76 |
59,2 |
136,3 |
12,1 |
-60,3 |
125,3 |
||
2003 |
39,6 |
242 |
69,3 |
165,9 |
-29,7 |
76,1 |
192,7 |
||
2004 |
66,9 |
178 |
79,3 |
195,4 |
-12,4 |
-17,4 |
206,7 |
||
2005 |
66,1 |
238 |
89,4 |
225,0 |
-23,3 |
13,0 |
246,1 |
||
2006 |
86,8 |
324 |
99,5 |
254,6 |
-12,7 |
69,4 |
266,1 |
||
2007 |
151 |
257 |
109,6 |
284,1 |
41,4 |
-27,1 |
246,7 |
||
2008 |
140 |
300 |
119,7 |
313,7 |
20,3 |
-13,7 |
295,3 |
||
2009 |
129,1 |
344 |
129,7 |
343,3 |
-0,6 |
0,7 |
343,9 |
||
2010 |
161,8 |
386 |
139,8 |
372,9 |
22,0 |
13,1 |
353,0 |
||
2011 |
197,7 |
355 |
149,9 |
402,4 |
47,8 |
-47,4 |
359,2 |
||
2012 |
152,9 |
355 |
160,0 |
432,0 |
-7,1 |
-77,0 |
438,4 |
||
2013 |
148,5 |
462 |
170,1 |
461,6 |
-21,6 |
0,4 |
481,1 |
||
2014 |
155,8 |
461 |
180,1 |
491,1 |
-24,3 |
-30,1 |
513,1 |
||
2015 |
178,3 |
621 |
190,2 |
520,7 |
-11,9 |
100,3 |
531,5 |
В среднем за каждый год урожайность картофеля увеличивалась на 10,1 ц/га. Тренд урожайности:. Себестоимость тоже увеличивалась: в среднем за каждый год 29,6 руб./ц. Тренд себестоимости:.
Коэффициент корреляции, рассчитанный по уровням рядов, составил 0,71. Величина коэффициента показывает наличие сильной прямой зависимости между себестоимостью и урожайностью.
Предположим, что полученные результаты содержат ложную корреляцию ввиду наличия в каждом из рядов линейной тенденции.
Измерим корреляцию между отклонениями уровней от трендов: Колебания себестоимости картофеля в области на 18,5% были связаны с колебаниями урожайности: связь средняя, обратная.
Уравнение регрессии, построенное по отклонениям от тренда, имеет вид:
В среднем за период 2002-2015 гг. отклонение себестоимости от тренда было противоположно по знаку и составляло 0,9 величины отклонения урожайности от своего тренда.
Значения себестоимости, рассчитанные по модели с учетом тренда себестоимости и колебаний урожайности, приведены в табл. 2.
Используем модель (2) для прогнозирования себестоимости картофеля на 2016 г. Если, например, урожайность в 2016 г. окажется на 25 ц/га выше уровня тренда для этого года, составляющего 200 ц/га, то себестоимость надо ожидать на 23 руб./ц ниже уровня тренда, который для 2016 г. равен 550 руб./ц, т.е. себестоимость составила бы 527 руб./ц.
В связи с тем, что тенденции факторов связаны часто, а колебания - почти никогда, связь между колебаниями одного фактора с колебаниями результативного показателя почти всегда свободна от ложной корреляции.
Таким образом, задача об измерении корреляции временных рядов сводится к измерению связи между колебаниями их уровней. При этом колебания должны быть случайно-распределенные во времени.
Преимущество метода отклонений от тренда состоит в том, что он может применяться независимо от того, одинаковы типы трендов коррелируемых показателей или нет.
Литература:
Бородич, С.А. Эконометрика. Практикум [Электронный ресурс]: учебное пособие / С.А. Бородич. – Электрон. текстовые дан. - М.: НИЦ ИНФРА-М; Мн.: Нов. знание, 2015. - 329 с. – Режим доступа: http://znanium.com/bookread2.php?book=502332
Дайитбегов, Д.М. Компьютерные технологии анализа данных в эконометрике [Электронный ресурс]: монография / Д.М. Дайитбегов. – Электрон. текстовые дан. - 3-e изд., испр. и доп. - М.: Вузовский учебник: НИЦ Инфра-М, 2013. - XIV, 587 с. - Режим доступа: http://znanium.com/bookread2.php?book=365692