При наличии двух и более синхронных временных рядов между ними возможен специфический вид связи, обусловленный влиянием различных факторов. Ее называют стохастической, то есть вероятностной.
Рассмотрим два временных ряда:
{xi }, i = 1, 2, … , n
и
{yi }, i = 1, 2, … , n.
Стохастическая связь между значениями yi, полученными при разных уровнях фактора xi, называется корреляционной [1]. Мерой силы или тесноты такой связи между переменными служит выборочный коэффициент корреляции:
где и - средние значения двух временных рядов, и - среднеквадратические отклонения значений временных рядов от их средних значений. В целях оптимизации вычислений для расчета выборочного коэффициента корреляции используют получаемый с помощью преобразований аналог этой формулы, не требующего предварительного расчета среднего и среднеквадратического отклонения:
Качественно степень корреляционной связи может быть качественно оценена по шкале Чеддока [2]:
Таблица 1.
Качественная оценка степени корреляционной связи
Диапазон значение линейного коэффициента корреляции rxy |
Степень корреляционной связи |
1 > | rxy | > 0.9 |
Весьма высокая |
0.91 > | rxy | > 0.7 |
Высокая |
0.7 > | rxy | > 0.5 |
Заметная |
0.5 > | rxy | > 0.3 |
Умеренная |
0.3 > | rxy | > 0.1 |
Слабая (практически отсутствует) |
Количественно оценить значимость выборочного коэффициента корреляции можно на основе использования критерия Стьюдента. В этом случае для такой оценки необходимо задать значение уровня значимости (доверительной вероятности, например, 95%) и с учетом объема выборки N определить критическое значение критерия Стьюдента tкр. Значение этого критерия необходимо сравнить со значением выборочного коэффициента tв [2]
В том случае, когда выполняется неравенство
то выборочный коэффициент корреляции считается статистически незначимым (при заданном уровне значимости).
Кроме того, критерий Стьюдента позволяет определить интервальную оценку для выборочного коэффициента корреляции (доверительный интервал):
На основе статистической зависимости одного временного ряда от другого второму можно произвести оценку («восстановление») этого второго ряда по значениям первого с использованием выборочного коэффициента парной корреляции rxy и статистических характеристик этих рядов [2]:
Рассмотрим результаты применения рассмотренной выше методики к двум временным рядам, представленным на рис. 1.
Рис.1 Две выборки объемом в 500 значений
В табл.2 приведены статистические характеристики этих двух временных рядов и значение выборочного коэффициента корреляции со значениями границ доверительного интервала при уровне значимости 95%.
Таблица 2
Статистические характеристики двух временных рядов, представленных на рисунке 1
Ряд |
Среднее |
Среднеквадратическое отклонение |
rxy - ∆ |
rxy |
rxy + ∆ |
Xi |
6.5 |
0.9 |
0.63 |
0.69 |
0.75 |
Yi |
4.9 |
1.3 |
На рис.2 представлено сопоставление ряда Yi и его оценка с использованием статистических характеристик двух рядов и значений рада Xi
(i = 1, 2, … , 500).
Рис.2 Результаты оценивания ряда Yi по значениям ряда Xi с использованием трех коэффициентов корреляции из табл.2: ряд 2 – по rxy + ∆, ряд 3 – по rxy, Ряд 3 – по rxy - ∆
В отличие от рис. 2 на рис. 3 представлено сопоставление ряда Xi и его оценки с использованием статистических характеристик двух рядов и значений рада Yi(i = 1, 2, … , 500).
Рис.3 Результаты оценивания ряда Xi по значениям ряда Yi с использованием трех коэффициентов корреляции из табл.2: ряд 2 – по rxy + ∆, ряд 3 – по rxy, Ряд 3 – по rxy - ∆
Анализ представленных примеров оценки значений одного ряда по значениям другого с использованием их статистических характеристик в целом позволяет «уловить» особенности их временной изменчивости. Восстановление значений временного ряда с меньшей изменчивостью, которую можно оценить по величине среднеквадратичного отклонения, позволяет лучше описать его временную изменчивость.
Список литературы
1. Малинин В.Н. Статистически методы анализа гидрометеорологической информации. - Санкт-Петербург, 2008. – 407 с.
2. Восканян К.Л., Кузнецов А.Д., Сероухова О.С. Автоматические метеорологические станции. Часть 2. Цифровая обработка данных автоматических метеорологических станций. Санкт-Петербург, РГГМУ, 2015. – 80 с.