Целью моей работы является построение подобных регрессионных моделей с привлечением нескольких лимнологических параметров. Зависимой переменной является первичная продукция (РР), предикторами были выбраны общий фосфор и некоторые морфометрические характеристики озер.
В качестве исходных данных были использованы результаты исследования разнотипных озер Карельского перешейка и Восточной Латвии, проведенного в 1976-1984 гг. Институтом озероведения РАН (Особенности формирования...., 1984; Трансформация органического и биогенных веществ...., 1989).
Регрессионный анализ проводился с использованием пакета MS Excel (Вуколов, 2008).
Рассматривается два варианта проведения анализа:
Для интерпретации полученных данных необходимо четыре показателя:
Для возможности сравнения и дальнейшей работы полученные данные были объединены в единую таблицу (табл. 1).
Таблица 1. РЕГРЕССИОННЫЕ МОДЕЛИ ПРОДУКЦИИ ОЗЕРНОГО ФИТОПЛАНКТОНА
|
Карельский перешеек |
Латгальская возвышенность |
Обобщенная группа озер |
|
Множественный коэф. корреляции R |
0,96 |
0,58 |
0,57 |
|
Коэффициенты детерминации R2 |
0,92 |
0,34 |
0,32 |
|
Значение F-критерия Фишера |
26,14 |
3,67 |
5,11 |
|
Значимость F |
5,71E-05 |
0,06 |
0,002 |
|
Коэф. Модели/ Значимость |
Y-пересечение |
-14,12/0,27 |
54,60/0,26 |
33,82/0,32 |
Площадь озера (S) |
-6,98/0,0002 |
-173,38/0,03 |
-2,60/0,23 |
|
Средняя глубина (Hsr) |
-16,67/0,02 |
32,73/0,15 |
10,60/0,40 |
|
Макс. глубина (Hmax) |
9,02/0,002 |
-7,93/0,20 |
-1,51/0,72 |
|
Общий фосфор (Ptot) |
3867,90/0,00003 |
814,90/0,02 |
1047,84/0,0003 |
Когда данные обработаны и объединены в единую таблицу с ними можно работать и условно сравнивать. Начать следует с определения общего качества модели, ее достоверности и степени точности описания моделью процесса, как говорилось выше, достоверность определяется по уровню значимости критерия Фишера (в нашем случае для всех трех моделей р<0.05 (строка Значимость F в табл. 1), из этого следует что модели достоверны), а точность описания по коэффициенту детерминации (R-квадрат в таблице регрессионная статистика при выводе результатов в Exel). Коэффициент детерминации в первом случае (Карельский перешеек) R2=0.96, это говорит о высокой точности аппроксимации, в двух остальных случаях (Латгальская возвышенность и обобщенная группа озер) R2<0.6 (0.58 и 0.57 соответственно) - модель требует улучшения. Для улучшения модели проведем регрессионный анализ убрав переменные, значимость которых превышает заданный уровень значимости (р>0.05) (переменные выделены цветом в табл. 1). Следует обратить внимание, что р-значение коэффициента «Y-пересечение» в данных случаях так же превышает установленный уровень, это говорит о том, что линия регрессии будет проходить через начало координат и это следует учесть при проведении повторного анализа. Данные регрессии по аналогии с первым случаем выделим в отдельную таблицу (табл. 2).
Таблица 2. УЛУЧШЕННЫЕ РЕГРЕССИОННЫЕ МОДЕЛИ ПРОДУКЦИИ ОЗЕРНОГО ФИТОПЛАНКТОНА (без учета незначимых переменных)
|
Карельский перешеек |
Латгальская возвышенность |
Обобщенная группа озер |
|
Множественный коэф. корреляции |
0,99 |
0,86 |
0,86 |
|
Коэффициенты детерминации |
0,98 |
0,73 |
0,74 |
|
Значение F-критерия Фишера |
116,37 |
43,31 |
131,98 |
|
Значимость F |
9,65487E-08 |
0,006 |
4,12E-15 |
|
Коэф. Модели/ Значимость |
Y-пересечение |
0 |
0 |
0 |
Площадь озера (S) |
-6,95/0,0002 |
20,62/0,77 |
- |
|
Средняя глубина (Hsr) |
-17,65/0,0115 |
- |
- |
|
Макс. глубина (Hmax) |
9,05/0,0018 |
- |
- |
|
Общий фосфор (Ptot) |
3599,26/0,00001 |
1681,39/7,93E-08 |
1777,58/3,02E-15 |
После удаления не влияющих переменных из модели значение коэффициента детерминации повысилось, R2>0.7, а значит, улучшилась и степень соответствия построенной модели исходным данным.
Далее определяем значение коэффициентов модели (таблицы 2 и 3): в строке Y-пересечение - свободный член, в строках соответствующих переменных коэффициенты при этих переменных. Для составления уравнения регрессии мы будем использовать коэффициенты значимость которых не превышает 0.05, т.к. они оказывает наибольшее влияние на зависимую переменную. Таким образом, получается 3 уравнения:
Группа озер |
Уравнение |
Карельский перешеек |
РР =3599.26* Ptot + 9.05*Hmax - 17.65* Hsr - 6.95*S |
Латгальская возвышенность |
РР =1681.39* Ptot + 20.62*S |
Обобщенная группа озер |
РР =1777.58* Ptot |
Задача прогнозирования сводится к решению уравнения регрессии Y=a+Σbxi, путем постановки полученных в результате расчетов коэффициентов. На основании известных значений независимых переменных можно произвести оценку неизвестных будущих значений зависимой переменной.
Было рассмотрено несколько вариантов:
Для лучшей интерпретации полученных результатов воспользуемся графиками, соотношения данных натурных измерений первичной продукции и модельных расчетов, представленными на рис. 1- 3.
На графиках наглядно отражено соотношение исходных и рассчитанных данных. Самой хорошо «подогнанной» является регрессионная модель по Карельскому перешейку, в остальных моделях значительно отклонение от натурных наблюдений, а значит, они требуют и дальнейшего улучшения.
Выводы: Регрессионный анализ проведен по 20 озерам Карельского перешейка и Латгальской возвышенности, в ходе анализа была выявлена взаимосвязь между первичной продукцией и исследуемыми переменными.
Построенные модели описывают изучаемое явление с точностью от 30 до 95%, в случае если модель обладает высокой достоверностью - это означает правильность выбора фактора (или факторов) т.к. процент не объясненных вариаций, зависящих от других факторов невелик. В другом случае если преобладает число необъясненных вариации, это говорит о большом количестве посторонних, неучтенных факторов, которые вносят свой вклад в формирование первичной продукции водоема, но не находят отражения в построенной модели. Для улучшения качества построенных моделей следует внести в них дополнительные, ранее не учтенные переменные (к примеру, некоторые гидрохимические и гидрологические характеристики).
В нашем случае наиболее достоверной является модель по Карельскому перешейку, она наиболее точно описывает количественные связи между общим фосфором, морфометрическими характеристиками озер и образованием первичной продукции, в дальнейшем их можно использовать для получения оценок уровня продуктивности этих озер.
Литература: