РЕГРЕССИОННЫЕ МОДЕЛИ ПРОДУКЦИИ ОЗЕРНОГО ФИТОПЛАНКТОНА - Студенческий научный форум

IV Международная студенческая научная конференция Студенческий научный форум - 2012

РЕГРЕССИОННЫЕ МОДЕЛИ ПРОДУКЦИИ ОЗЕРНОГО ФИТОПЛАНКТОНА

 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Одной из важнейших характеристик озерных экосистем (как и любых других) является первичная продукция. Существенную роль в образовании первичной продукции в озерах играют одноклеточные водоросли - фитопланктон. Продукция фитопланктона определяется гидробиологами в процессе натурных экспериментов на озере, после чего на основе собранного материала делаются попытки формализовать зависимость первичной продукции от абиотических факторов - в первую очередь от концентрации биогенных элементов, особенно - общего фосфора. Для выявления взаимосвязи между этими переменными чаще всего используются регрессионные модели (Трифонова, 1989; Peters, 1989; Hakanson, Boulion, 2001, 2002).

Целью моей работы является построение подобных регрессионных моделей с привлечением нескольких лимнологических параметров. Зависимой переменной является первичная продукция (РР), предикторами были выбраны общий фосфор и некоторые морфометрические характеристики озер.

В качестве исходных данных были использованы результаты исследования разнотипных озер Карельского перешейка и Восточной Латвии, проведенного в 1976-1984 гг. Институтом озероведения РАН (Особенности формирования...., 1984; Трансформация органического и биогенных веществ...., 1989).

Регрессионный анализ проводился с использованием пакета MS Excel (Вуколов, 2008).

Рассматривается два варианта проведения анализа:

  • С разделением озер на две подгруппы по географическому признаку и анализ обобщенной группы озер
  • С использованием одной (общий фосфор, Ptot) или нескольких независимых переменных - средняя (Hsr) и максимальная глубина (Hmax), площадь озера (S) и содержание фосфора (Ptot).

Для интерпретации полученных данных необходимо четыре показателя:

  • R-квадрат (R2) - характеризует степень точности описания моделью процесса. Если R2 > 0.95, говорят о высокой точности аппроксимации (модель хорошо описывает явление). Если R2 лежит в диапазоне от 0.7 до 0.95, говорят об удовлетворительной аппроксимации (модель в целом адекватна описываемому явлению). Если R2 < 0.6, принято считать, что точность аппроксимации недостаточна.
  • Уровень значимости критерия Фишера (Значимость F) - оценивается качество модели, ее достоверность (значение значимости F должно быть меньше 0.05).
  • Значения коэффициентов модели. В строке Y-пересечение - свободный член, в строках соответствующих переменных - значения коэффициентов при этих переменных.
  • P-значимость - достоверность отличия соответствующих коэффициентов от нуля. В случае, когда р>0.05 - коэффициент считается нулевым. Это означает, что соответствующая независимая переменная практически не влияет на зависимую переменную и коэффициент может быть убран из уравнения.

Для возможности сравнения и дальнейшей работы полученные данные были объединены в единую таблицу (табл. 1).

Таблица 1. РЕГРЕССИОННЫЕ МОДЕЛИ ПРОДУКЦИИ ОЗЕРНОГО ФИТОПЛАНКТОНА

 

Карельский перешеек

Латгальская возвышенность

Обобщенная группа озер

Множественный коэф. корреляции R

0,96

0,58

0,57

Коэффициенты детерминации R2

0,92

0,34

0,32

Значение F-критерия Фишера

26,14

3,67

5,11

Значимость F

5,71E-05

0,06

0,002

Коэф. Модели/ Значимость

Y-пересечение

-14,12/0,27

54,60/0,26

33,82/0,32

Площадь озера (S)

-6,98/0,0002

-173,38/0,03

-2,60/0,23

Средняя глубина (Hsr)

-16,67/0,02

32,73/0,15

10,60/0,40

Макс. глубина (Hmax)

9,02/0,002

-7,93/0,20

-1,51/0,72

Общий фосфор (Ptot)

3867,90/0,00003

814,90/0,02

1047,84/0,0003

Когда данные обработаны и объединены в единую таблицу с ними можно работать и условно сравнивать. Начать следует с определения общего качества модели, ее достоверности и степени точности описания моделью процесса, как говорилось выше, достоверность определяется по уровню значимости критерия Фишера (в нашем случае для всех трех моделей р<0.05 (строка Значимость F в табл. 1), из этого следует что модели достоверны), а точность описания по коэффициенту детерминации (R-квадрат в таблице регрессионная статистика при выводе результатов в Exel). Коэффициент детерминации в первом случае (Карельский перешеек) R2=0.96, это говорит о высокой точности аппроксимации, в двух остальных случаях (Латгальская возвышенность и обобщенная группа озер) R2<0.6 (0.58 и 0.57 соответственно) - модель требует улучшения. Для улучшения модели проведем регрессионный анализ убрав переменные, значимость которых превышает заданный уровень значимости (р>0.05) (переменные выделены цветом в табл. 1). Следует обратить внимание, что р-значение коэффициента «Y-пересечение» в данных случаях так же превышает установленный уровень, это говорит о том, что линия регрессии будет проходить через начало координат и это следует учесть при проведении повторного анализа. Данные регрессии по аналогии с первым случаем выделим в отдельную таблицу (табл. 2).

 

Таблица 2. УЛУЧШЕННЫЕ РЕГРЕССИОННЫЕ МОДЕЛИ ПРОДУКЦИИ ОЗЕРНОГО ФИТОПЛАНКТОНА (без учета незначимых переменных)

 

Карельский перешеек

Латгальская возвышенность

Обобщенная группа озер

Множественный коэф. корреляции

0,99

0,86

0,86

Коэффициенты детерминации

0,98

0,73

0,74

Значение F-критерия Фишера

116,37

43,31

131,98

Значимость F

9,65487E-08

0,006

4,12E-15

Коэф. Модели/ Значимость

Y-пересечение

0

0

0

Площадь озера (S)

-6,95/0,0002

20,62/0,77

-

Средняя глубина (Hsr)

-17,65/0,0115

-

-

Макс. глубина (Hmax)

9,05/0,0018

-

-

Общий фосфор (Ptot)

3599,26/0,00001

1681,39/7,93E-08

1777,58/3,02E-15

После удаления не влияющих переменных из модели значение коэффициента детерминации повысилось, R2>0.7, а значит, улучшилась и степень соответствия построенной модели исходным данным.

Далее определяем значение коэффициентов модели (таблицы 2 и 3): в строке Y-пересечение - свободный член, в строках соответствующих переменных коэффициенты при этих переменных. Для составления уравнения регрессии мы будем использовать коэффициенты значимость которых не превышает 0.05, т.к. они оказывает наибольшее влияние на зависимую переменную. Таким образом, получается 3 уравнения:

Группа озер

Уравнение

Карельский перешеек

РР =3599.26* Ptot + 9.05*Hmax - 17.65* Hsr - 6.95*S

Латгальская возвышенность

РР =1681.39* Ptot + 20.62*S

Обобщенная группа озер

РР =1777.58* Ptot

Задача прогнозирования сводится к решению уравнения регрессии Y=a+Σbxi, путем постановки полученных в результате расчетов коэффициентов. На основании известных значений независимых переменных можно произвести оценку неизвестных будущих значений зависимой переменной.

Было рассмотрено несколько вариантов:

  • изучение влияния нескольких независимых переменных (в качестве независимых переменных использовались площадь, а так же средняя и максимальная глубина озера) на первичную продукцию
  • использование в качестве основного фактора только общий фосфор (как наиболее влияющего на образование первичной продукции в случае с обобщенной группой озер и по величине коэффициентов).


Для лучшей интерпретации полученных результатов воспользуемся графиками, соотношения данных натурных измерений первичной продукции и модельных расчетов, представленными на рис. 1- 3.

На графиках наглядно отражено соотношение исходных и рассчитанных данных. Самой хорошо «подогнанной» является регрессионная модель по Карельскому перешейку, в остальных моделях значительно отклонение от натурных наблюдений, а значит, они требуют и дальнейшего улучшения.

Выводы: Регрессионный анализ проведен по 20 озерам Карельского перешейка и Латгальской возвышенности, в ходе анализа была выявлена взаимосвязь между первичной продукцией и исследуемыми переменными.

Построенные модели описывают изучаемое явление с точностью от 30 до 95%, в случае если модель обладает высокой достоверностью - это означает правильность выбора фактора (или факторов) т.к. процент не объясненных вариаций, зависящих от других факторов невелик. В другом случае если преобладает число необъясненных вариации, это говорит о большом количестве посторонних, неучтенных факторов, которые вносят свой вклад в формирование первичной продукции водоема, но не находят отражения в построенной модели. Для улучшения качества построенных моделей следует внести в них дополнительные, ранее не учтенные переменные (к примеру, некоторые гидрохимические и гидрологические характеристики).

В нашем случае наиболее достоверной является модель по Карельскому перешейку, она наиболее точно описывает количественные связи между общим фосфором, морфометрическими характеристиками озер и образованием первичной продукции, в дальнейшем их можно использовать для получения оценок уровня продуктивности этих озер.

Литература:

  1. Вуколов Э. А. Основы статистического анализа. Практикум по статистическим методам и исследованию операций с использованием пакетов Statistica и exCel: учебное пособие. - 2-е изд., испр. и доп. - М.: Форум, 2008.
  2. Трансформация органического и биогенных веществ при антропогенном эвтрофировании озер. Отв.ред. В.Г.Драбкова, Е.А.Стравинская. Л., "Наука", 1989.- 268 с.
  3. Трифонова И. С. Содержание хлорофилла и скорость продуцирования органического вещества фитопланктоном в озерах с разным уровнем концентрации биогенных элементов // Трансформация органического и биогенных веществ при антропогенном эвтрофировании озер. Л., 1989.
  4. Hakanson L., Boulion V. V. Regularities in Primary Production, Secchi Depth and Fish Yield and a New System to Define Trophic and Humic state indices for Lake Ecosystems // Internat. Rev. Hydrobiol. 2001. 86, N 1.
  5. Håkanson L., Boulion V.V. The Lake Foodweb - modelling predation and abiotic/biotic interactions. Leiden: Backhuys Publishers, 2002.
  6. Peters R. H. The role of prediction in limnology // Limnol. And Oceanogr. 1986. 35(5).
Просмотров работы: 60