Рассмотрим статистические и картографические методы анализа данных по состоянию почвенного покрова территории г. Кимры (левый берег) Тверской области, полученных в ходе полевых и лабораторных исследований авторов в 2014–2016 гг.
Описательная статистика позволяет обобщать первичные результаты, полученные при наблюдении или в эксперименте. Процедуры здесь сводятся к группировке данных по их значениям, построению распределения их частот, выявлению центральных тенденций распределения (например, средней арифметической) и, наконец, к оценке разброса данных по отношению к найденной центральной тенденции. [2]
Статистическая обработка полученных в результате исследования данных по концентрациям свинца, меди, цинка и кадмия в почвенном покрове г. Кимры проводилась с использованием пакета программ Microsoft Office Excel 2013 (табл. 1).
Таблица 1. Описательные статистики исследуемых параметров
Статистика |
Свинец (Pb) |
Медь (Cu) |
Цинк (Zn) |
Кадмий (Cd) |
Среднее |
27,62 |
8,79 |
46,95 |
0,16 |
Стандартная ошибка |
3,59 |
1,17 |
1,98 |
0,02 |
Медиана |
20,64 |
6,71 |
51,59 |
0,12 |
Мода |
81,49 |
4,83 |
#Н/Д |
0,13 |
Стандартное отклонение |
23,52 |
7,68 |
12,96 |
0,12 |
Дисперсия выборки |
553,13 |
58,92 |
168,06 |
0,01 |
Эксцесс |
1,30 |
4,17 |
1,38 |
2,81 |
Асимметричность |
1,44 |
1,96 |
-1,48 |
1,54 |
Интервал |
86,19 |
34,13 |
50,73 |
0,56 |
Минимум |
2,53 |
1,44 |
8,76 |
0,001 |
Максимум |
88,72 |
32,27 |
59,49 |
0,54 |
Сумма |
1187,86 |
378,1 |
2018,65 |
6,65 |
Счет |
43 |
43 |
43 |
43 |
Уровень надежности(95,0%) |
7,24 |
2,36 |
3,99 |
0,04 |
На основании описательных статистик можно заключить, что в большинстве случаев показатели центров выборок (среднее и медиана) близки, что свидетельствует о близости распределений показателей к нормальному распределению.
Явное исключение представляет собой распределение концентраций свинца с высокой дисперсией и стандартными ошибкой и отклонением. Скорее всего, это объясняется высокой вариативностью показателя, большим разбросом значений. Аналогичное, менее выраженное распределение имеет цинк.
Распределение концентраций меди характеризуется самым высоким эксцессом, что свидетельствует о наличии в выборке значений, явно отличающихся от общего среднего уровня.
Корреляционный анализ позволяет установить силу и направление взаимосвязи между переменными (случайными величинами). Если переменные измерены, как минимум, в интервальной шкале и имеют нормальное распределение, то корреляционный анализ осуществляется посредством вычисления коэффициента парной корреляции Пирсона (табл.2).[2]
Таблица 2. Коэффициенты корреляции
Свинец (Pb) |
Медь (Cu) |
Цинк (Zn) |
Кадмий (Cd) |
|
Свинец (Pb) |
1 |
|||
Медь (Cu) |
0,39 |
1 |
||
Цинк (Zn) |
0,53 |
0,50 |
1 |
|
Кадмий (Cd) |
0,18 |
0,53 |
0,26 |
1 |
В нашем случае df=41, при уровне значимости 0,1 критический коэффициент составит 0,26. Фактически все расчетные коэффициенты корреляции (табл. 2) превышают это значение, соответственно можно говорить о корреляционной зависимости на заданном уровне значимости следующих пар концентраций тяжелых металлов (в порядке убывания тесноты связи): цинк – свинец, кадмий – медь, цинк – медь, медь – свинец и кадмий – цинк.
Трехмерные графики используются для визуализации последовательностей значений нескольких переменных. ЗМ-диаграммы исходных данных применяются как для отображения данных, так и для аналитических исследований. Наиболее типичным приложением ЗМ-диаграмм исходных данных является наглядное представление имеющейся информации. Основное преимущество трехмерных представлений перед двухмерными составными линейными графиками заключается в том, что для некоторых множеств данных при объемном изображении легче распознавать отдельные последовательности значений. [6]
По графику можно выявить, что содержание кадмия в изучаемых образцах находится приблизительно на одном уровне, а содержание свинца, меди и цинка характеризуется большим разбросом данных.
Построение карт распределения концентраций тяжелых металлов, выполнено с использованием программного комплекса Surfer Golden Software. Назначение этой системы заключается в создании карт изолиний, трехмерных, теневых и др. карт; регуляризации и анализе пространственных данных, графической интерпретации числовых наборов данных и их обработке.
Для визуализации поверхностей Surfer использует данные на прямоугольной регулярной сети (грид). В пакете реализовано множество алгоритмов построения регулярной сети (регуляризации, или гриддинга) – интерполяционной функции. [5]
Метод Кригинг (Kriging) является геостатистическим методом, позволяет учитывать пространственную корреляцию данных. Метод дает хорошие результаты для большинства наборов данных при условии близости распределения значений нормальному распределению, отсутствия больших пробелов в данных и представительности количества точек наблюдения. [3]
Данный метод позволяет получить сглаженную картину перехода значений функции по расчетной площади, локализует максимумы точек наблюдения, при использовании коэффициента сглаживания результирующая поверхность стремится к осредненным в областях поиска значениям (рис. 1, 2, 3, 4).
Рисунок 1. Распределение концентраций свинца в почвах г. Кимры (мг/кг)
Рисунок 2. Распределение концентраций цинка в почвах г. Кимры (мг/кг)
Рисунок 3. Распределение концентраций меди в почвах г. Кимры (мг/кг)
Рисунок 4. Распределение концентраций кадмия в почвах г. Кимры (мг/кг)
Рассмотренные методы анализа данных являются весьма актуальными для оценки загрязнения почвенного покрова, поскольку позволяют оценить качество пробоотбора и проведения химико-аналитических исследований, интерполировать точечную информацию на всю территорию исследования, выявить выбросы значений, нередко свидетельствующие о наличии источников загрязнения, при выявлении стойких корреляционных зависимостей сократить число анализируемых мониторинговых параметров, а также обеспечивают создание основы построения экологических моделей разного рода.
Литература
Битюкова В.Р. Социально – экологические проблемы развития городов России. –М.: Едиториал УРСС, 2004. – 448 с.
Елисеева И.И., Юзбашев М.М. Общая теория статистики. – М.: Финансы и статистика, 2004. – 656 с.
Мальцев К.А., Мухарамова С.С. Построение моделей пространственных переменных (с применением пакета Surfer). – Казань: Казанский университет, 2014. – 103 с.
http://www.fort21.ru/cont/content.php?id=689 – Описание пакета Surfer. Режим доступа: свободный. Дата обращения: 08.05.2016.
http://www.hr-portal.ru/statistica/gl6/gl6.php – Трехмерный визуальный анализ данных. Режим доступа: свободный. Дата обращения: 16.05.2016.