Целью анализа экологических данных является получение информации о состоянии объекта мониторинга, о процессах, к которым данные имеют (или предположительно могут иметь) отношение, а также о тенденциях их изменения. Помимо задачи прогнозирования, позволяющей экстраполировать во времени значения отдельных экологических параметров и экологической ситуации в целом, важной является задача выявления общих тенденций их изменения [1].
Выявление основной тенденции состоит из двух этапов:
- проверка гипотезы о наличии тренда;
- получение количественных характеристик тренда и их дальнейшей экстраполяции.
В целях оперативного управления для выявления тренда используются данные за краткосрочные периоды времени (день-неделя). В целях стратегического управления должны использоваться усредненные данные по дням за один или несколько месяцев, по месяцам за один год или несколько лет.
Проверку гипотезы о наличии тенденций предлагается производить на основе нескольких методов с последующим обобщением полученных результатов и общей оценкой справедливости гипотезы.
Проверку гипотезы о наличии тренда по каждому веществу будем осуществлять на основе 6 методов: метод средних, фазочастотный критерий знаков первой разности, метод Кокса-Стюарта, метод серий, метод укрупнения интервалов, метод сглаживания с помощью скользящей средней [2]. На основе полученных результатов разными методами сделаем вывод о наличии тренда.
Приведем краткую характеристику для каждого метода:
Метод средних уровни ряда разбиваются на 2-3 половины, по каждой половине определяется среднее значение, и если эти средние существенно различаются (более 10%), то гипотеза о наличии тренда принимается.
- Фазочастотный критерий анализируются знаки абсолютных приростов (цепных). Если смены знаков в этом ряду не происходит или число смен знака незначительно, то гипотеза о наличии тренда принимается.
- Метод Кокса-Стюарта все уровни ряда разбиваются на 3 части и уровни первой и последней сравниваются между собой.
- Метод серий определяется средний уровень ряда, после чего все уровни ряда разбиваются на 2 категории:
- уровень ряда меньше среднего;
- уровень ряда больше среднего. Количество блоков из каждой категории определяет количество серий.
Если тренд отсутствует, то число серий подчиняется нормальному закону распределения и, следовательно, с некоторой вероятностью можно утверждать, что число серий R находится в интерва-
ле ,
где среднее возможное число серий;
t коэффициент доверия;
.
-
- Метод укрупнения интервалов осуществляется переход к более крупным временным промежуткам, путем суммирования показателей. Если не наблюдается колебаний, нарушающих закономерность, версия о наличии тренда принимается.
- Метод сглаживания с помощью скользящей средней выбирается размер окна охватывающего элементы ряда, и осуществляется последовательное вычисление среднего значения со смещением данного окна на заранее заданный шаг.
Данные для анализа
В качестве примеров, иллюстрирующих теоретические исследования и разработки, будем рассматривать исходную экологическую информацию из базы данных «DB_SAP», которая является составной частью автоматизированной измерительной системы производственного экологического мониторинга (АИСПЭМ) и базируется на СУБД Microsoft SQL Server.
В качестве примера рассмотрим временной ряд изменения концентрации диоксида азота в точке контроля «1002 П. Защита, ул. Делегатская, 36,АО «Кедентранссервис», проходная, в период с 18.12.11 8:40 по 21.12.11 7:40 (рис. 1).
Рис. 1. Изменение концентрации диоксида азота
Выявление и построение тенденций изменения экологических параметров Первый способ. Разобьем диапазон значений на 3 части. Среднее значение по первой половине равно 0,048019, по второй 0,037011, по третьей 0,039211. Средние значения незначительно различаются, к тому же они не составляют убывающую последовательность. Следовательно, гипотеза о наличии тренда отклоняется.
Второй способ. Смена знаков происходит 68 раз, следовательно, согласно данному методу, гипотеза о наличии тренда должна быть отклонена.
Третий способ. Сравним 34 значение из первой и второй части. В результате оказывается, что 21 значение из первой части больше, чем значения из второй части. Следовательно, гипотеза о наличии тренда должна быть принята.
Четвертый способ. Число серий R в
данном случае равно 16. Установим коэффициент доверия t равным 1.
Значение R находится вне интервала [47,95; 55,05], следовательно, гипотеза о наличии тренда принимается [3].
Пятый способ. Укрупнение интервалов производилось до 20 наблюдений. Четвертое значение было больше, чем последнее, однако остальные значения представляли собой убывающую последовательность. Гипотеза о наличии тренда должна быть принята.
Шестой способ. Среднее считалось по 20 наблюдениям. В результате был получен график, представленный на рис. 2.
Рис. 2. График скользящей средней
Анализируя график, делаем вывод о том, что тенденция существует. Однако данный метод не подходит для определения наличия тенденций в режиме реального времени без участия оператора, поэтому вывод о наличии тенденций будем производить на основе предыдущих 5 способов.
Решение принятия гипотезы о наличии тренда можно производить путем простого сравнения количества методов, приводящих к выводу о наличии тренда, с количеством методов, отвергнувших данную гипотезу. В качестве альтернативного способа предлагается воспользоваться коэффициентом λ, рассчитываемым по формуле:
где
коэффициент доверия к со-
ответствующему ему методу
Если λ>0,5, гипотеза о наличии тренда принимается.
Если принять коэффициент доверия к каждому способу одинаковым, то для приведенного примера получаем, что λ=0,6. Следовательно, гипотеза о наличии тренда принимается.
Таким образом, все методы показали хороший результат, несмотря на то, что ряд обладал сравнительно небольшой тенденцией и был подвержен периодическим колебаниям.
После того, как гипотеза о наличии тенденции подтверждена, необходимо определить количественные характеристики тренда, позволяющие построить его график. Если абсолютные приросты примерно одинаковы, то в качестве аппроксимирующей функции можно взять линейную функцию. Если темпы прироста примерно постоянны, можно использовать показательную функцию. Если рост замедляется, то логарифмическую [4].
Рис. 3. Тенденция изменения концентрации диоксида азота
Можно провести сглаживание ряда динамики экологических параметров, это позволяет увидеть на кривой имеющие место колебания. Сглаживание имеет смысл проводить, если гипотеза о наличии тренда не подтверждена. Сглаживание позволяет вместо беспорядочных скачков временного ряда экологических параметров выделить его усредненные тенденции изменения. В нашем случае построим линейный тренд (рис. 3).
После того, как уравнения тренда построены, или произведено полиномиальное сглаживание временных рядов экологических параметров, значения точек данных кривых, соответствующие определенному интервалу времени, могут быть использованы для оценки тенденции изменения экологической ситуации в целом.
Заключение
Исследованы методы выявления тенденций изменения экологических параметров. Сделан вывод, что использование только одного метода не является целесообразным. Предложено совместное исполь-
зование метода средних, фазочастотного критерия знаков первой разности, метода Кокса-Стюарта, метода серий, метода укрупнения интервалов, в целях принятия решения о наличии или отсутствии тенденций изменения экологических параметров.
ЛИТЕРАТУРА
- Вересников Г.С. Исследование и разработка системы анализа экологической информации: автореф. на соискание ученой степени кандидата технических наук
// Москва, 2007 г.
- Шанченко Н.И. Лекции по эконометрике: учебное пособие для студентов высших учебных заведений, обучающихся по специальности «Прикладная информатика (в экономике)» / Ульяновск: УлГТУ, 2008.139 с.
- Материалы сайта www.helpstat.ru
- Кибзун А.И., Горяинова Е.Р., Наумов А.В., Сиротин А.Н. Теория вероятностей и математическая статистика. Базовый курс с примерами и задачами // М.: ФИЗМАТЛИТ, 2002. 224 с.