Аннотация
В данной статье на примере конкретной задачи будет продемонстрированно как с помощью программы STATISTICA и непараметрического критерия Манна-Уитни, который используется для оценки значимости различий в двух независимых группах, проводить статистический анализ, интерпретировать его результаты и делать выводы на основе результатов.
Ключевые слова: непараметрические методы, тест Манна-Уитни, оценка значимости различий, statistica.
Непараметрические методы проверки статистических гипотез находят широкое применение в медицинских и биологических исследованиях. Они отличаются простотой проведения, для них не требуется вычислять какие-либо параметры распределения (средние значения, стандартные отклонения и др.). Применение непараметрических методов статистического анализа целесообразно в следующих случаях: на этапе разведочного анализа; при малом числе наблюдений (n<30); в случае если данные не подчиняются нормальному закону распределения.
Для каждого параметрического критерия имеется, по крайней мере, один непараметрический аналог. Эти критерии можно отнести к одной из следующих групп: - критерии различия между независимыми группами; - критерии различия между зависимыми группами; - критерии зависимости между переменными.
Различия между независимыми группами. Если имеются две выборки, которые нужно сравнить относительно среднего значения некоторой изучаемой переменной, используется двухвыборочный t-критерий Стьюдента. Непараметрическими альтернативами этому критерию являются: критерий серий Вальда-Вольфовица, U-критерий Манна-Уитни и двухвыборочный критерий Колмогорова-Смирнова.
Различия между зависимыми группами. Если есть необходимость сравнить две переменные, относящиеся к одной и той же выборке, то обычно используется парный t-критерий Стьюдента. Альтернативными непараметрическими тестами являются: Z-критерий знаков, Т-критерий Вилкоксона парных сравнений.
Зависимости между переменными. Для того, чтобы оценить зависимость между двумя переменными, вычисляется коэффициент корреляции Пирсона. Непараметрическими аналогами коэффициента корреляции Пирсона являются ранговые коэффициенты Спирмена, тау Кендалла и коэффициент Гамма. Если две рассматриваемые переменные по природе своей категорированы, то для тестирования зависимости можно использовать непараметрические критерии: χ2-критерий Пирсона, точный критерий Фишера [1].
Цель исследования. Продемонстрировать реализацию непараметрического критерия Манна-Уитни, используемого для оценки значимости различия в двух независимых группах с помощью специального программного обеспечения STATISTICA и интерпретировать полученные результаты анализа.
Материалы и методы. Проводится анализ чувствительности к инсулину и секреции инсулина у женщин с предшествующим гестационным диабетом и женщин, которые не страдали от данного заболевания. Повышение сахара в крови во время беременности — одно из самых распространенных нарушений обмена веществ у будущей матери. Так называемый гестационный сахарный диабет или диабет беременных, это диабет, появляющийся в период вынашивания ребенка и ограничен сроками беременности. Во время беременности резко увеличивается выработка половых гормонов и гормона кортизола, которые подавляют действие инсулина. В результате уровень глюкозы в крови у беременных увеличивается. Высокий сахар крови во время беременности негативно сказывается как на здоровье самой женщины, так и на здоровье плода, поэтому требует своевременной диагностики, а в дальнейшем коррекции.
Было отобрано 12 женщин в возрасте 36 лет с нормальным весом, толерантных к глюкозе с предшествующим гестационным диабетом, и 11 контрольных пациенток в том же возрасте. В качестве одного из показателей изучалось содержание инсулина в плазме натощак (ммоль/л). Данные представлены в таблице 1[2].
С помощью непараметрического критерия Манна-Уитни нужно выяснить имеется ли разница в содержании инсулина в плазме натощак у женщин с предшествующим гестационным диабетом и женщин, которые не страдали от данного заболевания.
Контрольная группа (1) |
Группа с предшествующим гестационным диабетом (2) |
46,25 |
30,00 |
40,00 |
41,25 |
31,25 |
56,25 |
38,75 |
45,00 |
41,25 |
46,25 |
38,75 |
46,25 |
40,00 |
31,25 |
30,00 |
56,25 |
51,25 |
61,25 |
32,50 |
50,00 |
43,75 |
53,75 |
62,50 |
Таблица 1- Содержании инсулина в плазме натощак у женщин с предшествующим гестационным диабетом и женщин, которые не страдали от заболевания
Результаты. Решение задачи включает в себя несколько этапов: ввод данных, визуализацию данных с помощью графика «ящик с усами» (box plot), реализацию критерия Манна-Уитни с помощью модуля Nonparametrics (Непараметрические) и интерпретацию результативной таблицы.
Общее число участниц в эксперименте 23, поэтому создается таблица размера 2 столбца на 23 строки для ввода данных, на рисунке 1 показан фрагмент данной таблицы.
В результативной таблице (рис. 3) представлена следующая информация:
- значения ранговых сумм для первой и второй рассматриваемой группы, равные 95,5 и 180,5 соответственно;
- критическое значение критерия U, равное 29,5;
- объемы первой и второй выборок, равные 11 и 12 соответственно;
- уровень значимости различия р=0,026716 (<0,05), а это значит, что содержание инсулина в плазме натощак у женщин с предшествующим гестационным диабетом и женщин, которые не страдали от данного заболевания различается статистически значимо. Используя величину р можно определить достоверность различия показателя в двух исследуемых группах 1-р=1-0,026716=0,973284 или более 97,3%.
Выводы. Достоинства непараметрических методов заключаются в том, что они не требуют знания характера распределения, могут применяться при любых распределениях, могут быть использованы при любом, даже небольшом числе наблюдений, относительно просты и не требуют проведения сложных расчетов, соответственно, экономят время при вычислении. Однако, непараметрические критерии имеют меньшую статистическую мощность (менее чувствительны), чем их параметрические конкуренты. Имея в своем распоряжении компьютер с программой STATISTICA, можно легко применить к изучаемым данным различные критерии, в том числе и непараметрические. В ходе данного исследования была продемонстрирована реализация непараметрического критерия Манна-Уитни для оценки значимости различия в двух независимых группах с помощью программы STATISTICA и интерпретированы результаты анализа.
Список литературы
- Юнкеров В.И., Григорьев С.Г. Математико-статистическая обработка данных медицинских исследований. – СПб.: ВМедА, 2002. – 266 с.
- Daniel W., Cross C., Biostatistics. A Foundation for Analysis in The Health Sciences. - 10 edition. – 2013.- 738 р.
- Боровиков В.П. STATISTICA. Искусство анализа данных на компьютере: для профессионалов / В. Боровиков. - СПб.: Питер, 2004. - 688 с.
- Реброва О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA.-М.: Медиасфера, 2002.- 312с.
- Халафян А.А. Statistica 6. Статистический анализ данных. 3-е изд. Учебник - М.: ООО «Бином- Пресс», 2007. - 512 с.