Использование непараметрического критерия манна-уитни для оценки значимости различий

Аннотация

В данной статье на примере конкретной задачи будет продемонстрированно как с помощью программы STATISTICA и непараметрического критерия Манна-Уитни, который используется для оценки значимости различий в двух независимых группах, проводить статистический анализ, интерпретировать его результаты и делать выводы на основе результатов.

Ключевые слова: непараметрические методы, тест Манна-Уитни, оценка значимости различий, statistica.

Непараметрические методы проверки статистических гипотез находят широкое применение в медицинских и биологических исследованиях. Они отличаются простотой проведения, для них не требуется вычислять какие-либо параметры распределения (средние значения, стандартные отклонения и др.). Применение непараметрических методов статистического анализа целесообразно в следующих случаях: на этапе разведочного анализа; при малом числе наблюдений (n<30); в случае если данные не подчиняются нормальному закону распределения.

Для каждого параметрического критерия имеется, по крайней мере, один непараметрический аналог. Эти критерии можно отнести к одной из следующих групп: - критерии различия между независимыми группами; - критерии различия между зависимыми группами; - критерии зависимости между переменными.

Различия между независимыми группами. Если имеются две выборки, которые нужно сравнить относительно среднего значения некоторой изучаемой переменной, используется двухвыборочный t-критерий Стьюдента. Непараметрическими альтернативами этому критерию являются: критерий серий Вальда-Вольфовица, U-критерий Манна-Уитни и двухвыборочный критерий Колмогорова-Смирнова.

Различия между зависимыми группами. Если есть необходимость сравнить две переменные, относящиеся к одной и той же выборке, то обычно используется парный t-критерий Стьюдента. Альтернативными непараметрическими тестами являются: Z-критерий знаков, Т-критерий Вилкоксона парных сравнений.

Зависимости между переменными. Для того, чтобы оценить зависимость между двумя переменными, вычисляется коэффициент корреляции Пирсона. Непараметрическими аналогами коэффициента корреляции Пирсона являются ранговые коэффициенты Спирмена, тау Кендалла и коэффициент Гамма. Если две рассматриваемые переменные по природе своей категорированы, то для тестирования зависимости можно использовать непараметрические критерии: χ2-критерий Пирсона, точный критерий Фишера [1].

Цель исследования. Продемонстрировать реализацию непараметрического критерия Манна-Уитни, используемого для оценки значимости различия в двух независимых группах с помощью специального программного обеспечения STATISTICA и интерпретировать полученные результаты анализа.

Материалы и методы. Проводится анализ чувствительности к инсулину и секреции инсулина у женщин с предшествующим гестационным диабетом и женщин, которые не страдали от данного заболевания. Повышение сахара в крови во время беременности — одно из самых распространенных нарушений обмена веществ у будущей матери. Так называемый гестационный сахарный диабет или диабет беременных, это диабет, появляющийся в период вынашивания ребенка и ограничен сроками беременности. Во время беременности резко увеличивается выработка половых гормонов и гормона кортизола, которые подавляют действие инсулина. В результате уровень глюкозы в крови у беременных увеличивается. Высокий сахар крови во время беременности негативно сказывается как на здоровье самой женщины, так и на здоровье плода, поэтому требует своевременной диагностики, а в дальнейшем коррекции.

Было отобрано 12 женщин в возрасте 36 лет с нормальным весом, толерантных к глюкозе с предшествующим гестационным диабетом, и 11 контрольных пациенток в том же возрасте. В качестве одного из показателей изучалось содержание инсулина в плазме натощак (ммоль/л). Данные представлены в таблице 1[2].

С помощью непараметрического критерия Манна-Уитни нужно выяснить имеется ли разница в содержании инсулина в плазме натощак у женщин с предшествующим гестационным диабетом и женщин, которые не страдали от данного заболевания.

Контрольная группа (1)

Группа с предшествующим гестационным диабетом (2)

46,25

30,00

40,00

41,25

31,25

56,25

38,75

45,00

41,25

46,25

38,75

46,25

40,00

31,25

30,00

56,25

51,25

61,25

32,50

50,00

43,75

53,75

 

62,50

Таблица 1- Содержании инсулина в плазме натощак у женщин с предшествующим гестационным диабетом и женщин, которые не страдали от заболевания

Результаты. Решение задачи включает в себя несколько этапов: ввод данных, визуализацию данных с помощью графика «ящик с усами» (box plot), реализацию критерия Манна-Уитни с помощью модуля Nonparametrics (Непараметрические) и интерпретацию результативной таблицы.

Общее число участниц в эксперименте 23, поэтому создается таблица размера 2 столбца на 23 строки для ввода данных, на рисунке 1 показан фрагмент данной таблицы.

В результативной таблице (рис. 3) представлена следующая информация:

  • значения ранговых сумм для первой и второй рассматриваемой группы, равные 95,5 и 180,5 соответственно;
  • критическое значение критерия U, равное 29,5;
  • объемы первой и второй выборок, равные 11 и 12 соответственно;
  • уровень значимости различия р=0,026716 (<0,05), а это значит, что содержание инсулина в плазме натощак у женщин с предшествующим гестационным диабетом и женщин, которые не страдали от данного заболевания различается статистически значимо. Используя величину р можно определить достоверность различия показателя в двух исследуемых группах 1-р=1-0,026716=0,973284 или более 97,3%.

Выводы. Достоинства непараметрических методов заключаются в том, что они не требуют знания характера распределения, могут применяться при любых распределениях, могут быть использованы при любом, даже небольшом числе наблюдений, относительно просты и не требуют проведения сложных расчетов, соответственно, экономят время при вычислении. Однако, непараметрические критерии имеют меньшую статистическую мощность (менее чувствительны), чем их параметрические конкуренты. Имея в своем распоряжении компьютер с программой STATISTICA, можно легко применить к изучаемым данным различные критерии, в том числе и непараметрические. В ходе данного исследования была продемонстрирована реализация непараметрического критерия Манна-Уитни для оценки значимости различия в двух независимых группах с помощью программы STATISTICA и интерпретированы результаты анализа.

Список литературы

  1. Юнкеров В.И., Григорьев С.Г. Математико-статистическая обработка данных медицинских исследований. – СПб.: ВМедА, 2002. – 266 с.
  2. Daniel W., Cross C., Biostatistics. A Foundation for Analysis in The Health Sciences. - 10 edition. – 2013.- 738 р.
  3. Боровиков В.П. STATISTICA. Искусство анализа данных на компьютере: для профессионалов / В. Боровиков. - СПб.: Питер, 2004. - 688 с.
  4. Реброва О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA.-М.: Медиасфера, 2002.- 312с.
  5. Халафян А.А. Statistica 6. Статистический анализ данных. 3-е изд. Учебник - М.: ООО «Бином- Пресс», 2007. - 512 с.
Год: 2020
Город: Шымкент
Категория: Медицина