Пример проведения статистического анализа категорированных данных

Резюме

В данной статье наглядно показано, как проводить статистический анализ категорированных медицинских данных, оценивать значимость их различия с помощью программы STATISTICA 10 и интерпретировать полученные результаты.

Ключевые слова: категорированныеданные, статистический анализ, значимость различия,STATISTICA

Значительное число признаков, описывающих объекты медицинских исследований,являются качественными, их невозможно измерить числом. Например, категория тяжести состояния (легкая, средняя, тяжелая, крайне тяжелая степень), пол, исход лечения (выжил, умер) и т.д.Эти признаки не связаны между собой никакими арифметическими соотношениями, упорядочить их также нельзя. При анализе качественных признаков изучается распространенность признаков, частота встречаемости признаков в различных выборках, оценивается взаимосвязь частоты встречаемости одного признака с частотой встречаемости другого признака. Данные о частотах наблюдения изучаемого признака и уровнях неколичественных переменных получили название категорированных.

Уровень проведения статистического анализа категорированных данных среди отечественных специалистов области медицины и здравоохранения традиционно является не достаточно высоким, сложность также представляет интерпретация результатов, полученных в результате применения специального программного обеспечения, поэтому рассмотрение данного вопроса видится авторам весьма актуальным.

Цель исследования. Проведение статистического анализа категорированных данных с помощью ППП STATISTICA 10, интерпретация результатов.

Материалы и методы. В хирургической клинике были сформированы данные о количестве наблюдений и случаев летальности для четырех форм острых гнойных деструкций легких (таблица 1)[1].Всего произведено 199 наблюдений. С помощью критерия Пирсона, реализованного путем

использования ППП STATISTICA 10,требуется оценить значимость различия между группами по числу случаев летальных исходов.

Таблица 1.

Номер группы

Форма заболевания

Число случаев

Число больных

летальных исходов

выздоровления

1

Гнойный абсцесс

4

136

140

2

Гангренозный абсцесс

11

37

48

3

Гангрена доли

3

5

8

4

Тотальная гангрена

3

0

3

Результаты и обсуждения. Задача решается в два этапа. На первом этапе строится таблица сопряженности, а затем производится анализ этой таблицы на предмет проверки гипотезы о случайности распределения частот в таблице сопряженности. Первый этап. Вводятся исходные данные (рисунок 1). Выбирается модуль «Основные статистики и таблицы» (Basicstatisticsandtables), подмодуль «Таблицы и заголовки» (TablesandBanners). Активизируется процедура «Задать таблицы» (Specifytables). Указываются признаки . В результате получается таблица сопряженности (рисунок 2), аналогичная таблице 1.

Второй этап. В диалоговом окне «Результаты кросстабуляции» (Crosstabulation tables resukts) отмечается процедура «Пирсон и МП хи-квадрат» (Pearson and ML Chi-square), также отмечается опция «Ожидаемые частоты» (Expected frequencies).Результаты выводятся в три отдельных окна: - окно таблицы наблюдаемых частот (то же, что и на рисунке 2);- окно таблицы ожидаемых частот (рисунок 3);- окно результатов применения в двух модификациях - метод Пирсона и метод максимального правдоподобия (рисунок 4).

Интерпретация результатов проводится в два этапа. Сначала анализируется таблица ожидаемых частот (рисунок 3). Считается, что если во всех ячейках этой таблицы частоты не меньше 5, то в дальнейшем можно с достаточной степенью уверенности интерпретировать результаты критерия . В полученной таблице в трех ячейках значения меньшие 5, из этого можно сделать вывод, что результаты критерия будут носить лишь приблизительный характер и нуждаются в уточнении.

На втором этапе интерпретируются результаты применения критерия (рисунок 4). Значение р<0,05 значит нулевая гипотеза об отсутствии различий между группами отклоняется.

Выводы. Различие числа летальных исходов для различных групп больных следует считать значимым (p<0,05). Однако, сделанный вывод имеет слишком общий характер. Отсюда следует, что оценка значимости различия групп по может быть только предварительной и нуждается в уточнении.

Список литературы

  1. Вестник хирургии имени И.И. Грекова: научно-практический журнал №1 – СПб.:Эскулап. – 1986.
  2. Жижин К.С. Медицинская статистика: Учебное пособие / Ростов н/д: Феникс, 2012. - 160 с.
  3. Платонов А.Е. Статистический анализ в медицине и биологии: задачи, терминология, логика, компьютерные методы. - М.: Издательство РАМН, 2013. - 52 с.
  4. Медик В.А., Токмачев М.С., Фишман Б.Б. Статистика в медицине и биологии: Руководство. В 2-х томах/
  5. Под ред. Ю.М. Комарова. Т. 1. Теоретическая статистика. - М.: Медицина, 2010. - 412 с.
  6. Реброва О.Ю. Статистический анализ медицинских данных. Применение ППП STATISTICA. - М.: Медиасфера, 2012. - 312с.
  7. Халафян А.А. Statistica 6. Статистический анализ данных. 3-е изд. Учебник - М.: ООО «Бином-Пресс», 2007. - 512 с.
Год: 2019
Город: Шымкент
Категория: Медицина