АННОТАЦИЯ
При решении биостатистических задач исследователи сталкиваются с трудностями, вызванными громоздкостью и сложностью вычислительных процедур, что в конечном итоге приводит к большим интеллектуальным усилиям и неоправданным временным затратам. Применение статистических пакетов прикладных программ (НИИ) позволяет повысить эффективность вычислительного процесса. В данной статье кратко рассмотрены некоторые типовые задачи медико-биологического характера, решаемые с помощью ППП STATISTICA.
Ключевые слова: медицина, данные, анализ, ППП, STATISTICA
В последние десятилетия медицина и биология вступили в новую фазу своего развития. Накопление огромных массивов количественных данных, нуждающихся в обработке и анализе, усилило математизацию и компьютеризацию этих фундаментальных наук.
Однако консерватизм, присущий работникам этой сферы деятельности, по сей день тормозит внедрение математических методов и информационных технологий в повседневную практику. Вторжение этих новшеств, полезное для медицины в целом, сопряжено с преодолением множества барьеров, одним из которых является психологическая неготовность медиков к работе с математическими формулами и компьютерными программами. Поэтому подготовка специалистов, владеющих навыками компьютерного анализа медико-биологических данных с использованием методов математической статистики, является весьма актуальным направлением современного медицинского образования.
Цель настоящей статьи: кратко рассмотреть некоторые типовые задачи медико биологического характера, решаемые с помощью ПНИ STATISTICA.
Математическая статистика - универсальный инструмент для анализа любых данных, в том числе и медико-биологических. Статистический анализ можно проводить вручную. Если данных немного, используемые методы просты, а расчеты вследствие этого не трудоемки. Но в подавляющем большинстве случаев необходимо пользоваться специальными статистическими программными пакетами для персональных компьютеров.
Рынок статистических пакетов достаточно обширен и достигает нескольких тысяч. Это профессиональные пакеты (SAS, BMDP), универсальные пакеты (STADIA, OLIMP, STATGRAPHICS, SPSS, STATISTICA,...), специализированные (BIOSTAT, MESOSAUR, DATASC'OPE....). Одним из наиболее известных в Казахстане пакетов для прикладного статистического анализа данных является пакет STATISTICA, который включает в себя большое количество методов статистического анализа объединенных специализированными статистическими модулями.
ИНН STATISTICA - это универсальная интегрированная система, предназначенная для статистического анализа и визуализации данных, содержащая широкий набор процедур анализа для применения в научных исследованиях различных направлений, в том числе и медицине.
Несложный в освоении этот статистический пакет может быть рекомендован для биомедицинских исследований любой сложности.
Перечислим некоторые виды задач медико-биологического характера, решаемых с помощью программы STATISTICA.
- Определение необходимого объема выборки. Перед началом проведения исследования важно определить объем выборки, необходимый для выявления значимого эффекта. Например, сколько пациентов необходимо включить в каждую из групп лечения, чтобы иметь 90%-мощность обнаружения значимого на уровне 5% различия в снижении артериального давления? Модуль Анализ мощности STATISTICA предлагает удобные инструменты для решения задач такого типа.
Рандомизация пациентов. Рандомизация - это процедура, обеспечивающая случайное распределение людей в основную и контрольную группы, обеспечение рандомизации пациентов по группам является одним из ключевых моментов исследования. В противном случае, понадобятся дополнительные усилия, чтобы доказать, что новый метод лечения не назначался более «легким» пациентам, а старый - более «тяжелым». При не рандомизированном исследовании есть риск получить смещенные оценки параметров, что не позволит доверять полученным результатам. В STATISTICA можно легко провести рандомизацию пациентов, которая может быть основана как на простом, так и на стратифицированном случайном выборе.
Визуальный анализ. Наглядное представление исходных данных и полученных результатов - неотъемлемая часть любого исследования. Графика STATISTICA традиционно признается наиболее точной и простой в использовании: обширный выбор различных типов графиков, удобные графические инструменты, возможность интерактивной настройки позволят создать наглядные графики презентационного качества и использовать их для составления отчета, статьи или презентации. Гистограммы, Диаграммы рассеяния, Диаграммы размаха, Круговые диаграммы, Графики средних с доверительными интервалами, различные категоризованные графики, трехмерные графики и многие другие виды графиков доступны и легки в построении.
Описательный анализ. В модуле Основные статистики и таблицы можно быстро и эффективно вычислить все интересующие описательные характеристики для исследуемых параметров. Среднее, стандартное отклонение, дисперсия, доверительные интервалы, стандартная ошибка, медиана, квартили и другие статистики могут быть одновременно получены как для всех пациентов, так и по группам.
Вычисление абсолютных, относительных рисков, отношения шансов.
Построение таблиц сопряженности позволит быстро установить степень связи между различными категориальными признаками, определить величину снижения риска неблагоприятного исхода при проведении операции, вычислить абсолютные, относительные риски, отношение шансов, а также все параметры, необходимые для построения их доверительных интервалов.
Выявление зависимостей между показателями. Связь между двумя непрерывными показателями (например, систолическим артериальным давлением и индексом массы тела, холестерином и триглицеридами и т.п.) может быть вычислена с помощью коэффициентов корреляции Пирсона, Спирмена, Тау Кендалла и др. Если необходимо проанализировать связь между несколькими непрерывными показателями и одной непрерывной зависимой переменной - в STATISTICA можно воспользоваться методами множественной регрессии, что позволит выявить, например, какие из показателей влияли на внутриглазное давление? Как прогнозировать величину снижения давления?
Сравнение эффективностей лечения в различных группах. Сравнить эффективности
лечения в различных группах в STATISTICA можно с помощью удобно реализованных критериев. Если групп лечения две, то можно воспользоваться T-критериями Стьюдента или непараметрическими критериями (Манна-Уитни, Вальда-Вольфовица и др.). Если групп несколько - дисперсионным анализом (ANOVA) или непараметрическим критерием Краскела-Уоллиса.
Выявление значимых факторов, влияющих на исход лечения, прогнозирование исхода лечения. Как из всех показателей, которыми характеризовались пациенты выделить набор факторов, которые наилучшим образом предсказывали бы исход лечения (или любую другую категориальную переменную)? Как по выявленным факторам прогнозировать исход лечения? Для ответа на этот вопрос, в зависимости от типов исходных данных и специфики задачи, можно воспользоваться дискриминантным анализом, логит-регрессией или Деревьями классификации.
Анализ выживаемости, сравнение выживаемости в различных группах. Различалось ли время до наступления смерти, рецидива или т.п. в зависимости от типа лечения? Какие факторы влияли на выживаемость? Как оценить время исправной эксплуатации протеза? Построить кривые Каплана-Мейера, а также протестировать гипотезу о равенстве выживаемости в группах с помощью критериев Гехана - Вилкоксона, Кокса-Ментела, F-критерия Кокса, логарифмического рангового критерия и др. можно в модуле Анализ выживаемости.
Современные компьютерные технологии делают статистические методы доступными каждому врачу и биологу. Программа STATISTICA с удобным интерфейсом, реализованным в виде последовательно открывающихся диалоговых окон, позволит провести как начальное исследование данных, так и углубленный анализ. С помощью STATISTICA можно подготовить аналитический отчет, написать статью, подготовить презентацию и выступление на конференции.
ЛИТЕРАТУРА
- Боровиков В.П. Statistica. Искусство анализа данных на компьютере. Для профессионалов. СПб.: Питер, 2001. - 656 с.
- Герасевич В.А., Аветисов А.Р. Современное программное обеспечение для статистической обработки биомедицинских исследований // Белорусский медицинский журнал. - 2005. - №1.- С.115-116.
- Кобринский Б.А. Медицинская информатика: учеб. для студ. учреждений высш. проф. образования / Б.А. Кобринский, Т.В. Зарубина. — 4-е изд., перераб. и доп. — М.: Издательский центр «Академия», 2013. — 192 с.
- Халафян А.А. Статистический анализ данных Statistica 6.0: Учебное пособие. Краснодар: КубГУ, 2005. - 308 с.