Данный обзор посвящен изучению одной из наиболее актуальных проблем – компьютерному моделированию лекарственных средств. Здесь отражены основные методы, используемые в QSAR-моделировании. Цель работы - изложить их принципы работы, достоинства и недостатки.
Актуальность проблемы. Одной из фундаментальных задач фармацевтической науки является создание и усовершенствование лекарственных препаратов, позволяющих преодолеть такие проблемы, как полипрагмазия, неэффективность монотерапии при различных заболеваниях, антибиотикорезистентность микроорганизмов, обнаружение дополнительных побочных эффектов медицинских препаратов и др. Существенный вклад в её решение вносит целенаправленный синтез новых органических веществ и проведение биологического скрининга в ряду полученных соединений.
Создание новых препаратов требует значительных финансовых и временных затрат, проведения множества экспериментов по оценке биологических свойств. Подавляющее большинство синтезированных тестируемых соединений не проявляют активности или их токсичность исключает возможность практического применения. Решение проблемы возможно, если до стадии синтеза будут выявлены молекулярные фрагменты, оказывающие влияние на проявление активности и токсичности, проведено моделирование, прогноз и предложены для синтеза эффективные и наименее токсичные соединения. Поэтому являются актуальными исследования на основе теоретической оценки комплекса свойств «биологическая активность-токсичность» и моделирование конкретных молекулярных структур безопасных химических соединений.
Целью данной работы является описание и анализ основных методов, используемых в QSAR-моделировании. Задачи данного исследования:
- ознакомиться с методами QSAR-моделирования;
- выяснить принципы работы основных методов QSAR- моделирования;
- провести анализ достоинств и недостатков.
Методы работы: сравнительный анализ, обзор литературы. Обсуждение. Классификация методов QSAR/QSPR (по представлению дескрипторов или объемности описания структуры молекул) может быть представлена следующим образом [1]:
- 1D QSAR - поиск соотношений между активностью / свойством и общими молекулярными характеристиками: pKa, logP и др.;
- 2D QSAR - построение корреляций на основе 2D (топологических) характеристик структуры, например, индексов связности, 2D фармакофоров и др.;
- 3D QSAR - построение корреляций на основе 3D геометрии молекул с использованием потенциалов молекулярных полей в качестве дескрипторов;
- 4D QSAR - в рамках 3D QSAR используют дополнительную информацию о конформациях ансамбля лигандов;
- 5D QSAR - в рамках 4D QSAR используют дополнительную информацию об изменении конформации лиганда при связывании с белком (induced-fit model);
- 6D QSAR - в рамках 5D QSAR используют дополнительную информацию об эффекте растворителя.
Наиболее часто используются методы 3D QSAR, поскольку они более подробно отражают молекулярную структуру соединений, учитывая их пространственные характеристики. Это является определяющим фактором при моделировании производных соединений, поскольку точно отражает положение атомов в молекуле моделируемого вещества и позволяет предсказать не только структуру моделируемого вещества, но и помогает выделить его пространственные изомеры, что способствует наличию альтернативных вариантов при разработке вещества.
Принцип работы методов 3D QSAR построен на предположении о взаимосвязи между биологической активностью лигандов (молекулярных комплексов) и биологических мишеней, за счет воздействия с помощью молекулярных полей. При представлении структур важными параметрами, определяющими порядок моделирования вещества, являются молекулярные дескрипторы. Дескриптор - параметр, характеризующий структуру органического соединения таким образом, что подмечаются какие-то определенные особенности этой структуры. Существующие наборы молекулярных дескрипторов могут быть условно разделены на следующие категории [2]:
- фрагментные дескрипторы;
- топологические индексы;
- физико-химические дескрипторы;
- квантово-химические дескрипторы;
- дескрипторы молекулярных полей;
- константы заместителей;
- фармакофорные дескрипторы;
- дескрипторы молекулярного подобия.
Методы 3D QSAR предполагают выполнение определённого числа основных операций:
- формирование базы лигандов. На первом этапе формируется база данных, содержащая структурные формулы соединений и экспериментально определённые свойства (активности). Для получения QSAR-модели с хорошей предсказательной способностью важно, чтобы: а) все лиганды имели одинаковый механизм связывания с мишенью; б) значения активностей были получены одним методом; в) активности должны быть приведены в одинаковых единицах измерения; г) диапазон активностей должен быть насколько возможно более широким, желательно не меньше трёх логарифмических единиц; д) желательно, чтобы значения активностей были разбросаны симметрично относительно среднего значения;
- генерация 3D-геометрии. Для построения пространственной геометрии структур используют следующие подходы: на основе экспериментальных данных, библиотеки фрагментов - 3D-структуру можно построить на основе фрагментов, собранных в специальные библиотеки, автоматическая конвертация из 2D в 3D. Часто информация о строении молекулы хранится в одно- или двумерном представлении, которое необходимо перевести в трёхмерную систему координат;
- оптимизаuия геометрии. Для оптимизации геометрии применяют три подхода: методы молекулярной механики; методы квантовой механики (для малых молекул); гибридные методы, сочетающие эти подходы (применяются для больших молекул);
- конформационный анализ. Для построения модели необходимо привести все лиганды из базы в конформации, в которых они предположительно связываются с биологической мишенью, - такая конформация называется биологически активной. Если пространственная структура мишени известна, найти биологически активную конформацию можно, выполняя докинг лигандов в мишень. При неизвестной структуре мишени перебирают низкоэнергетические конформации лигандов. Также для конформационного анализа гибких молекул часто применяют методы молекулярной динамики, которая воспроизводит движение молекулы в зависимости от времени. Применяются также генетические, или эволюционные алгоритмы, которые основаны на имитации биологической эволюции. На начальном этапе создаётся популяция решений (конформеров), которые затем подвергаются мутациям, на каждом шаге определяется энергия, и в случае уменьшения энергии характеристики конформера, обеспечившие улучшение решения, его характеристики передаются последующим поколениям конформеров; - выравнивание базы структур. Для корректного расчета потенциалов молекулярных полей в узлах решетки необходимо, чтобы все структуры лигандов были расположены в пространстве единообразно, и группировки атомов разных лигандов, обладающие сходной функциональностью, совмещались. Выбор способа выравнивания зависит от структурной гомогенности базы данных. Совмещение «атом-на-атом» проводится в случае, если все лиганды из базы обладают общим фрагментом (шаблоном). Каждая молекула совмещается с заранее заданным шаблоном путём минимизации среднеквадратичного отклонения расстояний между атомами молекулы и шаблона. В случае отсутствия общего фрагмента у лигандов можно проводить совмещение не на основе атомного скелета, а на уровне молекулярных полей. В этом случае изменением пространственной ориентации молекул добиваются максимального совмещения их молекулярных полей. Связывание лигандов происходит в полости биологической мишени за счёт наличия в лигандах структурных элементов со сходной функциональностью. Эти элементы, отвечающие за наличие у соединения определенного типа биологической активности, называются фармакофорами. Для выравнивания лигандов также проводят поиск фармакофоров и изменение пространственной ориентации молекул таким образом, чтобы фармакофоры накладывались друг на друга. Для того, чтобы избежать проблем, связанных с выравниванием, разработан ряд методов 3D QSAR, не требующих пространственного совмещения молекул [3].
К основным методам относят: CoMFA (Comparative Molecular Field Analysis), GRID (Graphic Retrieval and Information Display), CoMSIA (Comparative molecular similarity analysis) и метод CMF (Continuous Molecular Fields). Рассмотрим каждый из них более подробно.
Метод CoMFA (метод сравнительного анализа молекулярных полей) является наиболее часто используемым методом 3D QSAR, и является основополагающим для других методов данной группы. Смысл его заключается в помещении каждой молекулы из исследуемой выборки в пространственную кубическую решетку. Затем в каждый узел решетки помещается пробный атом - «щуп» для оценки стерического и электростатического взаимодействий. Он имеет базовые значения: Sp-3 гибридизацию углеродного атома и заряд Á1 (протон), и «выравнивает» исследуемую молекулу, формируя молекулярное поле. При операции «подгонка поля» минимизируются различия в сумме стерических и электростатических энергий. Если используется серия конформационно жестких молекул «Правило выравнивания» заменяется оптимальным совмещением жестких фрагментов структур молекул с молекулой- шаблоном, которая может существовать в базе данных или устанавливаться пользователем. Далее проводится анализ данных методом частичных наименьших квадратов (PLS- методом), важной чертой которого является способность анализировать большое число дескрипторов [4].
Несмотря на свои большие возможности, метод CoMFA имеет ряд недостатков: 1) метод в его стандартной форме не учитывает энтропийный фактор взаимодействия лиганд- рецептор; 2) метод не учитывает возможность образования водородных связей между молекулами лиганда и рецептора, играющих определяющую роль во многих биологических процессах; 3) расчет стерической суммарной энергии взаимодействия вынуждает использовать значение 30 ккал/моль в качестве граничного из-за чувствительности расчетного метода Леннард-Джонса к изменению расстояния в точках вблизи атомов молекулы; 4) контурные карты, используемые для интерпретации результатов CoMFA иногда имеют ряд разрывов и отражают только участки, находящиеся вне молекулы.
Метод GRID (метод графического поиска и отображения информации). Данный метод разрабатывался как альтернатива методу CoMFA. Он также рассчитывает взаимодействие между молекулой и пробными атомами, расположенными в узлах трёхмерной решётки, но имеет ряд преимуществ:
- изменена формула расчета стерического потенциала (вместо потенциалов Леннард-Джонса 6-12 используются функции типа 6-4);
- для описания большого разнообразия типов межмолекулярного взаимодействия в методе GRID используются не только пробные отдельные атомы («щупы»), но группы атомов;
- данная программа также вычисляет потенциалы водородной связи и гидрофобный потенциал [5].
Метод CoMSIA (метод сравнительного анализа сходства молекулярной структуры). Данный метод работает по принципу сравнительного анализа индексов подобия. В качестве индексов подобия выступают следующие физикохимические свойства: атомный радиус, атомный заряд, log P (гидрофильность), комплексы «лиганд-Cd» и «лиганд-Са».
В качестве статистического метода (для анализа данных) также используется PLS-метод. Расчет потенциалов с помощью функций гауссового типа позволяет избежать недостатков метода CoMFA, обусловленных наличием отсекаемых значений при использовании функции Леннард- Джонса. Кроме того, строящиеся в рамках метода контурные карты легче интерпретировать по сравнению с картами, полученными методом CoMFA [6].
Метод CMF, или метод непрерывных молекулярных полей. Принцип работы данного метода заключается в представлении молекулярных объектов в виде комбинации (суммы) нескольких статистических ядер, рассч итываемых с помощью непрерывных гладких функций. Каждое ядро представляет собой сумму отдельных типов полей (стерическое, электростатическое, липофильное) каждого типа молекулы, присутствующего в исследуемой структуре. Для анализа данных используется суммарный расчет потенциалов каждого ядра с помощью функции гауссового типа. Такая статистическая модель содержит не дискретный набор конечного числа параметров, а непрерывное поле регрессионных коэффициентов [7].
Для оценки эффективности данного метода было проведено исследование по прогнозированию биологической активности ингибиторов ферментов. Показано преимущество этой методологии по сравнению со стандартными методами 3D QSAR в отношении прогнозирования ингибирующей активности производных 3-амидинофенилаланина по отношению к трём ферментам подгруппы сериновых протеаз: трипсину, тромбину и фактору Ха. Модели, построенные с помощью методологии CMF, показали более высокую прогнозирующую способность на скользящем контроле, чем модели, полученные стандартными методами CoMFA и CoMSIA.
Выводы. Ознакомившись с методами 3D QSAR- моделирования, мы пришли к выводу, что наиболее удобным методом для работы можно считать метод CoMSIA, за его высокую точность вычислений и удобную интерпретацию результатов в программном обеспечении, и метод CMF - использование непрерывных полей для сравнения структур, который позволяет применять построенные модели для поиска принципиально новых лекарственных препаратов с новыми мотивами расположения фармакофоров. Достоинством подхода в последнем методе являются также его малая чувствительность к выбору контрольных примеров, возможность объединения в рамках одной модели соединений, относящихся к разным структурным классам и поиска потенциально активных лигандов с различным расположением фармакофорных групп. Поэтому программное обеспечение, работающее на данных методах, будет являться наиболее оптимальным выбором для 3D QSAR-моделирования.
СПИСОК ЛИТЕРАТУРЫ
- Verma, J. 3D-QSAR in Drug Design - A Review / J. Verma, V.M. Khedkar, E.C. Coutinho. // Current Topics in Medicinal Chemistry. - 2010. - Vol.10. - P. 95-115.
- Todeschini, R. Molecular descriptors for chemoinformatics, 2nd edition / R. Todeschini, V. Consonni. - Wiley: VCH, 2009.
- Хёльтье, Х.-Д. Молекулярное моделирование: теория и практика / Х.-Д. Хёльтье, В. Зиппль, Д. Роньян, Г. Фолькерс. - М.: Бином. Лаборатория знаний, 2013. - 216 с.
- Kubinyi, H. 3D QSAR in Drug Design. Vol. 2. Ligand-Protein Complexes and Molecular Similarity / H. Kubinyi, G. Folkers, Y.C. Martin. - Dordrecht: Kluwer Academic Publishers, 2002. - 85 Р.
- Davis, A.M. The use of the grid program in the 3-D QSAR analysis of a series of calcium channel agonists / A.M. Davis, N.P. Gensmantel, E. Johansson, D.P. Marriott // J. Med. Chem. - 1994. - Vol. 37. - P. 963-972.
- Klebe, G. Comparative molecular similarity index analysis (CoMSIA) to study hydrogen-bonding properties and to score combinatorial libraries / G. Klebe, U. Abraham. // Journal of Computer-Aided Molecular Design. - 1999. - Vol. 13. - P. 1-10.
- Жохова, Н.И. Метод непрерывных молекулярных полей в поиске количественных соотношений «структура - активность» / Н.И. Жохова, И.И. Баскин, Д.К. Бахронов и др. // Докл. РАН. - 2009. - Т.429. - № 2. - С. 127-140.