Введение. Полная последовательность генома M. tuberculosis H37Rv (вирулентный штамм, выделенный в 1905 году, а затем размноженный в лабораторных условиях) впервые была опубликована в 1998 году. Кольцевой геном состоит из 4411532 пар оснований и имеет среднее содержание гуанина и цитозина 65,6%. Оригинальная аннотация определила 3974 гена, кодирующих 3924 белка и 50 стабильных РНК. С тех пор были добавлены первоначально упущенные, дополнительные 82 белок кодирующих гена. С быстрым развитием технологии секвенирования нового поколения, секвенирования полного генома (WGS), появилась беспрецедентная возможность для выявления генетического разнообразия микобактерий туберкулеза (МТБ). Из-за невысокого генетического разнообразия MTB, WGS является уникальным мощным инструментом, обеспечивающим как чувствительность обнаружения редких генетических событий, а также широкое применение для выявления различных форм генетических изменений.
Материалы и методы.
ДНК библиотеки были подготовлены для 20 клинических изолятов M. tuberculosis, из них 8 - MDR (multidrug resistant), 3 - XDR (extensively drug-resistant ), 1 - монорезистентный, 1 -
полирезистентный, и 5 - чувствительных образцов. Подготовка библиотеки ДНК состоит из 6 этапов: ДНК фрагментация с помощью небулизации, затупление концов фрагментов, подготовка AMPure beads, лигирование адаптеров, удаление маленьких фрагментов, количественная оценка библиотеки, качественная оценка библиотеки, подготовка рабочих аликвот. Следующий этап титрование - осуществлялся с помощью метода эмульсионного титрования, где проводились нескольких эмульсионной ПЦР и использовались различные соотношениях ДНК фрагментов к магнитным бусинкам (микрочастицы). Для осуществления эмульсионной ПЦР и обогащения магнитных бусинок с фрагментами ДНК использовали руководство завода-изготовителя Roche emPCR Method Manual - Lib-L SV, где использовался набор emPCR Kit Lib-L SV.
Было проведено полногеномное секвенирование двадцати изолятов M.tuberculosis на высокопроизводительной платформе секвенирования нового поколения Roche 454 GS FLX+ методом «shotgun» секвенирования. Полногеномное секвенирование проводилось в два этапа: а) пулирование первых 10 изолятов на 2-х регионах сиквенсового чипа; б) пулирование остальных 10 изолятов также на 2-х регионах.
Сборка полных геномов проводилась с использованием NEWBLER de novo assembler (454 Life Sciences, Branford, CT). Выравнивание и картирование сиквенсовых ридов проводилось на референсный штамм M.tuberculosis H37Rv (NC_000962.3, GCF_000195955.2) с использованием GS Reference Mapping (454 Life Sciences, Branford, CT). Полный референсный геном был загружен из международной базы GenBank (National Center for Biotechnology Information). Сравнительный анализ обнаруженных геномных вариантов среди 20 изолятов проводили с применением диаграмм Венна. Поиск генетических локусов и генов, соответствующих определенной позиции в геноме, среди обнаруженных геномных вариантов проводился с применением разработанного биоинформатического скрипта.
Результаты и обсуждение. Проведен биоинформатический анализ, по результатам которого относительные показатели покрытия 20 штаммов M.tuberculosis были достаточно высокими и достаточными для дальнейшей загрузки геномов в международные базы данных и публикации. Выравнивание сиквенсовых ридов проводилось отдельно для каждого из двадцати изолятов. В среднем, по всем изолятам, 97,8 % сиквенсовых ридов было картировано на референсный штамм M.tuberculosis H37Rv, что в нуклеотидном выражении составило 4334396 оснований.
Изучены генетические маркеры для диагностики лекарственно-устойчивых форм туберкулеза, такие как MDR и XDR штаммы M.tuberculosis. Для изучения геномных локусов, участвующих в возникновении устойчивости к основным лекарственным препаратам была проанализирована международная база данных «Tuberculosis Drug Resistance Mutation Database». В результате анализа были отобраны наиболее часто встречающиеся мутации в генетических локусах к основным противотуберкулезным препаратам.
Для каждого полногеномного изолята были проанализированы генетические локусы, определяющие устойчивость к лекарственным препаратам из числа найденных геномных вариантов и соответствующие гены. Было обнаружено от 18 до 27 генетических локусов с геномными вариантами среди полногеномных данных 20 изолятов. Подготовлены все обнаруженные геномные варианты (однонуклеотидные полиморфизмы, инсерции, делеции) для каждого изученного изолята с указанием общей глубины покрытия на данный вариант, описанием продукта гена, позиции в референсном геноме.
Для изолятов MTB-07-005 и MTB-06-006 было обнаружено аномально низкое количество генетических изменений в сравнении с референсным штаммом M.tuberculosis H37Rv, с общей группой по типу MDR и чувствительный. Практически все изоляты относятся к семейству Beijing, за исключением изолята MTB-06-006, относящегося к семейству Т - евро-американская линия происхождения, что может служить подтверждением существенного отличия MTB-06-006 на уровне генетических изменений.
Нами были выбраны три основные клинические группы для проведения сравнительного биоинформатического анализа между изолятами - чувствительная (SUSC), MDR и XDR. В качестве отдельных представителей каждой группы были выбраны изоляты - МТВ-06-003, МТВ- 07-006 и МТВ-07-002. Большее сходство MDR и XDR изолятов с чувствительным (SUSC) нежели между собой, на основании выбранных изолятов, т.е. между изолятами МТВ-06-003 и МТВ-07-006 обнаружено 4 общих генетических локуса (гены PE_PGRS24, PPE24, PPE5, PE_PGRS56), не найденных в МТВ-07-002. Между МТВ-07-002 и МТВ-06-003, а также между МТВ-07-002 и МТВ- 07-006 обнаружено 45 и 33 общих уникальных генетических локуса, соответственно.
Обнаружено 1018 общих генетических локуса между тремя изолятами разных клинических групп, основную часть из которых составляют, так называемые «ядерные (core)» генетические локусы - самые необходимые для обеспечения жизнедеятельности микобактерии. Также необходимо отметить, что обнаруженные геномные варианты в четырех генах PE_PGRS24, PPE24, PPE5, PE_PGRS56, характерные для MDR и XDR изолятов, относятся к семейству генов РЕ/РРЕ, являющихся уникальнымы и представленным только для вида микобактерий. Белки данного семейства генов могут играть роль факторов вирулентности и способствовать успешному инфицированию. Таким образом, мутации характерные для двух данных изолятов (MDR и XDR) могут быть одним из дополнительных факторов вирулентности, дающих преимущество данным изолятам при взаимодействии с организмом хозяина и требуют дальнейшего изучения.
Результаты сборки двух геномов M.tuberculosis были загружены в базу данных NCBI GenBank и доступны для публичного доступа под номерами AZBA00000000, AZAZ00000000.
Выводы: Впервые в Казахстане использованы методы высокопроизводительного секвенирования нового поколения для определения полной последовательности генома 20 клинических изолятов M.tuberculosis с различным профилем лекарственной чувствительности.