Экзомное секвенирование что это такое
Cеквенирование экзома
Метод секвенирования нового поколения (NGS), ограниченный областями генома, кодирующими белок. Охватывает 1% генома, но содержит около 85% вариантов нуклеотидной последовательности, вызывающих заболевания.
Технический обзор
Экзомное секвенирование — это целенаправленный метод секвенирования нового поколения (NGS), который ограничен областями генома, кодирующими белок. Экзом охватывает приблизительно 1% генома, но содержит около 85% вариантов нуклеотидной последовательности, вызывающих заболевания.
Биоинформатикам, пытающимся выявить среди множества находок гены, вовлеченные в более чем 6800 редких заболеваний, секвенирование экзома позволяет быстро и экономически эффективно идентифицировать однонуклеотидные полиморфизмы и инделы (небольшие инсерции и делеции).
1% генома охватывает экзом
85% вариантов нуклиотидной последовательности
6800 редких заболеваний
При диагнозе с клинической неоднородностью
Примеры: эпилепсия, эпилептические энцефалопатии, мышечные дистрофии/мышечные расстройства, атаксия, невропатии, кардиомиопатии, дисплазии соединительной ткани, иммунодефициты, глухота, слепота при исключении основных синдром-ассоциированных вариантов
С атипичными клиническими проявлениями или фенотипами. С клинической точки зрения трудно выделить конкретный ген или группу генов
Пример: Наследственные атаксии, атипичный паркинсонизм
При генетически гетерогенных состояниях, когда число вовлеченных генов в заболевание велико
Примеры: умственная отсталость и тяжелый иммунодефицит, аутизм
При отягощенной наследственности, когда другие генетические исследования не позволили установить диагноз
Пример: пациент с задержкой нервно-психического развития и аналогично пораженные брат и сестра, хромосомный микроматричный анализ отрицателен.
В ходе интерпретации данных полноэкзомного секвенирования можно найти различные варианты — известные патогенные или доброкачественные, с неизвестной клинической значимостью или редкие варианты, неописанные ранее. Для того, чтобы определить клиническую значимость и сопоставить найденный вариант с генетическим заболеванием, необходимо владеть как можно большим объемом клинической информации о пробанде и его ближайших родственниках. Сокрытие любой клинической информации, включая семейный анамнез пациента, может повлиять на результаты тестов и их интерпретацию. Отсутствие клинической информации может привести к исключению генетических вариантов, которые могут быть актуальны для пациента, а также к присвоению неверной клинической значимости выявленным вариантам.
Выделение ДНК → Подготовка ДНК библиотек → Обогащение регионов → Секвенирование → Биоинформатическая обработка данных
Включает анализ последовательности всего экзома пациента и родителей или других членов семьи.
Тройной подход в экзомном секвенировании улучшает диагностическую точность, облегчая анализ вариантов нуклеотидной последовательности и позволяя выявлять мутации de novo, которые лежат в основе многих заболеваний с ранней манифестацией и тяжелым течением.
«Клинический экзом»
Секвенирование экзонов только тех генов, мутации в которых, приводят к развитию известных заболеваний
На сегодня в базе OMIM описано более 4700 таких генов. Несмотря на то, что данная разновидность анализа дешевле, список генов постоянно подвергается обновлению, следовательно, он менее информативен.
Панельное секвенирование
Основывается на анализе группы генов, объединенных в мультигенные панели. Данный вид диагностики сфокусирован на конкретном синдромальном показании.
Случайные результаты при таком подходе маловероятны. Панели выходят из употребления по мере открытия новых генов, связанных с заболеванием или выявления атипичных симптомов, пересекающихся с показаниями к использованию той или иной панели.
По мере добавления данных требуется только переанализ, но не повторное секвенирование
При эпилепсии, врожденной мышечной дистрофии, деменции, пренатальном тестирование и экзомноем секвенировании новорожденных
Позволяет выявить как унаследованные, так и мутации de novo
Научное подтверждение
Диагностическая эффективность экзомного секвенирования
Эпилепсия является общим знаменателем гетерогенной группы эпилептических расстройств с различными причинами, в том числе генетическими, и симптомами.
Сложности в определении эпилепсий без диагностических гипотез с неспецифическими симптомами возникают довольно часто. Диагностическая эффективность секвенирования экзома у больных с эпилепсией по разным данным составляет от 34 до 49% (Tumienė, B., et al.,2018, Forman E.B., 2018, Helbig KL., et al., 2016) по сравнению с 8% при применении хромосомного микроматричного анализа (Кожанова Т.В., 2019). Секвенирование экзома в 1,9 раза более результативно, чем диагностический выход панели «Наследственные эпилепсии» (диагностическая эффективность 19,0%; Р=0.0018)(Costain G., 2019). Установление генетического диагноза может повлиять на выбор лечения, как было продемонстрировано у пациентов с нарушениями в генах SCN1A, SCN8A, SLC2A1 (Snoeijen-Schouwenaars, F. M., et al., 2018).
На сегодняшний день генетическое исследование при эпилепсии рекомендуется начинать с секвенирования нескольких генов и/или целевых панелей и, наконец, выполнять экзомное секвенирование в оставшихся недиагностированных случаях.
Врожденные мышечные дистрофии (ВМД) представляют собой гетерогенную группу расстройств, характеризующихся дебютом преимущественно в раннем детском или юношеском возрасте и наличием признаков дистрофии в первую очередь проксимальных мышц верхних и нижних конечностей. Частота генетической диагностики ВМД остается низкой и составляет примерно 24%. Семьи с с невыявленными патогенными вариантами ВМД сталкиваются с неопределенностью в отношении риска прогрессирования заболевания, а также передачи потомству и необходимостью непрерывного медицинского наблюдения. Диагностический коэффициент экзомной генетической диагностики пациентов с мышечной дистрофией, для которых прицельное секвенирование по Сэнгеру не позволило выявить генетическую причину нарушения, составил 40% для одиночных пробандов и от 34% до 60% для секвенирования «трио» (Ghaoui R., et al., 2015; Harris, E., et al., 2017).
Деменция является наиболее частым нейродегенеративным расстройством, затрагивающим от 1% до 3% населения во всем мире. Большая генетическая гетерогенность является сложной задачей для диагностики, поскольку фенотип у многих пациентов либо не является синдромальным, либо молекулярно-генетическая причина все еще неизвестна.
Экзомное секвенирование является золотым стандартом диагностики нейродегенеративных расстройств. По литературным данным, у пациентов, которым не удалось установить диагноз после панельного исследования, диагностическая эффективность экзомного секвенирования составила 22%- 27% (E Chérot, et al.,2018; Bojan Zalar, et al., 2018).
Приблизительно 2-4% беременностей осложняются значительными пороками развития плода. Стратегия пренатального тестирования и выбор тестов должны быть индивидуальны и соотнесены с результатами УЗИ и семейным анамнезом. Современные варианты включают: анализ кариотипа, флуоресцентную гибридизацию in situ (FISH) и хромосомный микроматричный анализ (ХМА) для анализа хромосомных аномалий.
Различные методы исследования кариотипа обеспечивают диагностическую эффективность около 35 % (Zhang S., 2017, Hillman S.C., 2013). Таким образом, при использовании этих методик более половины плодов со структурными аномалиями остаются без диагноза.
В двух недавних крупномасштабных исследованиях сообщалось о результатах экзомного секвенирования «трио», выполненных на плодах с пороками развития и нормальным кариотипом (Petrovski S., et al., 2019, Lord J., et al., 2019). Оба исследования показывают, что экзомное секвенирование увеличивает диагностический выход при исследовании плода с врожденными пороками развития примерно на 8-19% после кариотипирования и результатов ХМА, а частота обнаружения патогенных вариантов сильно коррелирует с количеством аномалий развития плода.
Экзомное секвенирование является фенотип-зависимым тестом, поэтому врач должен предоставить лаборатории адекватную информацию, необходимую для получения наиболее точной интерпретации результатов. Клиническая информация должна включать подробные отчеты о визуализации плода с помощью магнитно-резонансной томографии (МРТ) и/или ультразвукового исследования плода, предварительные результаты комбинированного скрининга, этническая принадлежность, репродуктивный анамнез и семейный анамнез, включая кровное родство родителей.
Анализ «трио» предпочтительнее анализа только для плода или плода и одного родителя. Анализ трио имеет более высокие диагностические коэффициенты (на 20%) (Retterer K., 2016).
Если аномалии развития плода в значительной степени наводят на мысль о конкретном диагнозе, в качестве теста первой линии более подходящим является тестирование одного гена или фенотипическая панель генов. Пренатальное экзомное секвенирование может проводиться только при наличии клинически значимых показаний к такому исследованию. А при отсутствии таких показаний, интерпретация полученных данных невозможна.
По данным ВОЗ, 4-6% новорожденных в мире ежегодно появляются на свет с тяжелыми врожденными пороками развития. Врожденные пороки развития, по оценкам, присутствуют в 13% всех случаев поступления в отделения интенсивной терапии новорожденных в развитых странах (Widmann R., et al., 2017) и остаются ведущей причиной неонатальной смертности. Анализ литературы, показывает, что экзомное секвенирование имеет высокий диагностический выход (36-48%) при диагностике младенцев с врожденными пороками развития в очень тяжелом состоянии при отсутствии молекулярно-цитогенетических нарушений (Trujillano, D., et al.,2017, Meng L., et al., 2017, QI Zhi-Ye., et al.,2019).
Атипичная и ранее не описанная форма генетических расстройств, наблюдаемая у детей раннего возраста, бросает вызов традиционной парадигме многоуровневого генетического тестирования в отделениях интенсивной терапии. Таргетные панели являются разумными в большинстве случаях, но неудача или длительность при выявлении каузативных вариантов у тяжелобольных детей является существенной проблемой, которая может быть преодолена с помощью секвенирования экзома.
Наличие минимального количества клинической информации, то есть только одного единичного симптома, снижает специфичность результатов. Поскольку сложно выявить полную клиническую картину в первые дни жизни ребенка, рекомендуется делать «трио» анализ и только в тех случаях, когда стандартные методы диагностики, такие как анализ кариотипа, генные панели и ХМА нецелесообразны.
Экзомное секвенирование может обнаружить некоторые генетические изменения, которые не связаны с текущими признаками и симптомами пациента (вторичные находки). Тем не менее, эти выводы могут иметь важные последствия для здоровья пациентов и членов их семей.
Эти расстройства включают:
С другой стороны, некоторые виды генетических нарушений не имеют эффективного лечения и могут привести к смерти или пожизненной инвалидности. Вторичные находки могут быть включены в отчет пациента.
Вторичные находки могут не включаться в отчет, если вы сообщите нам, что не хотите быть о них проинформированы.
При интерпретации случайно найденных вариантов в генах, связанных с заболеваниями с неполной пенетрантностью и поздней манифестацией, сложно оценить риск для пациента. Так же, важно учитывать огромное количество вариантов, выявленных при секвенированнии экзома пациентов, определяя их приоритетность для последующего наблюдения.
При экзомном секвенировании «трио» могут быть выявлены: неродство родителя и ребенка, а также факт близкородственного брака. Пациент должен быть так же об этом проинформирован.
Cеквенирование нового поколения. Термин означает определение нуклеотидной последовательности (исследование первичной структуры) ДНК или РНК. Размер одного прочитанного фрагмента варьирует от 25 до 500 пар оснований..
Вид генетического полиморфизма, к которому относят различия индивидуальных геномов по числу копий хромосомных сегментов размером от 1 тыс. до нескольких млн. пар оснований.
Потеря участка последовательности ДНК азотистых оснований и выпадение соответствующих нуклеотидов.
Набор ДНК-фрагментов, подвергающихся секвенированию. Эти ДНК-фрагменты фланкированы идентичными ДНК-адаптерами– специальными последовательностями, необходимыми для одновременного секвенирования множества различных фрагментов ДНК.
Изменение в последовательности ДНК, когда происходит вставка последовательности ДНК. Минимальный размер такой вставки составляет один нуклеотид
Впервые возникшее изменение в последовательности ДНК, возникшее в половых клетках (гонадах) или при оплодотворении, в отличие от унаследованного.
Определение всей последовательности ДНК, включая некодирующие участки. По этому параметру отличается от сиквенса экзома.
[2] Widmann R, Caduff R, Giudici L, et al. Value of postmortem studies in deceased neonatal and pediatric intensive care unit patients. Virchows Arch. 2017;470(2):217-223.
[3] Costain G, Cordeiro D, Matviychuk D, Mercimek-Andrews S., Clinical Application of Targeted Next-Generation Sequencing Panels and Whole Exome Sequencing in Childhood Epilepsy. Neuroscience. 2019 Oct 15;418:291-310
[4] E Chérot, B Keren, C Dubourg, W Carré, M Fradin, et al.. Using medical exome sequencing to identify the causes of neurodevelopmental disorders: Experience of 2 clinical units and 216 patients. Clinical Genetics, Wiley, 2018, 93 (3), pp.567-576.
[5] Forman EB, Gorman KM, Conroy J, et alCost of exome sequencing in epileptic encephalopathy: is it ‘worth it’?Archives of Disease in Childhood 2018
[7] Harris, E., Topf, A., Barresi, R. et al. Exome sequences versus sequential gene testing in the UK highly specialised Service for Limb Girdle Muscular Dystrophy. Orphanet J Rare Dis 12, 151 (2017).
[8] Helbig KL, Farwell Hagman KD, Shinde DN, et al. Diagnostic exome sequencing provides a molecular diagnosis for a significant proportion of patients with epilepsy. Genet Med 2016;18:898-905.
[9] Hillman SC, McMullan DJ, Hall G, et al. Use of prenatal chromosomal microarray: prospective cohort study and systematic review and meta-analysis. Ultrasound Obstet Gynecol. 2013;41:610–620.
[10] Lord J, McMullan DJ, Eberhardt RY, et al. Prenatal exome sequencing analysis in fetal structural anomalies detected by ultrasonography (PAGE): a cohort study. Lancet. 2019;393:747–757.
[11] Meng L, Pammi M, Saronwala A, et al. Use of Exome Sequencing for Infants in Intensive Care Units: Ascertainment of Severe Single-Gene Disorders and Effect on Medical Management. JAMA Pediatr. 2017
[12] Petrovski S, Aggarwal V, Giordano JL, et al. Whole-exome sequencing in the evaluation of fetal structural anomalies: a prospective cohort study. Lancet. 2019;393:758–767.
[13] Retterer K, Juusola J, Cho MT, et al. Clinical application of whole-exome sequencing across clinical indications. Genet Med. 2016;18:696–704.
[14] Snoeijen-Schouwenaars, F. M., van Ool, J. S., Verhoeven, J. S., van Mierlo, P., Braakman, H. M. H., Smeets, E. E., … Willemsen, M. H. (2018). Diagnostic exome sequencing in 100 consecutive patients with both epilepsy and intellectual disability. Epilepsia.
[15] Trujillano, D., Bertoli-Avella, A., Kumar Kandaswamy, K. et al. Clinical exome sequencing: results from 2819 samples reflecting 1000 families. Eur J Hum Genet 25, 176-182 (2017)
[16] Tumienė, B., Maver, A., Writzl, K., Hodžić, A., Čuturilo, G., Kuzmanić-Šamija, R., (2018). Diagnostic exome sequencing of syndromic epilepsy patients in clinical practice. Clinical Genetics, 93(5), 1057–1062.
[17] QI Zhi-Ye, DUAN Jiang,HE Xiang-Ying et al. Clinical application of whole exome sequencing in monogenic hereditary disorders in critically ill newborns[J]. CJCP, 2019, 21(7): 640-643.
[18] Zhang S, Lei C, Wu J, et al. A retrospective study of cytogenetic results from amniotic fluid in 5328 fetuses with abnormal obstetric sonographic findings. J Ultrasound Med. 2017;36:1809–1817.
Экзомное секвенирование что это такое
ООО «Генотек», Москва; Институт общей генетики им. Н.И. Вавилова РАН, Москва
ООО «Генотек», Москва
ООО «Генотек», Москва
Применение экзомного секвенирования для диагностики наследственных неврологических и психических заболеваний
Журнал: Журнал неврологии и психиатрии им. С.С. Корсакова. 2015;115(1): 45-52
Ильинский В. В., Корнеева В. А., Шаталов П. А. Применение экзомного секвенирования для диагностики наследственных неврологических и психических заболеваний. Журнал неврологии и психиатрии им. С.С. Корсакова. 2015;115(1):45-52.
Ilinsky V V, Korneeva V A, Shatalov P A. Application of whole exome sequencing in the diagnosis of hereditary neurological diseases. Zhurnal Nevrologii i Psikhiatrii imeni S.S. Korsakova. 2015;115(1):45-52.
https://doi.org/10.17116/jnevro20151151145-52
ООО «Генотек», Москва; Институт общей генетики им. Н.И. Вавилова РАН, Москва
В статье обзорного характера представлено развитие методов современной молекулярной генетики, которые могут быть применены в клинической практике. Это показано на примере полноэкзомного секвенирования — WES (Whole Exome Sequencing), которое представлено в следующих разделах: особенности метода полноэкзомного секвенирования, захвата экзома, применение в клинической практике, стратегия выявления патогенной мутации, диагностика психических расстройств аутистического спектра, диагностика болезни Шарко—Мари—Тута, применение в клинико-диагностических лабораториях.
ООО «Генотек», Москва; Институт общей генетики им. Н.И. Вавилова РАН, Москва
ООО «Генотек», Москва
ООО «Генотек», Москва
Научно-технические достижения ХХ века полностью изменили представления о возможностях современных исследований в области биологии и медицины. Революционные изменения, которые мы сейчас наблюдаем, были связаны, в частности, с открытием структуры ДНК в 1953 г. [1]. Появление новых технологий, таких как открытая в 1983 г. полимеразная цепная реакция (ПЦР) [2], поменяло подход к изучению ДНК, а следовательно, и анализу генов млекопитающих. В 1977 г. были опубликованы две основополагающие статьи о способах секвенирования ДНК [3, 4]. Метод, предложенный F. Sanger и соавт. [4], в дальнейшем был доработан и в настоящее время является «золотым стандартом» секвенирования в исследовательской практике и клинической диагностике. Первые высокопроизводительные секвенаторы, работавшие по указанному методу, были использованы в известном масштабном 13-летнем проекте «Геном человека» [5—7].
C появлением ряда коммерческих платформ для массового параллельного секвенирования (МПС) его стоимость стала снижаться. В 2005 г. первым появился на рынке секвенатор GS20 производства «454 Life Sciences» («Roche»), работавший по технологии пиросеквенирования [8]. Эта платформа открыла перед исследователями эру высокопроизводительного анализа геномной ДНК. Такие методы также называют «секвенированием нового поколения» — NGS (next-generation sequencing). В 2006 г. компанией «Solexa» был представлен секвенатор Genome Analyzer 1G, использовавший принцип секвенирования путем синтеза [9]. Затем компанией «Ion Torrent Systems» Inс. был разработан новый принцип секвенирования, основанный на обнаружении ионов водорода, выделяющихся при полимеризации ДНК, а уже в 2010 г. на рынке появилась первая платформа для полупроводникового секвенирования Ion Torrent [10], использовавшая этот принцип.
Поскольку большинство патогенных мутаций локализованы в экзонах и сайтах сплайсинга, снизить стоимость исследования может использование полноэкзомного секвенирования — WES (Whole Exome Sequencing).
В настоящем обзоре рассматривается применение WES в клинической практике, в частности для диагностики некоторых неврологических и психических заболеваний.
Полноэкзомное секвенирование
Экзом представляет собой совокупность всех экзонов (последовательности, соответствующие матричной РНК после удаления интронов в процессе сплайсинга) в геноме. Это как раз та часть генома, которую мы можем интерпретировать [13].
На современном уровне развития науки и техники для решения клинико-диагностичестических задач полноэкзомное секвенирование имеет ряд преимуществ перед полногеномным. Во-первых, анализируя белоккодирующие последовательности, исследователи работают с наиболее изученной частью генома. Во-вторых, развитие заболеваний в большинстве случаев связано с нарушениями в функционировании или синтезе тех или иных белков (нонсенс- и миссенс-мутации, нарушение сплайсинга). WES позволяет сфокусироваться на исследовании именно белоккодирующих участков генома пациента, оценивать влияние аллельных вариантов на его фенотип. В-третьих, экономический фактор продолжает играть немаловажную роль при внедрении геномных технологий в клиническую практику. В отличие от полногеномного секвенирования, при котором 3 млрд п.н. человеческого генома должны быть прочитаны, экзомное подразумевает захват и целевое прочтение только кодирующих участков, что соответствует 1—3% человеческого генома. Стоимость секвенирования экзома в среднем в 6 раз ниже проведения полногеномного секвенирования [14]. Кроме того, она может быть дополнительно оптимизирована при соответствующем дизайне исследования (например, при проведении параллельного исследования экзомов 3 пациентов [15]). Наконец, в результате секвенирования экзома генерируется на порядок меньше данных, что позволяет проводить их обработку быстрее с привлечением меньших вычислительных мощностей [14].
Захват экзома
Таргетное секвенирование проводили и до появления технологии NGS, амплифицируя целевые участки генома при помощи ПЦР, а затем секвенируя по Sanger каждый продукт по отдельности. Это позволяло сузить область исследования, что необходимо, когда есть априорное предположение о том, в каком регионе генома может быть локализован исследуемый полиморфизм. Разработанные в последнее время методы таргетного обогащения позволяют охватывать большие регионы человеческого генома, снижая при этом материальные и временны́е затраты [16—19]. Эти методы называют геномным обогащением, а их применение позволяет подготовить пул исследуемых молекул, которые затем будут пространственно отделены друг от друга во время процедуры секвенирования. Например, коммерческий набор для захвата экзома Agilent Sure select kit (Agilent) выделяет консенсусные кодирующие последовательности генома человека, покрывая около 50 Мб (набор разработан на основании аннотации генома человека по версии проекта GENCODE [20]). В пул захватываемых последовательностей входят наиболее консервативные гены. Для выделения кодирующих областей генома подходят методы обогащения на основе гибридизации как на чипе [21—23], так и в суспензии [24].
Захват экзома позволяет проанализировать полный набор генов, снизив при этом материальные и временны́е затраты на проведение исследования по сравнению с полногеномным секвенированием.
Применение экзомного секвенирования в клинической практике
Все более очевидно, что большинство заболеваний имеют наследственный характер. Геном пациента также может влиять на течение ненаследственных заболеваний. До появления первых коммерческих NGS платформ в 2005 г. ответить на вопрос, какая именно мутация послужила толчком в развитии заболевания конкретного пациента, зачастую было невозможно даже в случае болезней с моногенным типом наследования. Также было неясно, почему у некоторых носителей патогенных мутаций они не проявляются фенотипически. Технологии нового поколения, в частности полноэкзомное секвенирование, дают возможность ответить на эти вопросы.
В данном обзоре подробно рассматривается применение WES в диагностике некоторых наследственных заболеваний, однако у экзомного секвенирования есть и другие клинические применения. Во-первых, WES позволяет выявлять генетическую природу моногенных наследственных болезней (см. таблицу). По оценкам, гены, вызывающие около 7000 моногенных заболеваний, будут идентифицированы в течение ближайших 3 лет [25]. Во-вторых, выявление генов-модификаторов у членов семей, имеющих моногенные заболевания, позволит понять, почему при исследовании больших семей не все носители патогенной мутации имеют одинаковый фенотип (соответствующее заболевание). Поиск и понимание механизма работы таких генов-модификаторов позволит в дальнейшем лучше понять природу развития комплексных заболеваний. Наконец, WES может быть использовано для исследования наследственной природы таких сложных заболеваний, как шизофрения [26] и умственная отсталость [27].
Гены, вызывающие развитие наследственных заболеваний, идентифицированные при помощи полноэкзомного секвенирования
Очевидно, что полноэкзомное секвенирование должно стать основным инструментом в диагностике заболеваний, имеющих сложную наследственную природу, когда мутация в одном из ряда генов может вызывать характерный для заболеваний фенотип. Последовательное тестирование всех генов-кандидатов при помощи ПЦР с последующим секвенированием по Sanger делает постановку диагноза длительным и дорогим процессом, в то время как пациент может не получать адекватного лечения. Последнее особенно важно в случае онкологических заболеваний.
Разнообразие фенотипических проявлений каждой мутации у конкретного пациента в свою очередь осложняет точную оценку клинических проявлений, что потенциально приводит к ошибочному или неоднозначному диагнозу. Например, более 30 аутосомно-рецессивных заболеваний вызываются врожденными нарушениями гликозилирования, что делает постановку точного диагноза пациентам с дефицитом гликозилирования затруднительной [28].
Стратегии выявления патогенной мутации
Рассмотрим подробнее стратегии выявления патогенной мутации при помощи WES. На первом этапе после получения данных экзомного секвенирования необходимо уменьшить количество анализируемых вариантов на несколько порядков. В среднем, каждый экзом содержит 20 000—50 000 полиморфизмов. В качестве первого фильтра выступает критерий качества данных (количество независимых ридов и доля ридов с данным вариантом: не менее 20% для гетеро- и 80% — гомозигот), таким образом, удаляются ложноположительные колы. Затем отфильтровывают полиморфизмы, локализованные вне целевого региона и синонимичные замены, не влияющие на кодируемый белок. На этом этапе остается примерно 5000 полиморфизмов. После этого варианты, не имеющие патологического влияния, также удаляют из рассмотрения, сравнивая результаты секвенирования с базой данных. Этот шаг позволяет снизить число полиморфизмов-кандидатов еще на порядок [23, 27, 29—32]. Однако патологические варианты также могут быть отсеяны в случае, если представлены в здоровой популяции в гетерозиготном состоянии с низкими частотами. Стратегия дальнейшего поиска мутации (й), вызывающих заболевания, будет зависеть от семейной истории пациента и предполагаемой природы заболевания.
В случае семейного моногенного заболевания секвенируют экзомы всех больных членов семьи, а также нескольких здоровых для того, чтобы исключить непатогенные полиморфизмы, которые могут наследоваться в семье. Затем можно провести сравнение между наиболее родственно отдаленными членами семьи, страдающими от исследуемого заболевания. В зависимости от степени родства такое сравнение поможет исключить 50% и более частных непатогенных полиморфизмов. Так, сравнение двух сибсов позволило снизить количество рецессивных генов-кандидатов до девяти [29]. P. Krawitz и соавт. [33], исследуя наследственные причины гиперфосфатазной умственной отсталости, дополнительно фазировали все полиморфизмы, оказавшиеся общими для 2 сибсов, что позволило отфильтровать имевшие одинаковое происхождение (родитель) и снизить количество генов-кандидатов с 14 до 2.
Если заболевание предположительно имеет аутосомно-рецессивный характер, то достаточно секвенировать экзом самого пациента. В данном случае гены-кандидаты будут находиться в наиболее протяженном гомозиготном регионе. Этот подход позволяет избежать необходимости получать геномные данные большого количества членов семьи и был успешно применен J. Becker и соавт. [31] для выявления мутации, вызывающей несовершенный остеогенез. Данный подход может оказаться эффективным, если семейная история недоступна, но предполагается аутосомно-рецессивный характер заболевания. В этом случае гены-кандидаты также будут в гомозиготном или частично гомозиготном состоянии. C. Gilissen и соавт. [32] и S. Pierce и соавт. [34] успешно применили такую стратегию для выявления мутаций, вызывающих синдром Сенсенбреннера и Перраулта соответственно.
Исходя из предположения о моногенности заболевания, в случае доминантного типа наследования можно секвенировать и сравнить экзомы неродственных пациентов. Данный подход был успешно применен для выявления мутаций, вызывающих тригоноцефалиеподобный синдром Опитца [32] и синдром Кабуки [30].
Если заболевание имеет в большой степени гетерогенную природу, как в случае с умственной отсталостью, аутизмом или бесплодием, то анализ данных неродственных пациентов не дает результата. В случае таких болезней наиболее вероятно, что мутация возникла в ходе мейоза в одном из ряда генов, ответственных за развитие данного заболевания. Для выявления мутации в подобном случае секвенируют экзом семейного трио (пациент и его родители). Поскольку у индивидуума в среднем de novo появляется не более 3 мутаций [35], гены-кандидаты находят путем сравнения полученных данных. Рассмотрим подробнее применение полноэкзомного секвенирования на примерах из клинической практики.
WES в диагностике расстройств аутистического спектра
WES при постановке точного генетического диагноза у пациентов, страдающих болезнью Шарко—Мари—Тута
Под болезнью Шарко—Мари—Тута (ШМТ) понимают ряд наследственных невропатий. ШМТ имеет преимущественно аутосомно-доминантный тип наследования, но встречается также аутосомно-рецессивного и Х-сцепленного. На данный момент известно 35 различных генов, мутации в которых приводят к проявлению сходных фенотипов у пациентов, что затрудняет постановку точного генетического диагноза [41, 42]. Вероятно, в будущем будет выявлено больше генов, ассоциированных с ШМТ [43].
G. Montenegro и соавт. [44] показали эффективность использования WES для постановки точного генетического диагноза пациентам с ШМТ. Они исследовали случай наследования ШМТ в семье. Тест на наличие распространенной мутации в гене MFN2 не выявил аномалий у членов данной семьи, заболевание передавалось от отца к сыну, что предполагало Х-сцепленное наследование. 6 членов семьи страдали ШМТ, 5 — были здоровы, а статус 2 — не определен. Для выявления мутации были секвенированы экзомы 2 членов семьи, страдающих ШМТ. ДНК выделяли из образцов крови с последующим экзомным обогащением при помощи набора SureSelect human all exon kit («Agilent»). Секвенирование проводили на приборе Genome Analyzer II («Illumina»). Сборку экзомов и коллинг полиморфизмов проводили при помощи программного обеспечения MAQ. Полиморфизмы категоризировали на кодирующие, некодирующие и de novo однонуклеотидные замены (single-nucleotide polymorphisms, SNPs) при помощи сервера SeattleSeq. Полученные данные были ранжированы методом профайлинга скорости геномной эволюции — GERP (Genomic Evolutionary Rate Profiling). Все ранее известные гены, связанные с развитием ШМТ, были детально проверены на наличие полиморфизмов и оптимальное покрытие. В результате было выявлено 64 568 и 61 153 SNPs у 2 пациентов соответственно, из которых 24 150 и 23 607 находились в кодирующих областях. После исключения из анализа полиморфизмов, заведомо не связанных с развитием ШМТ, и вариантов, представленных только в экзоме 1 пациента, была обнаружена c.283G>A мутация в гене GJB1 (Cx32), вызывающая ШМТ в исследуемой семье. Наличие данной мутации у других больных членов семьи было подтверждено секвенированием по Sanger. Авторы данного исследования подчеркивают, что, исходя из семейной истории пациентов (предположительное Х-сцепленное наследование), выявление этой мутации было бы затруднительно, в то время как использование полноэкзомного секвенирования позволяет поставить точный диагноз в тех случаях, когда первоначальная гипотеза не подтверждается простым генетическим тестированием.
Таким образом, использование экзомного секвенирования в клинической практике может упростить и ускорить постановку точного диагноза. Более того, получение данных о генетической природе заболевания позволит персонифицировать подход к лечению и подобрать для каждого пациента наиболее эффективную терапевтическую схему, а также проводить консультирование пациентов по вопросам планирования семьи. Однако широкое внедрение экзомного секвенирования в клинической практике в настоящий момент ограничивается высокой стоимостью оборудования, а также требует квалифицированного персонала для проведения лабораторной части исследования и последующей биоинформатической интерпретации полученных данных.
1 Коллекция Саймонс Симплекс (The Simons Simplex Collection — SSC) — это проект Фонда Саймона по изучению аутизма (Simons Foundation Autism Research Initiative). Коллекция представляет собой базу генетических образцов членов семей, в которых здоровые родители имеют одного ребенка, страдающего аутизмом, а также здорового ребенка (детей).