что значит расшифровать геном
Сколько стоит расшифровать геном человека и зачем это нужно
Об эксперте: Михаил Застрожин, кандидат медицинских наук, руководитель лаборатории генетики и геномики МНПЦ наркологии ДЗМ, доцент кафедры наркологии РМАНПО, CEO проекта PGX2 (биомедкластер «Сколково»).
По данным американского Управления по санитарному надзору (FDA), только в США ежегодно регистрируются около 2 млн серьезных нежелательных побочных реакций на лекарства. 100—240 тыс. из них — со смертельным исходом. На возникновение этих реакций влияют не только особенности конкретного лекарства или клинико-анамнестические характеристики пациента (тяжесть течения основного заболевания, наличие сопутствующих заболеваний, возраст, пол, вредные привычки), но и его генетические особенности, с которыми обычные лечащие врачи не знакомы. Для этого пациента направляют на фармакогенетическое исследование.
Его результаты помогает анализировать и интерпретировать биоинформационный облачный сервис PGX2.
Что это за сервис и для чего он нужен
Просто: сервис помогает оценить скорость метаболизма конкретного пациента. На основе этих данных врач может подбирать подходящую дозировку или тип препарата, чтобы избежать негативных побочных эффектов.
Сложнее: то, как именно преобразуются лекарства и с какой скоростью они выводятся из организма человека (другими словами, метаболизируются), во многом зависит от его генов. У одних людей высокая скорость метаболизма лекарств, а у других — низкая. За эту скорость отвечают белки, кодируемые определенными генами.
У людей с высокой скоростью метаболизма лекарство в нормальных дозах не будет работать. С помощью сервиса врач может назначить таким пациентам другой препарат или повышенную дозу лекарства.
У людей с низкой скоростью лекарство будет накапливается, и у пациента могут быть нежелательные реакции, о которых пишут в инструкциях к препаратам: головная боль, тошнота, седация и прочее.
Мы вычисляем пациентов, генетически предрасположенных к нежелательным реакциям по каждому конкретному лекарству, даем им рекомендации в соответствии с западными гайдлайнами (клиническими рекомендациями), таким образом повышая эффективность и безопасность терапии.
Просто: когда врач общается с пациентом, часто выясняется, что лекарства, которые он пил раньше, не помогали, или их прием сопровождался головной болью, расстройствами ЖКТ и другими нежелательными побочными реакциями. Врач назначает новый препарат. Может случиться, что он поможет. Но проходит время, пациент мучается, могут развиться какие-то осложнения. Это потеря времени и качества жизни пациента.
Сложнее: персонализированная медицина позволяет сократить время поиска правильного лекарства в правильной дозе. Но для этого врач, заподозривший, что перед ним пациент с высоким риском низкой эффективности терапии, либо с высоким риском развития нежелательных реакций, должен отправить его на фармакогенетическое тестирование. Это исследование, по результатам которого можно оценить влияние особенностей конкретных генов на метаболизм, на эффективность и безопасность лекарств. Полученные данные загружают в специальный калькулятор. Это своего рода система поддержки принятия решения для конкретных лекарств. В этом калькуляторе используются все клинико-демографические данные — возраст, пол и т.д. — и генетические данные. Исходя из этого программа рекомендует лекарство и дозу.
Например: есть лекарства с узким терапевтическим интервалом: скажем, антикоагулянты и антиагреганты (они препятствуют образованию тромбов). Это значит, что оптимальной концентрации этих препаратов в крови, когда они могут помочь и не навредить, добиться сложно. Выход выше за это «окошко» чреват нежелательными реакциями вплоть до тяжелых кровотечений, а ниже — формированием тромбов и осложнений, связанных с ними.
Скажем, человеку провели кардиохирургическую операцию: поставили механический протез клапана сердца. Таким пациентам до конца жизни надо пить разжижающие кровь препараты, чтобы на новом клапане не образовался тромб. И всем им обязательно надо проводить фармакогенетическое тестирование перед назначением лекарства, иначе возможны осложнения и опасные кровотечения.
На Западе на сегодняшний день антикоагулянты и антиагреганты часто назначают на основе фармакогенетического тестирования.
В России фармакогенетическое тестирование применяется реже. Если в клинике нет своей генетической лаборатории, то врач может направить человека в какую-нибудь сетевую лабораторию и попросить его пройти тестированиет там.
Но проблема в том, что там биоинформатический сервис создает условный биоинформатик, который читает статьи, собранные по разным областям медицины, а не клиницист. Для какого-нибудь лекарства будет сказано, что с 60—70% вероятностью разовьются нежелательные реакции. Почему? На чем основано? Непонятно. У вас будет отчет по определенному количеству лекарств, с которым вы можете прийти к врачу, и он спросит: «Что это? Что я с этим должен делать?»
Во всем мире сейчас применяют модель доказательной медицины. Проводятся исследования, разрабатываются гайды. Практикующие врачи используют рекомендации из них для лечения пациентов. Это не какие-то субъективные риски, которые произведены биоинформатическим сервисом, а конкретные рекомендации. Для каждого лекарства в гайдах прописано, каким образом корректировать дозу медленным метаболизаторам, какие — быстрым. По идее врач мог бы все это читать и держать это в голове. Но на самом деле это очень сложно, да и невозможно, как показывает практика.
Сервис PGX2 основан на доказательных алгоритмах. Его делает большая команда из научных работников, которые живут этими гайдами. Кто-то специализируется на кардиологии, кто-то — на психиатрии, аллергологии и так далее. Во всех областях есть специалист, который постоянно работает с этими темами и следит за актуальностью информации в сервисе.
Как работает сервис:
1. Пациент сам приходит в лабораторию по настоянию врача, или приносят его биоматериалы (волосы, слюну). Специалисты расшифровывают генетический код и вносят информацию об особенностях тех генов, которые кодируют белки, в сервис.
2. В основе сервиса лежит алгоритм. Он учитывает всю генетическую информацию о пациенте, занесенную специалистом — это перечень наиболее часто встречающихся генов, которые могут оказывать влияние на индивидуальный лекарственный ответ. Затем сервис «подтягивает» информацию из гайдов, анализирует все это и выдает итоговый отчет.
3. Этот отчет уже может прочитать врач: алгоритм сам расписывает лекарства по группам, рассказывает, какой препарат и в какой дозе надо назначать, а какой — нет, и почему.
Мы подходим индивидуально к каждому лекарству, основываясь на доказательности, апдейтах международных гайдов, и вся эта информация перерабатывается алгоритмами сервиса. В будущем также мы планируем оценивать межлекарственные взаимодействия. И мы хотим предоставлять доступ к нашему сервису сетевым лабораториям и лабораториям при крупных клиниках.
Проблема в том, что сейчас нейросети еще не в состоянии вникнуть во все нюансы. Поэтому даже если взять самую крутую нейросетку, она, к сожалению, не сможет так проанализировать данные, как это сделает человек.
Сейчас доверять это нейросети опасно: если бы группа людей вбивала эти гайды (как сегодня делаем мы), и на основании них мне бы назначили терапию, я бы согласился. Если бы мне сказали, что это сделала нейросеть, я бы сам захотел перепроверить, что она написала.
На практике: врачи очень плохо понимают генетическое тестирование.
Даже если у врача на руках будут «сырые» данные тестирования, он ничего не сможет с этим сделать. Поэтому нужно более активно просвещать врачей о преимуществах персонализированной медицины и фармакогенетики как основного инструмента персонализации. Для этого, например, на базе Российской медицинской академии непрерывного профессионального образования Минздрава России и Московского научно-практического центра наркологии Департамента здравоохранения Москвы проводятся специализированные образовательные циклы повышения квалификации.
На практике: сейчас в лабораториях дорогие и неполные данные.
Если врач в курсе важности фармакогенетического тестирования, он может направить пациента в лабораторию. Но сейчас человек получит информацию только про одно лекарство за большие деньги — от 2 до 10 тыс. руб. Пока что частные лаборатории предоставляют только такие услуги. Доступ к нашему сервису позволит лабораториям формировать рекомендации по дозированию не для одного лекарства, а для целого спектра лекарств, не меняя стоимость услуги.
На практике: некоторые врачи уже знают о фармакогенетическом тестировании и его преимуществах перед эмпирическим подбором терапии.
Это от многих факторов зависит: есть ли, например, клинический фармаколог в больнице, частный или государственный это медицинский центр. Клинические фармакологии знают, что гены могут оказывать влияние на эффективность и безопасность лекарств, и они хотят получать нормальные рекомендации. Мы проводим определенную работу в этом направлении: например, читаем лекции в РМАНПО Минздрава России и других учреждениях.
На практике: на законодательном уровне это никак не регулируется.
Перспектива: для создания генетических паспортов надо полностью расшифровать геномы всех граждан — на каждого человека это 3 млрд нуклеотидов.
Вся эта информация записывается в специальный файл, и с ним в дальнейшем можно что-то делать. Кто будет расшифровывать и за какие средства, я не знаю. В российских лабораториях полногеномное секвенирование стоит около 90 тыс. руб. Таким образом, с помощью результатов секвенирования и достижений фармакогенетики, можно будет подобрать максимально эффективную и безопасную терапию для каждого пациента.
Перспектива: развитие телемедицины.
С телемедициной сейчас такая же штука происходит, что и с фармакогенетическим тестированием, — до конца законодательством это не отрегулировано. И хотя закон о телемедицине был принят в 2018 году, в России нет инфраструктуры для того, чтобы с этим работать — есть только несколько сервисов.
Например, DocDoc, который вошел в экосистему Сбербанка пару лет назад: созваниваешься с врачом, он тебя консультирует и дает официальное заключение с рецептом. С ним можно прийти в поликлинику и получить лекарство.
Но есть много технических проблем: например, отсутствие доступа к широкополосному интернету. В таких условиях сложно говорить о развитии телемедицины: тот же проект Единой государственной информационной системы здравоохранения — это просто запись к врачу по удаленке.
Подписывайтесь и читайте нас в Яндекс.Дзене — технологии, инновации, эко-номика, образование и шеринг в одном канале.
Как ученые расшифровывают геномы и зачем это нужно? Отвечаем в 9 карточках
В последние годы ученые постоянно объявляют о расшифровке геномов тех или иных видов. ITMO.NEWS и ученый Международного научного центра SCAMT Алексей Комиссаров в карточках объясняют: что такое ДНК, как с ее помощью изучают историю животных и в чем отличие ДНК-теста от геномного исследования.
Иллюстрации: Дмитрий Лисовский, ITMO.NEWS
По пунктам:
Начнем с простого: что такое ДНК?
Каждый более или менее знает, что есть белки, жиры и углеводы. Но еще у нас в каждой клетке есть ДНК, дезоксирибонуклеиновые кислоты, которые отвечают за хранение информации. Для геномного биоинформатика ДНК ― это прежде всего один из главных языков биологии, который состоит всего лишь из четырех букв: A, T, G и C. Эти буквы являются сокращениями имен четырех азотистых оснований, из которых состоит ДНК: аденин (А), цитозин (C), гуанин (G) и тимин (Т). ДНК можно сравнить с компьютерной программой, очень сложной, запутанной, со множеством ошибок и костылей, но, тем не менее, она работает.
Говорят, ДНК можно получить из волоса, слюны, крови. А каким образом?
ДНК содержится почти во всех клетках организма, исключение — эритроциты, которые в зрелом состоянии теряют ядро, чтобы было легче переносить кислород. Поэтому биологический материал для выделения ДНК может быть разнообразен. Процесс выделения ДНК состоит из четырех этапов: разрушение мембраны клеток для высвобождения ДНК; очистка от связанных с ДНК белков; очистка от разного рода примесей; растворение ДНК для хранения. ДНК можно выделить и в домашних условиях, но тогда ДНК будет не очень чистой и ее будет сложно использовать для каких-либо научных исследований. От качества этих процедур будет зависеть и полученная из нее информация. Поэтому необходима лабораторная точность работы специалистов, молекулярных биологов. Проще всего ДНК выделять из крови, потому что это легкий для получения биоматериал. Хотя в эритроцитах ДНК нет, в крови плавает огромное количество других клеток — белых кровяных телец, так что и ДНК из них получается много. Из слюны или кусочков эпителия во рту ― уже меньше, из волос ― еще меньше. Например, чтобы прочитать весь геном достаточно точно, необходима кровь, а не слюна. А для того, чтобы сделать какой-нибудь ДНК-тест, где точность не очень важна ― достаточно и слюны.
А есть еще геном. Это одно и то же?
ДНК — это название молекулы, которая хранит наследственную информацию. Геном ― это совокупность всей ДНК организма со всеми записанными в ней особенностями конкретного вида или даже индивида. Поэтому можно говорить о геноме человека вообще, а можно — о геноме конкретных Васи или Кати. На физическом уровне геном разделен на хромосомы, в случае человека — 23 пары хромосом, 23 от мамы, и 23 от папы, всего 46. Когда организм начинает расти после оплодотворения, в каждой клетке копируется этот набор, но иногда это происходит с небольшими ошибками. Это называется соматическими мутациями. Иногда эти ошибки могут быть весьма критическими и приводить к разным заболеваниям.
Я все время слышу: расшифровали геном того, расшифровали геном сего. А кто его зашифровывает?
Его никто не зашифровывал, но это слово хорошо передает ощущения от работы с геномными данными. Если продолжать аналогию с геномом как с очень сложной программой, можно сказать, что она не только очень сложная, но и очень плохо написана. И кроме собственно четырех букв A, C, G и Т, он содержит много дополнительных уровней кодирования информации, которые не обязательно будут наследоваться и могут меняться в процессе жизни организма. Это часто называют эпигеномом, который изучает эпигенетика. Вся эта неимоверная сложность и создает ощущение расшифровки. Помимо этого, злую шутку здесь сыграл не очень корректный перевод с английского, где использовали слово decoding и encoding, декодировали и закодировали. Код — это просто система условных обозначений, не предполагающая никакого секрета, никакой защиты от взлома. Любой человеческий язык — это код, система дорожных знаков — это код. Шифр — это код, намеренно защищенный от взлома. Но, конечно, в английских терминах меньше романтики, чем в слове расшифровали.
Говорят, по геному можно проследить генетическую историю. Это что-то типа ДНК-теста?
Под ДНК-тестом часто имеют в виду анализ только некоторых небольших участков генома, вариации в которых имеют какой-то известный эффект. В геномных исследованиях ученые работают с гораздо большим количеством ДНК, в идеале со всей доступной информацией. Это называется полногеномными исследованиями. Но даже генетических тестов, направленных на выяснения значения только некоторых фрагментов генома, часто достаточно для того, чтобы проследить генетическую историю или оценить степень родства между двумя людьми. Это возможно, во-первых, благодаря тому, что у нас в геноме есть фрагменты, которые очень вариабельны и отличаются у разных людей, и, во-вторых, благодаря математике.
А как ученые берут кровь или шерсть у современного льва, а получают данные о его предках?
Есть очень сложные математические алгоритмы, которые позволяют по генетическим данным найти наиболее вероятный сценария развития событий: когда происходили мутации отдельных фрагментов, которые привели к образованию того генома, который мы видим сейчас. Своего рода, математическая машина времени. Ученые ИТМО недавно опубликовали программу, направленную как раз на решение проблемы — как наиболее точно заглянуть в прошлое генома. Одним из самых захватывающих расширений этого подхода является добавление еще и географических точек. Тогда мы можем не только смоделировать, как происходили изменения в геноме, ни и посмотреть, как отдельные популяции с этими геномными вариациями перемещались из одной точки в другую.
Мы говорим, что взяли кость тигра раннего палеолита и по ней определили какие-то вещи про целую популяцию. Но как мы отделяем эту информацию от той, что была присуща именно вот этому самому тигру?
Мы стараемся получить модель, которая наиболее правдоподобно описывает сценарий развития событий в прошлом. Чтобы сделать модель более точной, одного образца часто недостаточно, и чем больше образцов у нас есть, тем более точной становится наша модель. У каждого из нас очень много редких генетических вариантов, бывают и варианты, которые присущи только нам. И если у нас есть уже несколько образов, то такие индивидуальные варианты ученые отфильтровывают именно затем, чтобы они не мешали анализу. Так как единицей эволюции является популяция, а не отдельный индивид.
А как мы проверяем наши выводы? Ведь не всегда мы можем выкопать пещерного предка современных животных и удостовериться, что все сходится.
Хорошие модели обладают предсказательной способностью. Проверить проще всего новыми данными, которые не должны противоречить модели, но случается, что они противоречат, и тогда модель приходится пересчитывать. Сейчас мы наблюдаем очень красивую иллюстрацию мутаций, эволюции и вот этого всего на примере геномов коронавируса SARS-CoV-2. Настолько подробных данных об эволюции отдельного вида в реальном времени у человечества еще никогда не было. И появляется все больше данных и для остальных геномов. Со временем модели будут все лучше и лучше, а чем больше данных ― тем лучше модели.
Зачем нам все это?
Кроме того, что это захватывающе любопытно, это имеет множество практических применений во всех сферах деятельности человека. Если продолжать рассуждать об исследовании истории предков, то есть математический аппарат для поиска так называемых событий бутылочного горлышка, когда размер популяции по каким-то причинам резко сократился. Поиск таких событий, своего рода, геномная археология, может дать нам подсказки, как таких событий избежать. Это важно особенно сейчас, когда многие виды животных бесследно исчезают с лица земли.
Что такое Полный геном и зачем он нужен
Атлас запустил новый продукт — Полный геном. Теперь мы можем исследовать не только отдельные точки в геноме, как в генетическом тесте, но и прочитать всю последовательность нуклеотидов генома. В этой статье рассказываем, что это и зачем это нужно.
Внимание! Мы подарим Полный геном одному из наших читателей, кто выполнит все задания. Подробнее — в конце статьи.
Что значит Полный геном?
Чтобы разобраться с полным геномом или полногеномным секвенированием (whole genome sequencing, WGS), мы сначала расскажем коротко о технологии обычного генетического теста.
Микрочип и обычный генетический тест
Генетический тест «Атлас», как и многие подобные тесты, делают с помощью ДНК-микрочипа (DNA-microarray, Beadchip). Поверхность ДНК-микрочипа содержит множество небольших углублений (порядка 700 тысяч), в каждом из которых находится по кремниевому шарику диаметром около 3 микрометров. На поверхности этого шарика находятся сотни тысяч сшитых с ним идентичных коротких последовательностей одноцепочечной ДНК, соответствующих участку генома человека, расположенному рядом с исследуемой вариацией (снип, SNV). Каждый шарик соответствует только одной генетической вариации, а координаты лунки на чипе для каждого шарика известны (Рисунок 2D).
Образовательный блок 1
Снип или SNV (Single Nucleotide Varition) — генетическая вариация, то есть изменение последовательности ДНК только в одном нуклеотиде. Например, на участке гена Х в определенной позиции может существовать один из трех нуклеотидов (аллелей) A, G или T, а в остальной части последовательности у разных людей нуклеотиды идентичны (Рисунок 1). От этой одной буквы может зависеть определенная особенность человека.
Рисунок 1 Автор иллюстраций Rentonorama
Например, полиморфизм rs4481887, который находится на первой хромосоме рядом с геном обонятельного рецептора OR2M7, имеет три аллеля: A, G и T. Наличие аллеля А на одной или на обеих хромосомах (генотипы A/G, A/T и A/A) определяет чувствительность к запаху мочи после употребления спаржи. При отсутствии аллеля А человек даже не будет догадываться о том, что после поедания спаржи с мочой выделяется вещество с характерным запахом.
Индел или INDEL (Insertion/Deletion) — другой тип генетических вариаций, в который относят удаление или вставку одного или нескольких нуклеотидов. Снипы и инделы вместе, наряду с возможными структурными изменениями: большими делециями, инсерциями, транслокациями, инверсиями, являются фактической разницей в геноме разных людей.
При сдаче генетического теста «Атлас» из слюны выделяют геномную и митохондриальную ДНК, увеличивают количество ее копий (амплифицируют) и фрагментируют — нарезают на небольшие отрезки (Рисунок 2А). Многочисленные одноцепочечные фрагменты человеческой ДНК соединяются с соответствующими им последовательностями на кремниевых шариках (Рисунок 2В), после чего происходит удлинение этих последовательностей на 1 искусственный флюоресцирующий нуклеотид (Рисунок 2С). Разные нуклеотиды светятся разными цветами: красным и зеленым. По соотношению интенсивностей свечения каждого цвета (Рисунок 2E) можно определить генотип, который соответствует шарику.
Рисунок 2
После сканирования всего чипа мы получаем около 700 тысяч генотипов вариаций и пропускаем их через нашу систему интерпретации. Часто пользователи пытаются сравнить результаты разных тестов, но замечают сильную разницу. Это происходит по нескольким причинам. Во-первых, разные компании используют разные версии чипов и наборы SNV. Как следствие, на одних чипах существуют уникальные наборы вариаций, которые нельзя найти на других чипах. Во-вторых, всегда существует ошибка генотипирования, которая может возникнуть по разным причинам, хотя она вносит наименьший вклад в различие результатов. Данные исследований показывают, что точность генотипирования на ДНК-микрочипах, которые использует Атлас, выше 99,5%. Но основная причина отличий результатов генетических тестов в интерпретации: разные компании делают ее по-разному даже для одинаковых исходных данных генотипирования.
Что такое полногеномное секвенирование?
Главное отличие полногеномного секвенирования от генотипирования на микрочипах — технология и обработка получаемых данных. При полногеномном секвенировании определяется почти вся последовательность ДНК. Почти — потому, что в геноме существуют участки, которые в силу различных причин невозможно прочитать. Часто это участки теломер и центромер — концов и центра хромосом. Для определения последовательностей подобных регионов генома используют малодоступные узкоспециализированные технологии. Такие исследования носят в основном исследовательский характер.
Определение последовательности ДНК позволяет узнать генотипы вариаций в любом месте генома, включая исследуемые вариации на ДНК микрочипе в генетическом тесте «Атлас». Для быстрого и эффективного определения последовательности генома используется технология NGS (next generation sequencing, секвенирование следующего поколения). Существует несколько принципиально отличающихся методов, созданных разными компаниями.
Суть метода Атласа заключается в следующем: выделенную и очищенную ДНК многократно амплифицируют и фрагментируют до определенной длины. К каждому фрагменту пришиваются специальные последовательности, которые позволяют управлять данным фрагментом. Прочитываются, именно эти обработанные фрагменты (Рисунок 3).
Рисунок 3. Процесс пошагового секвенирования: каждый следующий нуклеотид флуоресцирует в уникальном для него цветовом канале.
На каждом шаге происходит удлинение на один нуклеотид, с которым связан флуоресцентный зонд. Каждый из четырех нуклеотидов связан с зондом определенного цвета. Таким образом, шаг за шагом по цвету свечения можно определить порядок нуклеотидов в исследуемом фрагменте. Полученные последовательности каждого фрагмента называются прочтениями или ридами (reads), и их получается около 1 миллиарда на каждый образец исследуемой ДНК. Риды и показатели качества их прочтения хранятся в текстовом формате FASTQ.
Далее риды выравниваются (картируются) на референсный геном. С использованием специального программного обеспечения, например Burrows-Wheeler aligner, для каждого рида происходит поиск места на референсном геноме, которому он соответствует. Прочтение вместе с информацией о положении в геноме записывается в файл формата SAM или BAM. Визуализация картированных на геном ридов в SAM (BAM) файле с помощью геномного браузера IGV показана на Рисунке 4.
Рисунок 4. Визуализация BAM файла в программе IGV (участок хромосомы одного человека). Картированные риды обозначены горизонтальными блоками, позиция указана в треке сверху.
На рисунке также видно, что такое глубина прочтения (depth of coverage) — когда, любую позицию в референсном геноме покрывает несколько выровненных ридов. Значение усредняется по всему геному и используется как показатель качества исследования. Атлас гарантирует среднее покрытие генома глубиной выше 30, что обеспечивает высокое качество генотипирования. Увеличение глубины прочтения значительно увеличивает стоимость секвенирования, точность определения генетических вариаций и используется в узких онкологических исследованиях, например, в Атлас Онкодиагностике.
Образовательный блок 2
Референсный геном — это искусственно собранная последовательность ДНК биологического вида. Большинство последовательностей, из которых собран референсный геном человека, были взяты у одного человека Африкано-Европейского происхождения. Референсный геном регулярно обновляется: последняя версия, GRCh38, была выпущена в 2013 году и содержит в себе 3,3 млрд нуклеотидов. Несмотря на доступность новой версии, многие генетические тесты и сервисы по анализу генетических данных используют предыдущую — GRCh37. Для предоставления наиболее точных результатов анализа Атлас использует версию GRCh38.
Полученные после картирования файлы (SAM-файлы, sequencing alignment map, или в бинарном виде BAM — binary alignment map) фильтруются и используются для поиска вариаций в геноме, включая как однонуклеотидные вариации, так и короткие инсерции и делеции. Наличие однонуклеотидного варианта на хромосоме 1 в позиции 248333561 (приведенный ранее пример rs4481887 — вариант, определяющий чувствительность к запаху мочи после употребления спаржи) показано на Рисунке 5.
Рисунок 5. Визуализация BAM файла в программе IGV. Участок хромосомы 1. В позиции 248333561 находится полиморфизм rs4481887: нуклеотид в данной позиции не соответствует референсному геному и выделен цветом. Во всех ридах, которые покрывают данный участок генома, присутствует нуклеоид G, что говорит о гомозиготности генотипа. У человека с такими результатами секвенирования будет генотип G/G и нечувствительность к запаху мочи после употребления спаржи.
Найденные генетические вариации хранятся в VCF файле (variant call format). Он содержит обнаруженные аллели для каждой позиции генома, а также показатели качества генотипирования. VCF файл фильтруется: из него удаляются записи о наличии/отсутствии вариаций, которые не соответствуют порогам качества и являются потенциально ложными. Каждой найденной вариации присваиваются известные по ней данные из dbSNP, в частности, уникальные идентификаторы rsID.
Подробно ознакомиться со спецификой форматов хранения данных секвенирования и генотипирования можно по следующим ссылкам:
FASTQ — maq.sourceforge.net
SAM — samtools.github.io
VCF — samtools.github.io
Для визуализации картирования ридов (SAM или BAM файлов) используется различное программное обеспечение. Наиболее популярным является IGV (Integrative Genomics Viewer от Broad Institute). Загрузить IGV и ознакомиться с ним можно по ссылке.
Какие данные интерпретирует Атлас?
Полный геном содержит данные по тем вариантам генов, которые есть в генетическом тесте «Атлас», а также по признакам, которые нельзя подсчитать с помощью технологии генотипирования с использованием ДНК-микрочипов. Например, к таким признакам относятся риски онкологических заболеваний.
Здоровье
383 Наследственных заболеваний
Основной акцент всех тестов Атласа — раздел здоровье, и наш новый тест «Полный геном» не стал исключением. К признакам нашего основного теста мы добавили еще 65 наследственных заболеваний.
К наследственным или моногенным заболеваниям относятся болезни, которые передаются от родителей детям и на развитие которых не влияет образ жизни человека. Для развития такого заболевания достаточно мутации от одного или от обоих родителей в зависимости от типа наследования заболевания.
21 Многофакторное заболевание
На развитие многофакторных заболеваний влияют гены, образ жизни и факторы окружающей среды. К таким болезням относятся, например, сахарный диабет, ожирение, болезнь Паркинсона и Альцгеймера, атопический дерматит. В личном кабинете пользователю доступен расчет относительного риска развития заболевания на основе данных теста и опросника об образе жизни.
6 других признаков, связанных со здоровьем
Здесь мы собрали признаки, которые влияют на образ жизни человека. Например, продолжительность сна, хронотип, синдром хронической усталости, боязнь боли.
Клиническая генетика
43 Онкологических риска
Благодаря тому, что в полном геноме исследуется больше вариантов генов, мы получаем больше данных и можем оценить риски развития онкологических заболеваний. По результатам теста мы оцениваем предрасположенность к наследственным онкологическим синдромам.
Наследственные онкологические синдромы — генетические заболевания, которые могут передаваться в семье из поколения в поколение и повышать риски некоторых видов рака. Около 10% случаев онкологии имеют наследственную природу.
Поиск наследственных онкологических синдромов полезен в первую очередь тем, у кого в семье были случаи рака. На наследственную природу может указывать ранний возраст начала болезни (до 50 лет), наличие нескольких родственников по одной линии с одинаковым диагнозом, редкие формы рака. На основе результатов теста врач определит объем дополнительных исследований и составит персональную программу управления онкологическими рисками. Узнайте больше о том, как развиваются злокачественные образования, можно в нашей серии статей.
53 Показателей восприимчивости к активным компонентам лекарств
Каждый человек по разному реагирует на лекарства: у одних препарат действует хорошо, другие страдают от тяжелый побочных эффектов, а у третьих лечение оказывается неэффективным. В некоторых случаях это обусловлено работой генов, которые влияют на метаболизм активных веществ и риски побочных реакций.
Например, препарат Омепразол снижает секрецию соляной кислоты в желудке. Используется при лечении язвенной болезни желудка и двенадцатиперстной кишки, рефлюксной болезни. Ген CYP2C19 кодирует фермент, который отвечает за метаболизм омепразола. Поэтому, в зависимости от вариантов гена, необходимо корректировать дозу омепразола или использовать альтернативное лекарственное средство.
В тесте мы исследуем варианты генов, связанные с особенностями метаболизма 53 препаратов. Среди них есть антидепрессанты, гормональные контрацептивы, препарат для снижения свертываемости крови и некоторые другие.
Специализированный отчет по наследственным заболеваниям
Отчет — заключение Лаборатории клинической биоинформатики Федора Коновалова. Биоинформатики лаборатории ищут носительство рецессивных заболеваний. Такое носительство чаще всего не влияет на здоровье человека, но у его будущих детей оно может привести к заболеванию. Также лаборатория может выявить уникальную, нигде ранее не описанную мутацию и дать по ней заключение, является ли она вероятно патогенной.
Эксперты проводят тщательный анализ актуальной научной информации о мутациях и заболеваниях в каждом конкретном случае. В заключении содержится вся необходимая информация для врача-генетика. С этим отчетом вы сможете обратиться к профильному специалисту в случае необходимости.
Такие генетические отчеты похожи на юридический документ с обилием сложных терминов, правильно оценить который может только специалист, в нашем случае — генетик. Поэтому мы не показываем данные клинической генетики до консультации. Во время встречи врач-генетик подробно рассказывает, на что стоит обратить внимание с учетом вашей семейной истории и наличия симптомов. Это может помочь, например, для уточнения возраста начала скрининга определенных заболеваний или при планировании семьи.
Питание
28 Отчетов
По генетическим тестам и даже по полному геному подобрать оптимальное питание и составить рацион нельзя. Продуктов, их способов приготовления и блюд настолько много, что исследователям трудно найти какие-либо корреляции с вариантами генов. При этом некоторые данные все же есть.
По определенным вариантам генов мы можем узнать, есть ли у человека предрасположенность к непереносимости лактозы или глютена, быстро или медленно организм справляется с алкоголем или кофеином, а также оценить предрасположенность к определенному уровню железа, кальция, омега-3 и 6 жирных кислот. По этим данным человек может решить, какие продукты ему стоит убрать или наоборот добавить в рацион.
Спорт
16 Отчетов
Определить вид спорта, который вам больше подходит генетически — так же сложно, как и подобрать питание. Видов физической нагрузки сейчас множество, и понятие спорт с каждым годом расширяется. Так скейтбординг и серфинг добавили в программу олимпийских видов спорта. Видов физической нагрузки слишком много, чтобы это в большей степени было обусловлено генетикой. Поэтому не верьте генетическим тестам, которые обещают найти наиболее подходящий вам вид спорта. Выбирайте тот вид спорта, который просто нравится.
Научные сообщества генетиков обеспокоены, что родители делают генетические тесты детям, чтобы узнать, какой вид спорта им больше подходит. В таком случае ребенка могут отправить в группу, которая ему не нравится, но подходит по результатам теста. Если человек хочет добиться выдающихся результатов в спорте, то успех в большей степени будет зависеть от его амбиций, силы воли и характера. Варианты генов тут играют меньшую роль.
С помощью генетического теста можно узнать, как гены влияют на риски спортивных травм, количество свободного инсулиноподобного фактора роста-1, уровень эритроцитов, эритропоэтина, а также на особенности обмена аминокислот — валина, лейцина и L-карнитина. К результатам «Полного генома» мы добавили также риск невралгии седалищного нерва, уровень IGFBP‑3, объем выдоха и другие.
Другие признаки
15 Отчетов
В этом разделе мы собрали признаки, которые относятся к особенностям организма: черты внешности, восприятие света, чувствительность к травам и запахам. В нашем тесте вы не найдете признаков, которые связаны с эмоциями, поведением или характером. В основном эти черты зависят от особенностей воспитания, окружения и привычек, и в меньшей степени на них влияют варианты генов. К тому же многие личные качества можно поменять или выработать во взрослом возрасте.
Происхождение
3 Отчета
Генетики не используют понятия этнической или национальной принадлежности. В большей степени они обусловлены культурными различиями, а не разными вариантами генов. Вместо этого генетики используют понятие популяция — группа людей, которая долгое время живет на одной территории. Сегодня доступны геномные данные определенных популяций, из них ученые выделили последовательности и варианты генов, характерные для каждой. Генетические исследования происхождения — это поиск таких вариантов в геноме и определение генетической схожести с известными популяциями в процентном соотношении.
Кроме популяционного состава по генетическому коду можно узнать свою гаплогруппу. Гаплогруппа — это группа людей с одинаковым вариантом гена, который случился у одного общего предка тысячи лет назад. Также по геному можно определить процент ДНК неандертальца. В геноме современного человека оказалось около 1–4 % ДНК неандертальцев. Сейчас известно только несколько признаков, которые зависят от наличия вариантов гена неандертальца, — рост волос на спине и уровень липопротеинов низкой плотности ЛПНП (плохой холестерин).
Сравнение Полного генома и генетического теста «Атлас»
Почему Полный геном?
Главный плюс Полного генома в том, что вы получаете всю информацию о своей ДНК. Когда появятся новые данные, мы просто добавим их в личный кабинет. С обычным генетическим тестом это работает не всегда, так как в нем исследуется около 660 000 вариантов — 0,1% всей ДНК. Для интерпретации новых признаков их может быть недостаточно.
Результаты теста помогут предпринять меры по профилактике заболеваний, планированию семьи, а врач сможет уточнить диагноз в будущем или уже сейчас. Тест доставят на дом и всё, что требуется от пользователя — собрать образец слюны и вызвать курьера для передачи пробирки в лабораторию.
Основа Полного генома «Атласа»: генетический анализ высокой точности (99,5%), контроль качества полученных данных, запатентованная система интерпретации данных, доступ к исходным данным, консультация генетика, а также отобранные научные статьи, которые доступны каждому пользователю. Всё это пользователь получает за 94 500 — самая низкая цена за подобные услуги в России. Тест уже можно купить на сайте Атласа.
Если вы умеете работать с большими данными, а особенно биоинформатическими, ваши сырые данные полного генома могут быть пластилином, с которым на досуге можно поиграть и узнать о себе больше. Например, можно отсеять варианты генов, которые изучают другие компании и загрузить в их базу интерпретации, узнать родственную связь с другим человеком, взять референсную ДНК шимпанзе или Неандертальца и сравнить насколько вы схожи.