Длинноридное секвенирование раскрывает больше генетической информации, сокращая время и стоимость диагностики редких заболеваний
Один из 10 человек в мире страдает редким генетическим заболеванием, но около 50% из них остаются недиагностированными, несмотря на быстрый рост генетических технологий и тестирования. Даже когда у человека есть доступ к тестированию, процесс постановки диагноза может занять около пяти лет или больше, что иногда слишком поздно для пациентов, которые часто являются детьми, чтобы начать правильное лечение.
Отчасти это связано с тем, что в современных клинических испытаниях используется метод, называемый секвенированием с коротким прочтением, который не позволяет получить доступ к информации в определенных областях генома и поэтому может упустить важные данные, необходимые для постановки диагноза.
Однако исследователи из Калифорнийского университета в Санта-Крусе продвигают исследования передового альтернативного метода, называемого секвенированием с длинными считываниями, который может предоставить более полный набор данных для поиска вариаций, устранить необходимость в проведении нескольких специализированных тестов и упростить диагностику редких заболеваний.
Новое исследование показывает, что длиннопрочтовое секвенирование может повысить скорость диагностики, сократив время диагностики с нескольких лет до нескольких дней — за один тест и при гораздо меньших затратах.
Исследование было опубликовано в Американском журнале генетики человека и проводилось под руководством основных членов Института геномики Калифорнийского университета в Санта-Крузе, профессора биомолекулярной инженерии (БМИ) Бенедикта Патена и доцента БМИ Карен Мига, а также бывшего научного сотрудника-постдокторанта Калифорнийского университета в Санта-Крузе Джин Монлонг.
«Редкие заболевания — это то, что люди пытаются диагностировать уже много лет, и если у нас будет технология секвенирования, которая оптимизирует диагностическое тестирование, я думаю, это станет огромным вкладом, и именно это мы проверили в рамках этой статьи», — сказал Шлока Неги, аспирант кафедры физиологии и медицины Калифорнийского университета в Санта-Крус, который является первым автором статьи.
«Сегодня диагностическая эффективность генетического секвенирования удручающе низка», — сказал Пэйтен. «Одной из вероятных причин являются неполные методы секвенирования, используемые в клинической практике. В этой работе мы проверяем гипотезу о том, что новое, более полное секвенирование с длинными считываниями может генерировать дополнительную информацию, полезную для генетической диагностики».
«Мы были рады обнаружить многочисленные дополнительные потенциально интересные генетические варианты и эпигенетические сигналы в нашей когорте. Хотя это еще ранние дни, эта информация обещает большие перспективы, и сообществу потребуется время, чтобы интерпретировать и полностью понять большую часть этой новой информации».
Обнаружение редкого заболевания
В этом исследовании основное внимание уделялось редким моногенным заболеваниям, вызванным нарушением одного гена.
Ученые диагностируют генетические заболевания, просматривая свой генетический материал, чтобы найти варианты — различия в гене, которые могут помешать ему функционировать должным образом. Типичный подход для поиска этих вариантов использует технику, называемую секвенированием с коротким считыванием, которая считывает генетические пары оснований — комбинации аденина (A), цитозина (C), гуанина (G) и тимина (T) — в последовательностях примерно по 150–250 за раз.
Однако ограничением короткого секвенирования является то, что оно может упустить важную информацию в определенных областях генома, например, паттерны пар оснований, которые намного длиннее, чем 250 пар оснований. Оно также не может выполнять «фазирование», процесс определения того, какие варианты унаследованы от матери, а какие — от отца.
Это может помочь врачам обнаружить, от кого наследуются варианты; например, если два варианта унаследованы от одного и того же родителя, по одному от каждого родителя или не унаследованы вообще. Это может быть очень полезной информацией для генетической диагностики, особенно когда данные о родителях недоступны.
Напротив, секвенирование с длинными считываниями может считывать длинные участки ДНК сразу, устраняя пробелы, которые могут привести к тому, что ученые и клиницисты упустят важную информацию о вариациях генов. Секвенирование с длинными считываниями также предоставляет данные о прямой фазировке, а также информацию о метилировании, химическом процессе в ДНК, который заставляет гены «включаться или выключаться», и может способствовать заболеванию.
«В некоторых случаях длинная последовательность будет намного лучше, и мы предпринимаем шаги, чтобы доказать это», — сказал Неги.
Лидерство в методах
Исследователи Института геномики Калифорнийского университета в Санта-Крусе имеют богатую историю инноваций и опыта в области длинных прочтений секвенирования и активно разрабатывают методы оптимизации секвенирования и анализа для широкого спектра приложений в области медицинских исследований. Многие из методов, разработанных исследователями для достижения подвигов, таких как первый по-настоящему полный референсный геном «теломера-теломера» , теперь используются для улучшения результатов лечения пациентов.
«Подтверждая более ранние результаты, мы обнаружили, что преимущества использования длиннопрочтового секвенирования существенно возросли за счет использования полного, так называемого «от теломер к теломере» референсного генома вместо существующего неполного, но широко используемого геномного референса», — сказал Мига.
«Мы ожидаем, что пангеномы — референты, представляющие разнообразные человеческие вариации — получат еще больше преимуществ от новых технологий длинных прочтений секвенирования».
Лаборатории Патена и Миги объединились с клиницистами для работы над случаями 42 пациентов с редкими заболеваниями — некоторые из них получили диагноз с помощью методов короткого чтения или других специализированных тестов, а некоторые из них так и не были диагностированы. В некоторых случаях исследователи имели доступ к родительской генетической информации, но в других — нет.
Лаборатория Miga Lab провела длинную секвенацию геномов пациентов с использованием нанопорового секвенирования — метода длинных секвенирований, впервые примененного в Калифорнийском университете в Санта-Крузе , — для получения высокоточных сквозных прочтений геномов пациентов по цене около 1000 долларов США за образец.
Геномные данные были проанализированы с использованием вычислительных методов, разработанных в лаборатории Патена, для поиска малых и больших вариантов, данных фазирования и данных метилирования, все с использованием одного конвейера, называемого конвейером Napu . Процесс анализа занимает около дня или меньше, в зависимости от скорости обработки компьютера, и стоит 100 долларов.
Решение дел
После секвенирования и анализа данных пациентов исследователи обнаружили, что длинные прочтения дают более полный набор данных по сравнению с тем, что можно получить с помощью короткого секвенирования.
Длиннокодовое секвенирование позволило поставить окончательный диагноз 11 из 42 пациентов в когорте, предоставив все, что было известно из данных короткокодового секвенирования, а также дополнительную информацию, включая дополнительные редкие варианты-кандидаты, длиннокодовое фазирование и метилирование — все в рамках единого, экономически эффективного и быстрого протокола.
Из 11 диагностированных случаев четыре случая включали врожденную гипоплазию надпочечников (редкое заболевание, при котором надпочечники увеличены и не могут нормально функционировать). Ген, ответственный за это заболевание, находится в особенно сложной области генома — его нельзя охарактеризовать с помощью технологии секвенирования с коротким считыванием , а текущий клинический тест громоздкий и неполный.
«Чтобы решить эти проблемы, мы разработали новый пангеномный инструмент, который интегрирует новые высококачественные сборки, такие как референтный геном «теломера-теломера»», — сказал Монлонг, который начал этот проект в качестве постдокторанта в лаборатории Патена и продолжил его на своей нынешней должности в INSERM во Франции.
«Мы были рады увидеть, что нам удалось найти и фазировать патогенные варианты всех четырех пациентов, страдающих этим заболеванием в нашей когорте. В будущем это может предложить быстрый и всесторонний клинический тест. Мы знаем, что многие редкие заболевания затрагивают области человеческого генома, которые исторически было трудно изучать, поэтому наши результаты побуждают нас распространить наш подход на большее количество тех заболеваний, которые долгое время находились в состоянии застоя».
Кроме того, два случая были связаны с нарушениями полового развития, а один редкий случай гипоплазии клеток Лейдига повлиял на половое развитие мужчин из-за недоразвитых клеток Лейдига в яичках. Кроме того, четыре случая нарушений нейроразвития, каждый из которых представлял собой долгую и сложную диагностическую одиссею, были наконец разрешены.
«Длинное секвенирование, вероятно, является следующим лучшим тестом для нераскрытых случаев либо с убедительными вариантами в одном гене, либо с четким фенотипом», — сказал Неги. «Он может служить единым диагностическим тестом, сокращая необходимость в нескольких клинических визитах и превращая многолетнее диагностическое путешествие в дело нескольких часов».
В среднем у каждого пациента было 280 генов (включая некоторые гены менделевских болезней, которые связаны с наследственными заболеваниями, вызванными мутациями одного гена ) со значительными областями кодирования белков, уникально охваченными длинными прочтениями и не обнаруженными короткими прочтениями.
«Существует гораздо больше генома, который длинные прочтения могут раскрыть», — сказал Неги. «Но пройдет некоторое время, прежде чем мы сможем полностью интерпретировать эту новую информацию, полученную с помощью длинных прочтений. Эти данные отсутствовали в наших клинических базах данных, которые были созданы с использованием анализа коротких прочтений и сопоставления со стандартным эталоном.
«Мы показали, что длинные прочтения раскрывают примерно на 5,8% больше генома от теломер до теломер, к которому короткие прочтения просто не могут получить доступ».
В этом исследовании также принимали участие другие исследователи из Калифорнийского университета в Санта-Крус: Брэнди МакНалти, Айво Виолих, Джошуа Гарднер, Тодд Хиллакер и Сара О'Рурк.