Генная терапия потенциально может вылечить генетические заболевания, но по-прежнему остается проблемой безопасная и эффективная упаковка и доставка новых генов в определенные клетки. Существующие методы разработки одного из наиболее часто используемых средств доставки генов, аденоассоциированных вирусов (AAV), часто медленные и неэффективные.

Теперь исследователи из Института Брода Массачусетского технологического института и Гарварда разработали подход машинного обучения, который обещает ускорить разработку AAV для генной терапии . Инструмент помогает исследователям разрабатывать белковые оболочки AAV, называемые капсидами, чтобы они имели несколько желаемых признаков, таких как способность доставлять груз в определенный орган, но не в другие, или работать в нескольких видах. Другие методы ищут только капсиды, которые имеют один признак за раз.

Команда использовала свой подход для разработки капсидов для широко используемого типа AAV, называемого AAV9, который более эффективно воздействует на печень и может быть легко изготовлен.

Они обнаружили, что около 90% капсидов, предсказанных их моделями машинного обучения, успешно доставили свой груз в клетки печени человека и соответствовали пяти другим ключевым критериям.

Они также обнаружили, что их модель машинного обучения правильно предсказала поведение белков у макак , хотя она была обучена только на данных о клетках мышей и человека. Это открытие предполагает, что новый метод может помочь ученым быстрее разрабатывать AAV, которые работают между видами, что необходимо для переноса генной терапии на людей.

Результаты , опубликованные в Nature Communications , получены в лаборатории Бена Девермана, научного сотрудника и директора отдела векторной инженерии в Центре психиатрических исследований Стэнли в Брод-Хиллз. Фатма-Эльзахра Эйд, старший специалист по машинному обучению в группе Девермана, была первым автором исследования.

«Это был действительно уникальный подход», — сказал Деверман. «Он подчеркивает важность работы биологов в мокрой лаборатории с учеными, изучающими машинное обучение, на ранних этапах для разработки экспериментов, которые генерируют данные, позволяющие использовать машинное обучение, а не в качестве второстепенной мысли».

Руководитель группы Кен Чан, аспирант Альберт Чен, научный сотрудник Изабель Тоби и научный руководитель Алина Чан, все из лаборатории Девермана, также внесли значительный вклад в исследование.

Уступите дорогу машинам
Традиционные подходы к проектированию AAV включают создание больших библиотек, содержащих миллионы вариантов капсидных белков, а затем их тестирование в клетках и животных в нескольких раундах отбора. Этот процесс может быть дорогостоящим и отнимающим много времени, и обычно приводит к тому, что исследователи идентифицируют только несколько капсидов, имеющих определенную черту. Это затрудняет поиск капсидов, которые соответствуют нескольким критериям.

Другие группы использовали машинное обучение для ускорения крупномасштабного анализа, но большинство методов оптимизировали белки для выполнения одной функции за счет другой.

Деверман и Эйд поняли, что наборы данных, основанные на существующих больших библиотеках AAV, не очень подходят для обучения моделей машинного обучения. «Вместо того, чтобы просто взять данные и передать их ученым, изучающим машинное обучение, мы подумали: «Что нам нужно, чтобы лучше обучать модели машинного обучения?» — сказал Эйд. «Выяснение этого было действительно полезным».

Сначала они использовали начальный раунд моделирования машинного обучения для создания новой библиотеки среднего размера под названием Fit4Function, которая содержала капсиды, которые, как было предсказано, хорошо упаковывали генный груз. Команда проверила библиотеку в клетках человека и мышей, чтобы найти капсиды, которые имели определенные функции, важные для генной терапии у каждого вида.

Затем они использовали эти данные для построения нескольких моделей машинного обучения, каждая из которых могла предсказать определенную функцию из последовательности аминокислот капсида . Наконец, они использовали эти модели в сочетании для создания «многофункциональных» библиотек AAV, оптимизированных для нескольких признаков одновременно.

Будущее белкового дизайна
В качестве доказательства концепции Эйд и другие исследователи в лаборатории Девермана объединили шесть моделей, чтобы разработать библиотеку капсидов, которые имели несколько желаемых функций, включая технологичность и способность нацеливаться на печень в клетках человека и мышей. Почти 90% этих белков одновременно демонстрировали все желаемые функции.

Исследователи также обнаружили, что модель, обученная только на данных мышей и человеческих клеток, правильно предсказала, как AAV распределяются по разным органам макак, предполагая, что эти AAV делают это с помощью механизма, который транслируется между видами. Это может означать, что в будущем исследователи генной терапии смогут быстрее идентифицировать капсиды с несколькими желаемыми свойствами для использования человеком.

В будущем Эйд и Деверман говорят, что их модели могут помочь другим группам создать генную терапию, которая либо нацелена на печень, либо специально избегает ее. Они также надеются, что другие лаборатории будут использовать их подход для создания собственных моделей и библиотек, которые вместе могли бы сформировать атлас машинного обучения: ресурс, который мог бы предсказывать производительность капсидов AAV по десяткам признаков для ускорения разработки генной терапии.