Ресурс открытого доступа упрощает классификацию подтипов рака для исследователей
Группа ученых из разных институтов разработала бесплатный общедоступный ресурс, который поможет классифицировать образцы опухолей пациентов на основе различных молекулярных характеристик, определенных сетью Cancer Genome Atlas (TCGA).
Ресурс содержит модели классификаторов, которые могут ускорить разработку наборов тестов, специфичных для подтипов рака, для использования в клинических испытаниях и диагностике рака . Это важный шаг вперед, поскольку опухоли, принадлежащие к разным подтипам, могут по-разному реагировать на противораковую терапию.
Этот ресурс является первым в своем роде, позволяющим преодолеть разрыв между огромной библиотекой данных TCGA и клинической реализацией.
Статья с описанием инструментов опубликована сегодня в журнале Cancer Cell .
«TCGA определила молекулярные подтипы для каждого основного типа рака. С помощью этого ресурса мы стремились предоставить клиническому и научному сообществу инструменты для отнесения вновь диагностированной опухоли к одному из этих установленных подтипов», — сказал Питер У. Лэрд, доктор философии, заведующий кафедрой эпигенетики имени Питера и Эмаджена Кука в Институте Ван Андела и ведущий автор-корреспондент исследования.
«Наш новый ресурс станет мощным инструментом для создания клинических анализов, основанных на разнообразных молекулярных вариациях между видами рака».
TCGA — это десятилетняя работа Национального института рака по созданию подробных молекулярных карт 33 типов рака. В отличие от традиционных подходов, определяющих рак на основе органа или ткани, в которых он возникает, TCGA выявила тонкие геномные, эпигеномные, протеомные и транскриптомные характеристики, которые более точно описывают подтипы рака.
Эндрю Д. Черняк, доктор философии из Института Брода Массачусетского технологического института и Гарварда, и Кайл Эллротт, доктор философии из Института рака Найта при Орегонском университете здравоохранения и науки, также являются авторами статьи, которая представляет собой совместную работу ученых из более чем десятка исследовательских организаций.
«Поскольку многие молекулярные подтипы TCGA были созданы с использованием сотен или тысяч признаков из нескольких типов данных, ученые и врачи обратились к нам за помощью в подтипировании их образцов», — сказал Черняк. «Наш ресурс значительно упрощает этот процесс».
Команда создала новый ресурс, используя данные из 8791 образцов рака TCGA, которые представляли 26 групп рака и 106 подтипов рака. Затем они использовали существующие инструменты машинного обучения для разработки и тестирования почти полумиллиона моделей в шести категориях — экспрессия генов , метилирование ДНК, микроРНК, число копий, вызовы мутаций и мультиомика — и выбрали те, которые показали наилучшие результаты для включения в онлайн-ресурс.
Всего ресурс содержит 737 готовых к использованию моделей, которые представляют собой лучшие модели из каждой из 26 групп больных раком, пять алгоритмов обучения и шесть типов данных.
«Важнейшим элементом этих усилий была работа по обеспечению того, чтобы эти модели могли быть развернуты другими группами на новых наборах данных», — сказал Эллротт. «Слишком часто этот тип работы трудно повторить или применить к новым образцам».