Графическая модель машинного обучения демонстрирует потенциал для прогнозирования генов рака
Всемирная организация здравоохранения сообщает о постоянном росте числа больных раком во всем мире, отмечая это как серьезную угрозу для здоровья. Профилактика и лечение рака стали глобальным приоритетом, а выявление генов, вызывающих рак, необходимо для понимания его развития и разработки персонализированных методов лечения. Однако современные методы испытывают трудности с обобщением и интерпретацией, что ограничивает их эффективность в отношении различных типов рака и групп населения.
Для решения этой проблемы исследовательская группа из Синьцзянского института физики и химии Китайской академии наук (CAS) в сотрудничестве с другими экспертами предложила графовую модель машинного обучения, а именно TREE, основанную на фреймворке Transformer.
Благодаря этой новой архитектуре на основе Transformer, TREE не только определяет наиболее влиятельный тип омиксных данных, но и обнаруживает наиболее репрезентативные сетевые пути, участвующие в регуляции генов, которые управляют образованием и прогрессированием рака.
Работа опубликована в журнале Nature Biomedical Engineering .
Исследователи обнаружили, что обучение TREE на подграфах, отобранных из локальных структур, обеспечивает эффективное обучение представлению на уровне узлов, при этом значительно сокращая требования к вычислительным ресурсам.
В отличие от традиционных архитектур Transformer, TREE включает в свой вход информацию о структуре графа из биологических сетей. Он также интегрирует вложения позиции, полученные из информации о степени узла с мультиомическими функциями узлов.
Более того, TREE использует механизм совместного внимания, где глобальные структурные кодировки узлов, полученные из расстояния в сети, направляют расчет весов внимания. Такая конструкция повышает способность модели улавливать сложные отношения в биологических системах.
Благодаря включению мультиомных данных из генов и других биологических молекул , а также структурной информации из гомогенных и гетерогенных биологических сетей , модель значительно повышает точность прогнозирования генов-драйверов рака.
Это достижение позволяет более точно идентифицировать гены, тесно связанные с прогрессированием рака, что имеет важное значение для разработки персонализированных стратегий лечения.
Более того, сильные стороны модели в плане интеграции мультиомических данных и сложного сетевого анализа обеспечивают ее применимость в различных заболеваниях и дисциплинах.
Это исследование является примером передовой интеграции искусственного интеллекта с биомедицинской инженерией , предлагая инновационные решения проблем, связанных с раком .