Масштабное профилирование белков и генов значительно расширило спектр белков и мутаций генов, связанных с раком, однако было трудно определить, играют ли они активную роль в заболевании или являются невинными наблюдателями.
В исследовании, опубликованном в журнале Nature Cancer , исследователи из Медицинского колледжа Бейлора представили мощный и беспристрастный подход на основе машинного обучения под названием FunMap для оценки роли мутаций, связанных с раком, и недостаточно изученных белков, имеющий широкое значение для развития биологии рака и обоснования терапевтических стратегий.
«Получение функциональной информации о генах и белках, связанных с раком, является важным шагом на пути к лучшему пониманию заболевания и выявлению потенциальных терапевтических целей», — сказал соавтор исследования доктор Бин Чжан, профессор молекулярной и человеческой генетики и сотрудник Центра маммологии Лестера и Сью Смит в Бэйлоре.
«Наш подход к получению функциональной информации об этих генах и белках включает использование машинного обучения для разработки сети, отображающей их функциональные связи», — сказал Чжан, член Комплексного онкологического центра имени Дэна Л. Дункана при Университете Бэйлора и стипендиат фонда Макнейра.
«Это как если бы я ничего о вас не знал, но если я знаю ваши связи в LinkedIn, я мог бы сделать вывод о том, чем вы занимаетесь».
Команда разработала FunMap — функциональную сеть из 10 525 генов, созданную с использованием контролируемого метода машинного обучения, который объединяет наборы данных о белках и данные секвенирования РНК из 11 типов рака, недавно гармонизированные рабочей группой по изучению рака Консорциума по клиническому протеомному анализу опухолей (CPTAC).
«С помощью FunMap мы обнаружили 196 800 ассоциаций среди 10 525 белков — всеобъемлющее и беспристрастное протеомное покрытие и высокий уровень функциональной релевантности», — сказал Чжан.
«Два ключевых отличия между нашим подходом и предыдущими исследованиями сетей коэкспрессии генов: во-первых, интеграция данных о раковых белках с данными об экспрессии мРНК, а во-вторых, применение контролируемого машинного обучения для синергии всех наборов данных с целью максимизации предсказательной силы. Неожиданно наш подход превзошел сети белок-белкового взаимодействия в различении функционально значимых и незначимых пар генов».
С помощью сетевого анализа FunMap выявляет белковые модули и иерархическую модульную организацию, связанную с признаками рака и клиническими характеристиками, прогнозирует функции недостаточно изученных раковых белков, предлагает более глубокое понимание известных факторов, способствующих развитию рака, и выявляет факторы с низкой частотой мутаций.
«Более 200 генов сильно или недостаточно экспрессируются при раке, но мы очень мало знаем об их конкретных ролях в заболевании», — сказал Чжан. «Когда мы картировали эти гены в нашей сети, мы смогли посмотреть на соседство и сделать прогноз об их функции».
Например, экспрессия малоизученного гена MAB21L4 значительно ниже нормы в трех типах раковых опухолей. FunMap показал, что сетевое окружение этого гена обогащено генами, связанными с дифференцировкой эпителиальных клеток, подавление которых играет критическую роль в прогрессировании опухоли.
Данные клинической классификации опухолей, а также недавнее исследование, показывающее, что потеря MAB21L4 блокирует дифференциацию, что приводит к развитию плоскоклеточного рака, предоставляют убедительные доказательства в поддержку супрессорной роли MAB21L4 в опухолях.
Более того, использование новейших методов глубокого обучения с помощью FunMap позволило обнаружить многочисленные ранее неизвестные факторы, вызывающие рак, с низкой частотой мутаций, включая новую супрессорную роль LGI3 в опухолях, подтвержденную экспериментальными данными по нокауту генов.
Это исследование подчеркивает большой потенциал интеграции машинного обучения и протеогеномного профилирования для более глубокого понимания сложных систем рака. Создавая всеобъемлющую функциональную сеть, этот подход обеспечивает надежную основу для исследований функциональной геномики рака, предлагая ценные сведения о мутациях и белках, связанных с раком.
«Эти результаты могут существенно помочь в определении приоритетов для клинического применения, что в конечном итоге будет способствовать разработке более эффективных методов лечения рака», — сказал Чжан.


















Это очень интересная статья! Как вы думаете, какие следующие шаги в исследовании этих белков и генов могут быть наиболее значимыми?
Огромное спасибо за информацию! У меня есть вопрос: как именно машинное обучение помогает отличить активные гены от наблюдателей?
Читала о подобных исследованиях и сама столкнулась с онкологией в семье. Это действительно важная тема, и я надеюсь, что открытия помогут многим людям.
Мне кажется, что применение машинного обучения в медицине — это будущее. Как вы думаете, какие еще области могут выиграть от таких технологий?
В статье упоминается масштабное профилирование. Есть ли примеры успешных случаев выявления мутаций, которые уже помогли в лечении рака?
Интересно, как вы определяете «активную роль» генов в раке? Это можно как-то количественно измерить?
Спасибо за освещение такой актуальной темы! Я сама изучаю молекулярную биологию, и мне бы хотелось узнать больше о ваших методах исследования.
Согласен с тем, что важно выявить активные гены. Как вы считаете, какие факторы могут влиять на их активность?
Здорово, что машинное обучение дает такие результаты! Надеюсь, это поможет не только в исследованиях, но и в клинической практике.
Вы действительно верите, что машинное обучение может заменить традиционные методы в исследовании рака? Это довольно рискованно.
У меня был опыт работы с данными геномики, и я знаю, насколько это сложно. Благодарю за вашу работу, она действительно важна!
Я слышал, что некоторые белки могут быть предшественниками рака. Как вы считаете, возможно ли их использование в профилактике?
Это открытие может изменить подход к лечению рака! Каковы прогнозы по его внедрению в клиническую практику?
Вопрос: какие технологии машинного обучения вы используете для анализа данных? Это очень интересно!
У меня много вопросов по поводу этики использования этих данных. Как вы относитесь к этому?
История про наблюдаемых генов очень меня удивила. Может быть, есть примеры, когда такие гены все же сыграли важную роль в лечении?
Я очень благодарна вам за эту статью! Каждый шаг в исследовании рака важен, и такие открытия дают надежду.
Согласен, что нужно выделять активные гены, но как вы собираетесь решать проблему большого объема данных в таких исследованиях?