Машинное обучение — мощный инструмент в вычислительной биологии, позволяющий анализировать широкий спектр биомедицинских данных, таких как геномные последовательности и биологическая визуализация. Но когда исследователи используют машинное обучение в вычислительной биологии, понимание поведения модели остается решающим для раскрытия базовых биологических механизмов в здоровье и болезни.

В недавней статье в Nature Methods исследователи из Школы компьютерных наук Университета Карнеги-Меллона предлагают руководящие принципы, которые описывают подводные камни и возможности использования интерпретируемых методов машинного обучения для решения проблем вычислительной биологии . Статья журнала Perspectives «Применение интерпретируемых методов машинного обучения в вычислительной биологии — подводные камни, рекомендации и возможности для новых разработок» представлена ​​в августовском специальном выпуске журнала, посвященном ИИ.

«Интерпретируемое машинное обучение вызвало значительный ажиотаж, поскольку инструменты машинного обучения и искусственного интеллекта применяются для решения все более важных проблем», — сказал Амит Талвалкар, доцент кафедры машинного обучения (MLD) Карнеги-Меллона.

«Поскольку эти модели становятся все более сложными, открываются большие перспективы не только в разработке высокопрогностических моделей , но и в создании инструментов, которые помогут конечным пользователям понять, как и почему эти модели делают определенные прогнозы. Однако крайне важно признать, что интерпретируемое машинное обучение еще не предоставило готовых решений этой проблемы интерпретируемости».

Статья является совместной работой докторантов Валери Чен из MLD и Мую (Венди) Янг из отделения вычислительной биологии Рэя и Стефани Лейн. Более ранняя работа Чен, критикующая отсутствие у сообщества интерпретируемого машинного обучения фундаментальных знаний в случаях использования в нисходящем направлении, вдохновила на написание статьи, а сама идея была развита в ходе обсуждений с Ян и Цзянь Ма, профессором вычислительной биологии Рэя и Стефани Лейн.

«Наше сотрудничество началось с глубокого погружения в статьи по вычислительной биологии для обзора применения интерпретируемых методов машинного обучения», — сказал Ян. «Мы заметили, что многие приложения использовали эти методы несколько ситуативным образом. Нашей целью в этой статье было предоставить рекомендации для более надежного и последовательного использования интерпретируемых методов машинного обучения в вычислительной биологии ».

Одной из основных ловушек, на которую указывает статья, является опора на один интерпретируемый метод машинного обучения. Вместо этого исследователи рекомендуют использовать несколько интерпретируемых методов машинного обучения с различными наборами гиперпараметров и сравнивать их результаты, чтобы получить более полное понимание поведения модели и ее базовых интерпретаций.

«Хотя некоторые модели машинного обучения, кажется, работают на удивление хорошо, мы часто не до конца понимаем, почему», — сказал Ма. «В таких научных областях, как биомедицина, понимание того, почему работают модели, имеет решающее значение для открытия фундаментальных биологических механизмов».

В статье также предостерегают от выборочного отбора результатов при оценке интерпретируемых методов машинного обучения, поскольку это может привести к неполной или предвзятой интерпретации научных результатов.

Чэнь подчеркнул, что рекомендации могут иметь более широкие последствия для более широкой аудитории исследователей, заинтересованных в применении интерпретируемых методов машинного обучения в своей работе.

«Мы надеемся, что исследователи машинного обучения, разрабатывающие новые интерпретируемые методы и инструменты машинного обучения, особенно те, которые работают над объяснением больших языковых моделей, будут внимательно рассматривать человеко-ориентированные аспекты интерпретируемого машинного обучения», — сказал Чэнь. «Это включает в себя понимание того, кто является их целевым пользователем и как метод будет использоваться и оцениваться».

Хотя понимание поведения модели по-прежнему имеет решающее значение для научных открытий и является принципиально нерешенной проблемой машинного обучения , авторы надеются, что эти проблемы стимулируют дальнейшее междисциплинарное сотрудничество, способствующее более широкому использованию ИИ в научных целях.