Ученые из Института рака Дана-Фарбер и Медицинского центра Вейла Корнелла разработали и протестировали новые инструменты искусственного интеллекта, адаптированные для цифровой патологии — относительно новой области, которая использует цифровые изображения высокого разрешения, создаваемые из образцов тканей, для диагностики заболеваний и принятия обоснованных решений по лечению.

В их статье, опубликованной в журнале The Lancet Digital Health 9 июля 2024 года, показано, что ChatGPT, языковая модель ИИ, разработанная для понимания и генерации текста, может быть адаптирована с использованием метода ИИ, называемого генерацией с дополненной поисковой обработкой, для предоставления точных ответов на вопросы о цифровой патологии и сбора подробных результатов.

Авторы также обнаружили, что ChatGPT может помочь патологам, не имеющим большого опыта в кодировании, использовать сложное программное обеспечение, анализирующее образцы тканей , эффективно помогая преодолеть разрыв между навыками патологоанатома и навыками цифровой патологии.

ChatGPT — это большая языковая модель (LLM), то есть она генерирует тексты по широкому кругу тем, используя обширные объемы данных. «LLM хороши для общих задач, но они не являются лучшими инструментами для получения полезной информации для специализированных областей», — сказал ведущий автор исследования Мохамед Омар, доктор медицины, доцент кафедры исследований в области патологии и лабораторной медицины, член отделения вычислительной и системной патологии в Weill Cornell Medicine и ведущий научный сотрудник в Dana-Farber Cancer Institute.

Чтобы создать инструменты искусственного интеллекта, которые могли бы повысить эффективность и точность цифровой патологии, автор-корреспондент Ренато Уметон, доктор философии, директор по операциям искусственного интеллекта и службам науки о данных департамента информатики и аналитики компании Dana-Farber, возглавил работу по настройке и расширению возможностей ChatGPT для этой конкретной цели.

Повышение точности ИИ для патологий
«С общими LLM есть две основные проблемы. Во-первых, они часто дают длинные общие ответы, которые, хотя и верны, не содержат достаточно подробной информации», — сказал Омар. «Во-вторых, эти модели могут галлюцинировать и выдумывать вещи из ничего, включая литературные цитаты. Это особенно плохо в специализированных областях, таких как, например, цифровая патология и биология рака».

Чтобы устранить сбои, Umeton начал с безопасного, приватного и защищенного варианта ChatGPT, введенного в эксплуатацию в Dana-Farber (GPT4DFCI). Они дополнили GPT4DFCI доступом к всеобъемлющей и тщательно подобранной базе данных последних разработок в области цифровой патологии, состоящей из 650 публикаций с 2022 года, что в сумме составило более 10 000 страниц литературы.

«Мы могли бы попросить эту новую систему догнать нас по многим конкретным темам или методам цифровой патологии и получить результаты за считанные секунды, с уровнем детализации, глубины и обобщения, которого нет в современных инструментах научной литературы или поисковых системах. Это эффективно расширило возможности исследователей», — отметил Уметон.

Они использовали метод, называемый генерацией дополненной поисковой информации (RAG), который позволил GPT4DFCI получить доступ к соответствующим документам или информации из этой специализированной базы данных и генерировать точные ответы на запросы пользователей о цифровой патологии, но не выходить за рамки этой области.

Омар и его коллеги задавали GPT4DFCI вопросы, специфичные для цифровой патологии, и сравнивали ответы с ответами, предоставленными ChatGPT 4. Потребовав от GPT4DFCI предоставить ссылки на конкретные публикации, которые он использовал для генерации ответов, они определили, что ответы были точными и обоснованными.

Усовершенствованная модель дала более точные и релевантные ответы, чем ChatGPT 4, и не галлюцинировала — ни разу. «Я надеюсь, что это станет катализатором для более предметно-ориентированных инструментов в других областях медицины или медицинских исследований », — сказал Омар.

ИИ помогает с кодированием
Вторая программа ИИ, разработанная командой, помогает патологам использовать PathML, специализированную программную библиотеку, которая требует знакомства с языком программирования Python для анализа обширных и сложных наборов данных изображений патологии. «Патоморфологам или ученым без предварительного опыта кодирования может показаться сложным использовать PathML для задач анализа изображений», — сказал Омар.

Исследователи интегрировали PathML с ChatGPT, что позволяет пользователям взаимодействовать с документацией PathML через функцию чата. Пользователи могут просто вводить свои вопросы об использовании PathML для анализа гистопатологических изображений — мультиплексных изображений, тканевых микрочипов или количественных оценок биомаркеров, например — и инструмент предоставит пошаговые, точные инструкции по кодированию их анализов.

«Генеративный ИИ оказался полезным в предоставлении структурированных рекомендаций относительно того, к каким материалам обращаться и как организовать процесс обучения новым темам», — сказал Уметон.

«Наше исследование показывает, что в сочетании с надлежащими методами поиска информации ChatGPT и защищенные инструменты ИИ, такие как GPT4DFCI, могут быть чрезвычайно эффективными в поддержке базовых исследователей. Эти инструменты полезны даже в очень сложных темах, требующих чрезвычайно точных ответов, таких как цифровая патология » .