В рамках общенациональной тенденции многие пациенты NYU Langone Health во время пандемии начали использовать электронные инструменты медицинских карт, чтобы задавать вопросы своим врачам, выписывать рецепты и просматривать результаты анализов. Многие цифровые запросы пациентов поступали через инструмент связи под названием In Basket, который встроен в систему электронных медицинских карт (EHR) NYU Langone, EPIC.

По данным статьи доктора медицины Пола А. Тесты, главного специалиста по медицинской информации в Нью-Йоркском университете имени Лангона, врачи всегда уделяли время управлению сообщениями в электронных медицинских картах, однако в последние годы количество получаемых ими сообщений ежегодно увеличивается более чем на 30%.

Теста написал, что врачи нередко получают более 150 сообщений In Basket в день. Поскольку системы здравоохранения не рассчитаны на обработку такого трафика, врачи в конечном итоге заполняют пробел, проводя долгие часы после работы, просматривая сообщения. Это бремя упоминается как причина того, что половина врачей сообщают о выгорании .

Новое исследование, проведенное учеными из Медицинской школы имени Гроссмана Нью-Йоркского университета, показывает, что инструмент ИИ может составлять ответы на запросы пациентов в электронных медицинских картах так же точно, как и их специалисты-медики, и с большей воспринимаемой «эмпатией». Результаты подчеркивают потенциал этих инструментов для значительного снижения нагрузки на врачей в корзине, одновременно улучшая их общение с пациентами, при условии, что поставщики услуг будут просматривать черновики ИИ перед их отправкой.

Медицинский центр NYU Langone Health тестирует возможности генеративного искусственного интеллекта (genAI), в котором компьютерные алгоритмы разрабатывают вероятные варианты следующего слова в любом предложении на основе того, как люди использовали слова в контексте в Интернете.

Результатом этого предсказания следующего слова стало то, что «чатботы» genAI могут отвечать на вопросы на убедительном языке, похожем на человеческий. В 2023 году Нью-Йоркский университет Лангоне лицензировал «частный экземпляр» GPT4, новейшего родственника знаменитого чатбота ChatGPT, который позволяет врачам экспериментировать с использованием реальных данных пациентов, при этом соблюдая правила конфиденциальности данных.

В новом исследовании , опубликованном 16 июля в журнале JAMA Network Open , изучались черновики запросов пациентов в корзине, созданные с помощью GPT4, и лечащие врачи сравнивали их с реальными ответами людей на эти сообщения.

«Наши результаты показывают, что чат-боты могут снизить нагрузку на поставщиков медицинских услуг, обеспечивая эффективные и чуткие ответы на проблемы пациентов», — сказал ведущий автор исследования Уильям Смолл, доктор медицины, клинический доцент кафедры медицины в Медицинской школе Гроссмана Нью-Йоркского университета. «Мы обнаружили, что интегрированные в EHR чат-боты с искусственным интеллектом, которые используют данные, специфичные для пациента, могут составлять сообщения, по качеству сопоставимые с сообщениями, которые составляют люди».

Для исследования 16 врачей первичной медико-санитарной помощи оценили 344 случайно назначенных пары ответов ИИ и человека на сообщения пациентов по точности, релевантности, полноте и тону и указали, будут ли они использовать ответ ИИ в качестве первого черновика или им придется начинать с нуля при написании сообщения пациента. Врачи не знали, были ли просматриваемые ими ответы сгенерированы людьми или инструментом ИИ (слепое исследование).

Исследовательская группа обнаружила, что точность, полнота и релевантность ответов генеративного ИИ и людей-поставщиков статистически не различались. Ответы генеративного ИИ превзошли ответы людей-поставщиков по понятности и тону на 9,5%.

Кроме того, ответы ИИ более чем в два раза чаще (на 125% чаще) считались сочувственными и на 62% чаще использовали язык, передающий позитив (потенциально связанный с надеждой) и принадлежность («мы вместе»).

С другой стороны, ответы ИИ также были на 38% длиннее и на 31% чаще использовали сложный язык, поэтому необходимо дальнейшее обучение инструмента, говорят исследователи. В то время как люди отвечали на запросы пациентов на уровне 6-го класса, ИИ писал на уровне 8-го класса, согласно стандартной мере читабельности, называемой оценкой Флеша Кинкейда.

Исследователи утверждают, что использование частной информации о пациентах чат-ботами, а не общей информации из интернета, лучше соответствует тому, как эта технология будет использоваться в реальном мире. Будущие исследования потребуются для подтверждения того, улучшили ли частные данные производительность инструментов ИИ.

«Эта работа демонстрирует, что инструмент ИИ может создавать высококачественные проекты ответов на запросы пациентов», — сказал соавтор Девин Манн, доктор медицины, старший директор по инновациям в области информатики в медицинском центре информационных технологий имени Лангона при Нью-Йоркском университете (MCIT).

«После одобрения врачей качество сообщений GenAI в ближайшем будущем сравняется по качеству, стилю общения и удобству использования с ответами, генерируемыми людьми», — добавил Манн, также являющийся профессором кафедры здоровья населения и медицины.