Отделения неотложной помощи по США переполнены и перегружены работой, но новое исследование предполагает, что искусственный интеллект (ИИ) однажды сможет помочь определить, какие пациенты нуждаются в лечении наиболее срочно.
Используя анонимные записи 251 000 посещений отделений неотложной помощи для взрослых (ED), исследователи из Калифорнийского университета в Сан-Франциско оценили, насколько хорошо модель искусственного интеллекта смогла извлечь симптомы из клинических записей пациентов, чтобы определить необходимость немедленного лечения. Затем они сравнили анализ искусственного интеллекта с оценками пациентов по Индексу тяжести чрезвычайных ситуаций, шкале от 1 до 5, которую медсестры отделения неотложной помощи используют, когда пациенты прибывают, чтобы распределить помощь и ресурсы в соответствии с наибольшей потребностью. Этот процесс известен как сортировка.
Данные пациентов были отделены от их реальных личностей (обезличены) для исследования, которое было опубликовано 7 мая в JAMA Network Open . Исследователи оценили данные с помощью модели большого языка ChatGPT-4 (LLM), получив доступ к ним через безопасную генеративную платформу искусственного интеллекта UCSF, которая имеет широкие возможности защиты конфиденциальности.
Исследователи проверили эффективность LLM на выборке из 10 000 подобранных пар (всего 20 000 пациентов), среди которых был один пациент с серьезным заболеванием, например, инсультом, и другой с менее неотложным состоянием, например, сломанным запястьем. Учитывая только симптомы пациентов, ИИ смог определить, у какого пациента отделения неотложной помощи из пары было более серьезное состояние в 89% случаев.
В подвыборке из 500 пар, которые оценивались врачом и LLM, ИИ был прав в 88% случаев по сравнению с 86% для врача.
Помощь ИИ в процессе сортировки может высвободить критически важное время врача для лечения пациентов с наиболее серьезными заболеваниями, а также предложить резервные инструменты принятия решений для врачей, которые манипулируют множеством срочных запросов.
«Представьте себе двух пациентов, которых нужно доставить в больницу, но есть только одна скорая помощь. Или врач на вызове, и ей одновременно звонят три человека, и она должна определить, кому ответить первым», — сказала она. ведущий автор Кристофер Уильямс, MB, BChir, постдокторант UCSF в Институте вычислительных медицинских наук Бакара.
Не совсем готов к прайм-тайму
Это исследование является одним из немногих, в котором оценивается LLM с использованием реальных клинических данных , а не смоделированных сценариев, и является первым, в котором для этой цели используется более 1000 клинических случаев. Это также первое исследование, в котором используются данные посещений отделения неотложной помощи , где существует широкий спектр возможных заболеваний.
Несмотря на успех в этом исследовании, Уильямс предупредил, что ИИ не готов ответственно использовать в отделениях неотложной помощи без дальнейшей проверки и клинических испытаний.
«Здорово показать, что ИИ может делать крутые вещи, но важнее всего учитывать, кому эта технология помогает, а кому мешает», — сказал Уильямс. «Является ли просто возможность что-то сделать барьером для использования ИИ или это способность делать что-то хорошо для всех типов пациентов?»
Одним из важных вопросов, которые необходимо решить, является то, как устранить предвзятость модели. Предыдущие исследования показали, что эти модели могут закреплять расовые и гендерные предубеждения в сфере здравоохранения из-за предвзятости в данных, используемых для их обучения. Уильямс сказал, что прежде чем эти модели можно будет использовать, их необходимо будет модифицировать, чтобы устранить эту предвзятость.
«Сначала нам нужно знать, работает ли это, и понять, «как» это работает, а затем быть осторожными и обдуманными в том, как это применять», — сказал Уильямс. «Предстоящая работа будет посвящена тому, как лучше всего использовать эту технологию в клинических условиях».