Разработана автоматическая система извлечения информации из научных статей о COVID-19

Исследователи из UPV/EHU-Университета Страны Басков, UNED (Национального университета дистанционного образования) и Elhuyar создали систему VIGICOVID благодаря Supera COVID-19 (Преодоление COVID-19), финансируемой CRUE (Ассоциация испанских университетов). ). Эта система удовлетворяет потребность в поиске ответов в лавине информации, генерируемой всеми исследованиями, проводимыми по всему миру в связи с пандемией. С помощью искусственного интеллекта система упорядоченно отображает ответы, найденные в наборе научных статей, и использует вопросы и ответы на естественном языке.

Мировое исследовательское сообщество в области биомедицины прилагает огромные усилия для получения знаний о COVID-19 и SARS-CoV-2. На практике эти усилия означают огромное и очень быстрое производство научных публикаций, что затрудняет просмотр и анализ всей информации. Вот почему эксперты и органы, принимающие решения, должны быть обеспечены информационными системами , чтобы они могли получать необходимые им знания.

В новом исследовании при координации исследовательской группы UNED исследователи создали прототип для извлечения информации с помощью вопросов и ответов на естественном языке из обновленного набора научных статей о COVID-19 и SARS-CoV-2, опубликованных глобальным исследовательское сообщество.

«Парадигма поиска информации меняется благодаря искусственному интеллекту », — сказал Энеко Агирре, руководитель центра HiTZ UPV/EHU. «До сих пор при поиске информации в Интернете вводится вопрос, и ответ приходится искать в документах, отображаемых системой. читать весь документ становятся все более и более распространенными».

В этой системе «пользователь не запрашивает информацию с помощью ключевых слов, а задает вопрос напрямую», — объяснил исследователь из Эльхуяра Ксабьер Саралеги. Система ищет ответы на этот вопрос в два этапа: «Во-первых, она извлекает документы, которые могут содержать ответ на заданный вопрос, используя технологию, которая сочетает ключевые слова с прямыми вопросами. Вот почему мы исследовали нейронные архитектуры», — добавил доктор. Саралеги. Использовались глубокие нейронные архитектуры с примерами: «Это означает, что модели поиска и модели ответов на вопросы обучаются с помощью глубокого машинного обучения».

После извлечения набора документов они повторно обрабатываются с помощью системы вопросов и ответов, чтобы получить конкретные ответы: «Мы создали механизм, который отвечает на вопросы; когда механизм получает вопрос и документ, он может чтобы определить, есть ли ответ в документе, и если он есть, он точно сообщает нам, где он находится», — пояснил д-р Агирре.

Готовый к продаже прототип

«Из методов и оценок, которые мы проанализировали в наших экспериментах, мы выбрали те, которые дают прототипу наилучшие результаты», — сказал исследователь из Эльхуяра. Создана солидная технологическая база, опубликовано несколько научных работ по данной теме. «Мы придумали другой способ запуска поиска всякий раз, когда информация срочно нужна, и это облегчает процесс использования информации. На уровне исследований мы показали, что предложенная технология работает и что система дает хорошие результаты», — Агирре. указал.

«Наш результат — прототип фундаментального исследовательского проекта. Это не коммерческий продукт», — подчеркнул Саралеги. Но такие прототипы можно легко смоделировать за короткое время, а значит, их можно продать и сделать доступными для общества. Эти исследователи подчеркивают, что искусственный интеллект позволяет сделать доступными все более мощные инструменты для работы с большими базами документов. «Мы делаем очень быстрые успехи в этой области. Более того, все, что исследуется, может легко попасть на рынок», — заключил исследователь UPV/EHU.