Искусственный интеллект, разработанный для моделирования письменной речи, можно использовать для прогнозирования событий в жизни людей. Исследовательский проект DTU, Копенгагенского университета, ITU и Северо-Восточного университета в США показывает, что если использовать большие объемы данных о жизни людей и обучать так называемым «моделям-трансформерам», которые (например, ChatGPT) используются для обработки языка, они могут систематически организовывать данные и предсказывать, что произойдет в жизни человека, и даже оценивать время смерти.
В новой статье «Использование последовательности жизненных событий для прогнозирования человеческой жизни» опубликовано в журнале Nature Computational Science, исследователи проанализировали данные о состоянии здоровья и привязанность к рынку труда для 6 миллионов датчан в модели, получившей название life2vec.
После того, как модель прошла обучение на начальном этапе, т. е. изучила закономерности в данных, было показано, что она превосходит другие продвинутые нейронные сети и с высокой точностью прогнозировать такие результаты, как личность и время смерти.
«Мы использовали эту модель для решения фундаментального вопроса: в какой степени мы можем предсказать события вашего будущего на основе условий и событий вашего прошлого? С научной точки зрения нас волнует не столько сам прогноз, сколько аспекты данных, которые позволяют модели давать такие точные ответы», — сказал он. — говорит Суне Леманн, профессор DTU и первый автор статьи.
Предсказания времени смерти
Прогнозы Life2vec являются ответами на общие вопросы, такие как: «смерть в течение четырех лет»? Когда исследователи анализируют реакцию модели, результаты согласуются с существующими открытиями в области социальных наук; например, при прочих равных условиях люди, занимающие руководящую должность или имеющие высокий доход, имеют больше шансов выжить, в то время как мужчины, квалифицированные специалисты или имеющие психический диагноз связаны с более высоким риском смерти.
Life2vec кодирует данные в большую систему векторов — математическую структуру, которая упорядочивает различные данные. Модель решает, где разместить данные о времени рождения, учебе, образовании, зарплате, жилье и здоровье.
«Что интересно, так это рассматривать человеческую жизнь как длинную последовательность событий, подобно тому, как предложение в языке состоит из ряда слов. Обычно это тип задач, для решения которых используются модели-трансформеры в ИИ, но в наших экспериментах мы используем их для анализа того, что мы называем жизненными последовательностями, то есть событий, которые произошли в человеческой жизни», — говорит Суне Леманн.
Поднятие этических вопросов
Исследователи, стоящие за статьей, отмечают, что модель life2vec окружена этическими вопросами, такими как защита конфиденциальных данных, конфиденциальность и роль предвзятости в данных. Эти проблемы необходимо понять более глубоко, прежде чем модель можно будет использовать, например, для оценки риска заражения человека заболеванием или другими жизненными событиями, которые можно предотвратить.
«Модель открывает важные положительные и отрицательные перспективы для обсуждения и решения в политическом плане. Подобные технологии прогнозирования жизненных событий и поведения человека сегодня уже используются внутри технологических компаний, которые, например, отслеживают наше поведение в социальных сетях, чрезвычайно точно нас профилируют. и использовать эти профили, чтобы прогнозировать наше поведение и влиять на нас. Эта дискуссия должна стать частью демократического диалога, чтобы мы могли подумать, куда нас ведут технологии и хотим ли мы такого развития», — говорит Суне Леманн.
По мнению исследователей, следующим шагом будет включение других типов информации, таких как текст и изображения или информация о наших социальных связях. Такое использование данных открывает совершенно новое взаимодействие между социальными науками и науками о здравоохранении.