Фейковые новости в социальных сетях становятся все более распространенными и все более сложными для обнаружения. Это происходит благодаря все более мощному искусственному интеллекту (ИИ) и сокращению ресурсов проверки фактов основными платформами.
Это особенно тревожно во время выборов, когда местные и международные субъекты могут использовать изображения, текст, аудио- и видеоконтент для распространения дезинформации.
Однако, так же как ИИ и алгоритмы могут распространять фейковые новости, их можно использовать и для их обнаружения. Исследователи из Школы инженерии и компьютерных наук имени Джины Коди в Concordia разработали новый подход к выявлению фейковых новостей. И они говорят, что он сможет находить скрытые закономерности, которые показывают, является ли конкретный элемент фейковым или нет.
Модель, названная SmoothDetector, объединяет вероятностный алгоритм с глубокой нейронной сетью. Она разработана для захвата неопределенностей и ключевых закономерностей в общих скрытых представлениях текстов и изображений в мультимодальной обстановке. Модель использует аннотированные текстовые и графические данные из американской платформы социальных сетей X и китайской Weibo для обучения. В настоящее время исследователи ищут способы в конечном итоге включить функции для обнаружения поддельного аудио- и видеоконтента, а также использовать все средства для противодействия дезинформации.
«SmoothDetector способен выявлять сложные закономерности из аннотированных данных, сочетая выразительную силу глубокого обучения со способностью вероятностного алгоритма количественно оценивать неопределенность, в конечном итоге предоставляя уверенный прогноз о подлинности предмета», — говорит кандидат наук Акинлолу Оджо. Он описывает модель в журнале IEEE Access.
Одной из сложностей, которую изучает модель, является тон. Позиционное кодирование дает модели возможность изучать значение определенного слова по отношению к другим в предложении, обеспечивая его связность с предложением. Та же техника используется на изображениях.
«Инновация нашей модели заключается в ее вероятностном подходе», — говорит Оджо.
Изучение возможной двусмысленности
SmoothDetector строится на существующих, хотя и относительно новых, мультимодальных моделях обнаружения фейковых новостей, объясняет Оджо. Более ранние модели могли проверять только один режим за раз — текст, изображение, аудио или видео, а не все режимы поста одновременно. Это означало, что пост с фейковым текстом, но точной фотографией мог быть помечен как ложноположительный или ложноотрицательный.
Это может создать дополнительную путаницу, особенно в отношении срочных новостей, когда большие объемы информации генерируются быстро и могут быть противоречивыми.
«Мы хотели зафиксировать эти неопределенности, чтобы убедиться, что мы не делаем простого суждения о том, является ли что-то поддельным или реальным», — говорит Оджо. «Вот почему мы работаем с вероятностной моделью. Она может отслеживать или контролировать суждение модели глубокого обучения. Мы не просто полагаемся на прямую закономерность в информации».
SmoothDetector получил свое название от сглаживания распределения вероятностей результата: вместо того, чтобы напрямую решать, является ли фрагмент контента поддельным или реальным, он оценивает присущую данным неопределенность и количественно определяет вероятность, чтобы сгладить вероятность, предлагая более детальное суждение о подлинности элемента.
«Это делает его более универсальным для сбора как положительной, так и отрицательной информации или корреляции», — добавляет он.
Оджо говорит, что, хотя необходимо проделать большую работу, чтобы сделать модель по-настоящему мультимодальной и способной анализировать аудио- и визуальные данные, ее можно переносить на другие платформы, помимо X и Weibo.
В подготовке данной статьи принимали участие профессор Института информационных систем Конкордия Низар Бугила, а также доцент Фатма Наджар, доктор философии, 22 года, из Колледжа уголовного правосудия Джона Джея, а также доценты Нуха Замзами, доктор философии, 20 лет, и Ханен Химди из Университета Джидды в Саудовской Аравии.