Русские ученые из НИУ ВШЭ приняли непосредственное участие в разработке программы для оперативного выявления педофилов в web-сети. В частности это касается чатов.
Новейшую программу, информирует pr-служба НИУ ВШЭ, уже начали использовать полицейские Амстердама.
Материалами для анализа послужила широкая коллекция текстов.
Разработкой начальных данных, необходимых для последующего анализа, а кроме этого прикладными вопросами занимались специалисты криминальной милиции.
Отбирались подозрительные слова и словосочетания. Эти слова были занесены в специальную базу, куда также были добавлены все их вероятные словоформы, включая сокращения, искажения, ошибочные написания, сленг и т. д. В итоге были выявлены признаки, по которым в интернет-чатах можно довольно просто «вычислять» педофилов.
Программа работает по следующему принципу: вначале в базу заносят некие тексты, в которых выделяются главные слова. После система создает объектно-признаковое описание этих данных и на его визуализации видно, какие темы поднимались в любом сеансе общения между пользователями, что дает возможность аналитику быстро делать выводы о потенциальной опасности пользователя.
Программное обеспечение было протестировано эмпирически, а результаты описаны в серии научных статей.