В России разработаны прорывные программные комплексы для работы со звуком

Прочитано: 178 раз(а)


В Научно-образовательном центре «Безопасность интеллектуальных киберфизических систем» (НОЦ «БИКС») НИЯУ МИФИ создан уникальный софт, предназначенный для обработки звуковых сигналов.

«Цифровая шумоочистка искаженных фонограмм» – программный комплекс, позволяющий очищать зашумленный сигнал от различного рода сложных помех, таких как речевой хор, то есть выделять на записи слабослышимый или перекрываемый голос. Системы, существующие на сегодняшний день и работающие в автоматическом режиме, могут только убрать «слабые» голоса и выделить «сильный».

Разработка НИЯУ МИФИ позволяет не только выделить голос «на заднем плане», но и улучшить его качество – для этого ученые создали специальный алгоритм восстановления гармонической структуры человеческой речи, работающий, если известны хотя бы некоторые гармоники речи. Например, по первым двум низким гармоникам, имеющим самую высокую интенсивность (они находятся в диапазоне от 20 до 1 КгЦ), можно с помощью этого ПО восстановить всю речь и придать ей естественность.

Еще одна прорывная разработка ученых НИЯУ МИФИ – «Речевая подпись для защиты документов от подделок и фальсификаций». Известно, что классическая и электронная подписи уязвимы. Документ, подписанный ручкой, злоумышленник может позднее подредактировать, приписав, например, нужные ему цифры, так как в этом случае нет связи между защищаемым текстом, автором и подписью. Электронная подпись уже дает связь между защитой и текстом, но не дает связи между автором и защитой, так как злоумышленник может использовать чей-то токен для подписи документа. Речевая же подпись защищает документ полностью.

Чтобы создать речевую подпись, связывающую воедино автора, текст и защиту, человек проговаривает своим голосом основные моменты того документа, который он хочет защитить – сроки, суммы, обязанности сторон, даже весь документ целиком, если необходимо. Затем «подпись голосом» преобразуется в картинку, вставляется в конец документа и распознается с помощью ПО.

В речевую подпись также могут быть включены и другие биометрические данные спикера, измеренные с помощью «умных» часов – пульс, давление, температура. Это нужно, чтобы впоследствии можно было оценить психоэмоциональное состояние человека в момент подписания документа и исключить влияние внешних факторов – давления, угроз и т.д.

«Подделать голосовую подпись невозможно – для этого пришлось бы говорить голосом другого человека, но одной похожести будет недостаточно, а голос, сгенерированный специальными системами, прекрасно распознается техникой по определенным меткам. Это как в случае со сгенерированными картинами – с помощью специальных программ всегда можно установить оригинальная перед нами картина или созданная нейронной сетью, – объясняет Александр Алюшин, научный сотрудник Научно-образовательного центра «Безопасность интеллектуальных киберфизических систем» (НОЦ «БИКС») НИЯУ МИФИ. – Вообще, речевыми технологиями мы занимаемся уже 10 лет, мы вывели определенную закономерность при формировании речевого сигнала, исходя из которой и разработали эти алгоритмы».

Данные проекты представлены на стенде НИЯУ МИФИ на международном военно-техническом форуме «Армия-2023»

В России разработаны прорывные программные комплексы для работы со звуком



Новости партнеров