Программа Tacotron 2 от Google способна синтезировать речь, максимально приближенную к человеческой.
Работа Tacotron 2 строится по принцип нейронной сети. Она называется Tacotron 2 и служит для преображения текста в речь.
Речь, сгенерированная программой, изменяется зависимо от пунктуации.
В основе технологии — две нейросети глубокого обучения.
Система восприятия текста и передачи в звук 2-го поколения основана на нейронных сетях.
Google занимается разработкой систем синтеза человеческой речи довольно давно. Тем не менее, ИИ уже отличает строчные буквы от заглавных, и в случае, ежели то либо иное слово в тексте выделено большими буквами, при прочтении он сделает на нем дополнительный акцент. Данная технология, скорее всего, сразу начнет использоваться в продуктах компании. В следствии этого синтезированная речь почти не отличается от настоящей. Средняя оценка аудио, приобретенных при помощи Tacotron2, составила 4,53. Авторы сервиса Tacotron 2 утверждают, что новинка дает возможность озвучивать слова и интонации звуком, который нереально отличить от человеческого. Для сравнения, человеческая речь была оценена теми же людьми в среднем в 4,58 балла, а прошлая версия Tacotron — в 4,001.