Google представила технологию синхронного перевода устной речи Translatotron

Прочитано: 482 раз(а)


Такие каскадные системы, доведённые до совершенства, с триумфом используются во многих коммерческих технологиях устного перевода, включая Google Translate.

Google представила новейшую технологию синхронного перевода устной речи — Translatotron. Соответствующая информация приводится в блоге компании. Основное отличие Translatotron в том, что он пропускает этот этап и работает напрямую со звуком — система создаёт «слепок» начальной речи и преобразует ее. Голос переводчика Translate звучит слегка роботизировано, однако считывание и воспроизведение особенностей речи говорящего является настоящим прогрессом. Речь генерируется в новейшую спектрограмму на целевом языке, в итоге скорость и точность перевода вырастают.

Одной из основных особенностей Translatotron создатели называют возможность сохранения в переведённом отрезке вокальных характеристик (интонаций и пауз) говорящего, что делает его «более очевидным и наименее резким».

Тут можно послушать как звучит выполненный алгоритмом перевод с одного языка на другой. До этого Google объявил о планах обучить собственный метод распознавания голоса понимать слова людей, страдающих нарушениями речевого аппарата. Новый Translatotron дает не менее реальный перевод, чем базовая каскадная модель, подчеркнули в компании.

«Translatotron исключает разделение задачи на отдельные этапы, что дает несколько преимуществ перед каскадными системами», — сообщается в заявлении. Новый Translatotron промежуточные шаги пропускает и непосредственно переводит язык пользователя на другой.

Переведенная речь еще синтезируется и звучит несколько роботизированно, однако может продуктивно поддерживать некоторые субъекты голоса говорящего. Таким образом, при наличии достаточной вычислительной мощности Translatotron способен выполнять перевод быстрее. Первоначально речь должна быть интерпретирована машиной и расшифрована в текст, который после этого будет переведен на нужный язык, до того как поступить в механизм преображения текста в речь для произнесения его вслух.

Авторы полагаются, что их работа послужит отправной точкой для для последующих исследований машинных технологий прямого устного перевода.

Google представила технологию синхронного перевода устной речи Translatotron



Новости партнеров