Компания iFlytek 1 июня 2026 года анонсировала новую версию своей системы распознавания речи, способную работать со 120 региональными диалектами китайского языка в режиме реального времени. Это прорыв, который решает многолетнюю проблему: официальный путунхуа понимают почти все жители КНР, но в быту многие продолжают говорить на местных наречиях, зачастую совершенно не похожих на литературную норму.
Обучение нейросети велось на колоссальном массиве аудиоданных: в течение нескольких лет добровольцы из всех провинций Китая записывали образцы своей речи. Параллельно лингвисты вручную размечали эти записи, сопоставляя произношение диалектных слов с их значениями и иероглифическим написанием. Результатом стала модель, способная мгновенно переводить разговорную речь с кантонского, шанхайского, фуцзяньского и десятков других наречий на литературный путунхуа и обратно. Система уже внедряется в государственные медицинские учреждения, где пожилые пациенты часто не владеют нормативным языком, и в банковские колл-центры. В перспективе iFlytek планирует применить ту же технологию для распознавания диалектов хинди и арабского языка.




