Китайская нейросеть «Уши» научилась распознавать 120 диалектов китайского языка в реальном времени

Прочитано: 27 раз(а)


Компания iFlytek 1 июня 2026 года анонсировала новую версию своей системы распознавания речи, способную работать со 120 региональными диалектами китайского языка в режиме реального времени. Это прорыв, который решает многолетнюю проблему: официальный путунхуа понимают почти все жители КНР, но в быту многие продолжают говорить на местных наречиях, зачастую совершенно не похожих на литературную норму.

Обучение нейросети велось на колоссальном массиве аудиоданных: в течение нескольких лет добровольцы из всех провинций Китая записывали образцы своей речи. Параллельно лингвисты вручную размечали эти записи, сопоставляя произношение диалектных слов с их значениями и иероглифическим написанием. Результатом стала модель, способная мгновенно переводить разговорную речь с кантонского, шанхайского, фуцзяньского и десятков других наречий на литературный путунхуа и обратно. Система уже внедряется в государственные медицинские учреждения, где пожилые пациенты часто не владеют нормативным языком, и в банковские колл-центры. В перспективе iFlytek планирует применить ту же технологию для распознавания диалектов хинди и арабского языка.

Система распознавания лиц от Amazon перепутала конгрессменов США с злоумышленниками



Новости партнеров