Российская компания «Яндекс» сообщила, что в Yandex SpeechKit добавили возможность распознавания и синтеза речи на узбекском языке. Yandex SpeechKit поможет в автоматизации колл-центров и речевой аналитики, а также в создании голосовых помощников.
Обучение проходило на предзаписи голоса реального диктора, всего для обучения модели разработчики создали датасет с тысячами часов аудио и их расшифровками. Нейросеть может синтезировать не только речь, но также и фонемную запись, в которой указаны особенности звучания в слове,— это поможет при произнесении сложных фамилий и заимствованных выражений.
Yandex SpeechKit учитывает и особенности узбекского языка, например звучание буквы «х». По словам директора по продуктам в YandexCloud Григория Атрепьева, «объем рынка речевых технологий в Узбекистане может достигать 395 млн минут обработанной речи в год». Узбекский является 16-м языком, с которым работает инструмент Yandex SpeechKit.