Искусственный интеллект Google должен помочь повысить качество связи при видеозвонках. Он заполнит возникающие прерывания

Google предложил способ убрать возникающие из-за плохого качества связи артефакты речи собеседника (булькание, заикание). Они происходят из-за выпадения некоторых пакетов данных во время передачи. Достроить недостающие фрагменты и сделать речь более приемлемой предполагается при помощи искусственного интеллекта WaveNetEQ, пишет BBC

В Google говорят, что в 99% звонков через разработанный им видеочат Duo возникают какие-то проблемы с речью. Из них 20% теряют около 3% аудио. Примерно 10% звонков теряют десятую часть аудио. 

Нейросеть WaveNetEQ будет использовать библиотеку речевых данных для заполнения коротких промежутков в словах человека. Искусственный интеллект натренирован преимущественно на слоги, максимальная длительность такого фрагмента составляет до 120 миллисекунд. Для тренировки использовались голоса 100 человек на 48 языках. 

Функция дополнения пропавших фрагментов речи при звонке доступна на смартфонах Google Pixel 4. В будущем ее планируется расширить на другие гаджеты Android.

Евгений Барилюк
Комментарии
Последние новости