• Герман Зубов

Использование нейросети для имитации голоса

Обновлено: авг. 21

Действительно, американским разработчикам удалось сделать правдоподобную имитацию чужого голоса. И если речь будет передаваться по каналам IP-телефонии или мобильной связи GSM, обнаружить подделку рядовому эксперту будет крайне сложно.

На рисунках представлены результаты сравнения фонограмм естественной и искусственной речи студийного качества.

спектрально-формантный анализ
анализ основного тона

Эксперт (Полина Зубова) обнаружила следующее. Голоса различаются на аудитивном уровне: сдавленный (голос 1) и свободный (голос 2); голос выше среднего (голос 1) и голос средний (голос 2). Различается ритмика речи (рваная, переменная у голоса 1 и ритмичная у голоса 2). У голоса 1 отмечаются оговорки, неполное произнесение с последующим повтором, естественная сбивчивость речи. У голоса 2 таких «сбоев» нет. У голоса 1 в незаполненных паузах прослушивается дыхание, у голоса 2 – нет. Различен характер придыхания: у голоса 1 он выражен ярче.

Просмотров: 2Комментариев: 0

Недавние посты

Смотреть все