Стартап Sonantic, разрабатывающий голосовые технологию при помощи искусственного интеллекта, научил виртуальную актрису флиртовать, дразнить и говорить веселым голосом.
Качество голосов, генерируемых ИИ, в последние годы быстро улучшается. Однако, есть особенности человеческой речи, которые не поддаются компьютерной имитации. ИИ-актеры могут обеспечить плавную озвучку для рекламы или презентаций, но они не способны играть, передавать сложные эмоции и с чувством произнести фразу «Быть или не быть».
Стартап Sonantic совершил прорыв, научив синтетический голос некоторым особенностям человеческого голоса. Виртуальная актриса уже умеет кокетничать, дразнить и смеяться. Программистам удалось включить неречевые звуки в искусственный голос – это позволило сделать его более правдоподобным.
Новые алгоритмы Sonantic описывают как «Photoshop for voice». Интерфейс позволяет ввести необходимый текст, указать настроение и выбрать вариант синтетического голоса. Дальше программа все сделает самостоятельно.
Подобные инструменты все чаще вызывают споры по поводу этичности их использования. Эксперты опасаются, что в будущем дипфейки смогут манипулировать людьми и обманывать их чувства.