OpenAI revelou uma nova ferramenta que recria a voz de uma pessoa com apenas 15 segundos de áudio gravado.

Chamado de Voice Engine, o modelo grava um único clipe de 15 segundos para aprender a voz da pessoa e como ela fala. A partir daí, os usuários podem inserir texto para que ele diga o que quiserem com vozes realistas que incluem emoção. A empresa disse que desenvolveu o Voice Engine em 2022 e o usou em vozes predefinidas, mas esta é a primeira vez que se discute a utilização da voz real de uma pessoa. A OpenAI também reconheceu em uma postagem no blog na sexta-feira (29 de março) as implicações óbvias e potencialmente maliciosas.



Fuente