Microsoft apresenta VASA-1: IA que cria avatares realistas para videochamadas

0

A Microsoft revelou a VASA-1 (Video Avatar Speech Animation), uma nova tecnologia de inteligência artificial capaz de gerar avatares hiperrealistas para videochamadas.

Com apenas uma foto e um áudio de um minuto ou mais do usuário, a VASA-1 pode criar um deepfake em vídeo, dispensando a necessidade de uma webcam durante reuniões virtuais.

O sistema permite que o usuário personalize diversos aspectos do avatar gerado, como o nível de zoom, posição do rosto e até mesmo as expressões faciais. A Microsoft demonstrou vários exemplos da tecnologia em ação, embora tenha alertado que todas as pessoas nos vídeos eram imagens criadas por IA.

Embora impressionante, os vídeos de demonstração revelam alguns defeitos típicos de deepfakes e geração de vídeos por IA, como dentes crescendo de tamanho e orelhas se distorcendo levemente em certos momentos.

A VASA-1 foi projetada principalmente para permitir que usuários participem de videochamadas sem a necessidade de uma webcam. No entanto, ela também poderia ser usada para exibir um avatar realista em dias em que o usuário não deseja ativar sua câmera, seja por motivos de aparência ou privacidade.

Nos testes iniciais, a Microsoft relatou que o sistema consegue gerar vídeos offline a 45 quadros por segundo em um desktop com GPU RTX 4090. Para transmissões ao vivo, a taxa cai para 40 fps com uma latência de 170 ms.

A gigante de tecnologia não revelou uma data de lançamento para a VASA-1, mas é esperado que a tecnologia seja inicialmente integrada ao Microsoft Teams antes de ser disponibilizada para outras plataformas ou fornecedores por meio de uma API.

Embora impressionante, a tecnologia de deepfakes em vídeo ainda apresenta desafios e pode levantar preocupações éticas sobre seu uso indevido. No entanto, se implementada corretamente, a VASA-1 pode oferecer uma experiência de videochamada mais flexível e conveniente para os usuários.

Notícia anteriorDREX: a nova moeda digital do Brasil, vai vingar?
Próxima notíciaVozes Indígenas Ecoam nas Redes Sociais