Segundo a revista Galileu, o perigo está no aumento de fakenews de celebridades, políticos e autoridades
Engenheiros da empresa sul-coreana Samsung desenvolveram deepfakes – vídeos realistas com expressões de outras pessoas – que podem ser gerados a partir de uma única imagem, de modo que a inteligência artificial pode até colocar palavras na boca da pintura de Mona Lisa, por exemplo.
A tecnologia poderia ser usada para criar uma versão ultrarrealista de si mesmo em realidade virtual, mas também preocupa por causa da possibilidade de gerar vídeos que poderiam ser usados para disseminar mentiras de políticos e celebridades em qualquer lugar do mundo, conforme publicou a revista Galileu.
Os novos algoritmos, desenvolvidos por uma equipe do Centro de Inteligência Artificial da Samsung e do Instituto Skolkovo de Ciência e Tecnologia, ambos localizados na cidade russa de Moscou, funcionam melhor se houver uma variedade de fotos tiradas em ângulos diferentes.
“Essa capacidade tem aplicações práticas para telepresença, incluindo videoconferência e jogos multiplayer, bem como a indústria de efeitos especiais”, escrevem os pesquisadores em artigo publicado no arXiv.org.
O sistema funciona treinando uma série de características faciais que podem ser manipuladas. O treinamento foi realizado com um banco de dados com mais de 7 mil imagens de celebridades, chamado VoxCeleb, além vídeos de pessoas interagindo com a câmera. A tecnologia ensina a rede neural a converter as características faciais de referência em um vídeo com aparência realística.
Como outras ferramentas de geração de rosto orientadas por inteligência artificial, a última etapa do processo verifica o “realismo perfeito”: todos os quadros que parecem estranhos ou não naturais são cortados e renderizados novamente, deixando um vídeo final com melhor qualidade.
Essa técnica consegue superar dois problemas em rostos falantes gerados artificialmente: a complexidade das cabeças (com bocas, cabelos, olhos, etc.) e a capacidade de identificar facilmente uma cabeça falsa (rostos dos personagens são um dos elementos mais difíceis para designers de videogame acertar, por exemplo).
O sistema tende a melhorar à medida que os algoritmos são aprimorados e os modelos de treinamento se tornam mais eficientes. Os cientistas acreditam que em breve a tecnologia será inteligente o suficiente para produzir performances totalmente realistas a partir de apenas algumas fotografias em tempo recorde.