Pesquisadores da NYU Desenvolvem Nova Técnica de IA para Alterar a Aparência da Idade de uma Pessoa em Imagens
As Características Únicas de Identificação foram mantidas
Sistemas de IA estão sendo cada vez mais empregados para estimar e modificar com precisão as idades dos indivíduos por meio da análise de imagem. Construir modelos robustos para variações de envelhecimento requer uma grande quantidade de dados e conjuntos de dados longitudinais de alta qualidade, que são conjuntos de dados contendo imagens de um grande número de indivíduos coletados ao longo de vários anos.
Numerosos modelos de IA foram projetados para realizar tais tarefas; no entanto, muitos enfrentam desafios ao manipular efetivamente o atributo da idade, preservando a identidade facial do indivíduo. Esses sistemas enfrentam o desafio típico de reunir um grande conjunto de dados de treinamento composto por imagens que mostram pessoas individuais ao longo de muitos anos.
Os pesquisadores da NYU Tandon School of Engineering desenvolveram uma nova técnica de inteligência artificial para alterar a aparência da idade de uma pessoa em imagens, garantindo a preservação da identidade biométrica única do indivíduo.
Os pesquisadores treinaram o modelo com um pequeno conjunto de imagens de cada indivíduo. Além disso, eles usaram uma coleção separada de imagens com legendas indicando a categoria de idade da pessoa: criança, adolescente, jovem adulto, meia-idade, idoso ou velho. O conjunto de imagens inclui imagens de celebridades capturadas ao longo de suas vidas, enquanto as imagens legendadas explicam a relação entre imagens e idade para o modelo. Posteriormente, o modelo treinado tornou-se aplicável para simular cenários de envelhecimento ou rejuvenescimento, realizados especificando uma idade-alvo desejada por meio de um prompt de texto. Esses prompts de texto orientam o modelo no processo de geração de imagem.
Os pesquisadores usaram um modo de difusão latente pré-treinado, um pequeno conjunto de 20 imagens de treinamento do rosto de um indivíduo (para aprender as informações específicas da identidade do indivíduo) e um pequeno conjunto auxiliar de 600 pares de imagem-legenda (para entender a associação entre uma imagem e sua legenda).
Eles usaram funções de perda apropriadas para ajustar o modelo. Também adicionaram e removeram variações ou perturbações aleatórias nas imagens. Além disso, os pesquisadores usaram uma técnica "DreamBooth" para manipular imagens faciais humanas por meio de um processo de transformação gradual e controlado, facilitado por uma fusão de componentes de rede neural.
Eles avaliaram a precisão do modelo em comparação com técnicas alternativas de modificação de idade. Para realizar essa avaliação, 26 voluntários foram encarregados de associar a imagem gerada com uma fotografia real do mesmo indivíduo. Além disso, eles estenderam a comparação ao uso do ArcFace, um algoritmo de reconhecimento facial proeminente. Os resultados revelaram que seu método exibiu desempenho superior, superando o desempenho de outras técnicas, resultando em uma redução de até 44% na frequência de rejeições incorretas.
Os pesquisadores descobriram que, quando o conjunto de dados de treinamento tem imagens da categoria de meia-idade, as imagens geradas representam efetivamente uma variedade diversificada de grupos etários. Além disso, suponha que o conjunto de treinamento tivesse imagens principalmente de idosos. Nesse caso, o modelo enfrenta desafios ao tentar gerar imagens que caem nos extremos opostos do espectro, como a categoria de criança. Além disso, as imagens geradas demonstram uma boa capacidade de transformar as imagens de treinamento em grupos etários mais velhos, particularmente para homens em comparação com mulheres. Essa discrepância pode surgir da inclusão de maquiagem nas imagens de treinamento. Por outro lado, variações em etnia ou raça não produziram efeitos notáveis e distinguíveis nos resultados gerados.
Confira o artigo. Todo o crédito por esta pesquisa vai para os pesquisadores deste projeto. Além disso, não se esqueça de se juntar ao nosso SubReddit de ML com mais de 29k membros, Comunidade do Facebook com mais de 40k membros, Canal Discord e Boletim Informativo por e-mail, onde compartilhamos as últimas notícias de pesquisa em IA, projetos interessantes de IA e muito mais.
RACHIT RANJAN
Rachit Ranjan é estagiário de consultoria na MarktechPost. Atualmente, ele está cursando seu B.Tech no Indian Institute of Technology (IIT) Patna. Ele está moldando ativamente sua carreira no campo da Inteligência Artificial e Ciência de Dados e é apaixonado e dedicado a explorar esses campos.