Spotify introduz tradução de podcast com replicação de voz através da OpenAI
A empresa fez parceria com um punhado de podcasters para traduzir seus episódios em inglês para o espanhol com sua nova ferramenta
Fonte: https://www.theverge.com/2023/9/25/23888009/spotify-podcast-translation-voice-replication-open-ai
E se os podcasters pudessem acionar um interruptor e instantaneamente falar outro idioma? Essa é a premissa por trás do novo recurso de tradução de voz alimentado por IA do Spotify, que reproduz podcasts em outros idiomas usando a própria voz do podcaster.
A empresa fez parceria com um punhado de podcasters para traduzir seus episódios em inglês para o espanhol com sua nova ferramenta, e tem planos de lançar traduções em francês e alemão nas próximas semanas. O primeiro lote de episódios virá de alguns nomes de peso, incluindo Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons e Steven Bartlett. O Spotify planeja expandir o grupo para incluir "The Rewatchables" do The Ringer e seu próximo programa com Trevor Noah.
Aqui está uma das traduções do Spotify em um episódio do programa de Fridman:
A espinha dorsal do recurso de tradução é a ferramenta de transcrição de voz Whisper da OpenAI, que pode transcrever a fala em inglês e traduzir outros idiomas para o inglês. Mas a ferramenta do Spotify vai além da tradução de fala para texto — o recurso traduzirá um podcast para um idioma diferente e o reproduzirá em uma versão sintetizada da própria voz dos podcasters.
"Ao combinar a própria voz do criador, a Tradução de Voz oferece aos ouvintes de todo o mundo o poder de descobrir e ser inspirados por novos podcasters de uma maneira mais autêntica do que nunca", disse Ziad Sultan, vice-presidente de personalização do Spotify, em um comunicado.
É provável que a OpenAI esteja por trás da parte de replicação de voz deste novo recurso também. A empresa de IA está fazendo alguns anúncios nesta manhã, incluindo o lançamento de uma ferramenta que pode criar "áudio semelhante ao humano a partir de apenas texto e alguns segundos de fala amostral". A OpenAI diz que está limitando intencionalmente quão amplamente esta ferramenta estará disponível devido a preocupações com segurança e privacidade.
Isso provavelmente faz parte da razão pela qual o Spotify diz que a tecnologia de tradução está sendo testada apenas com um "grupo selecionado" de podcasters por enquanto. A empresa não elaborou sobre quão amplamente planeja disponibilizar a ferramenta ou quando esperar uma expansão.
Atualização de 25 de setembro, 8:55 da manhã (horário de Brasília): Atualizado com o grupo inicial de podcasters usando a ferramenta; O Spotify também disse inicialmente que os episódios em francês estariam disponíveis hoje, mas agora eles virão mais tarde.