CEO do Google DeepMind diz que seu próximo algoritmo irá destruir o ChatGPT
O Gemini ainda está em desenvolvimento, um processo que levará vários meses, diz Hassabis
Fonte: https://www.wired.com/story/google-deepmind-demis-hassabis-chatgpt/
Em 2016, um programa de inteligência artificial chamado AlphaGo, do laboratório de IA DeepMind do Google, fez história ao derrotar um campeão do jogo de tabuleiro Go. Agora, Demis Hassabis, cofundador e CEO da DeepMind, diz que seus engenheiros estão usando técnicas do AlphaGo para criar um sistema de IA chamado Gemini, que será mais capaz do que o que está por trás do ChatGPT da OpenAI.
O Gemini da DeepMind, que ainda está em desenvolvimento, é um grande modelo de linguagem que trabalha com texto e é semelhante em natureza ao GPT-4, que alimenta o ChatGPT. Mas Hassabis diz que sua equipe combinará essa tecnologia com técnicas usadas no AlphaGo, com o objetivo de dar ao sistema novas capacidades, como planejamento ou a capacidade de resolver problemas.
"Em um nível alto, você pode pensar no Gemini como combinando algumas das forças dos sistemas do tipo AlphaGo com as incríveis capacidades de linguagem dos grandes modelos", diz Hassabis. "Também temos algumas novas inovações que vão ser bastante interessantes." O Gemini foi apresentado pela primeira vez na conferência de desenvolvedores do Google no mês passado, quando a empresa anunciou uma série de novos projetos de IA.
O AlphaGo foi baseado em uma técnica que a DeepMind foi pioneiro na chamada aprendizado por reforço, na qual o software aprende a lidar com problemas difíceis que exigem a escolha de quais ações tomar, como no Go ou em videogames, fazendo tentativas repetidas e recebendo feedback sobre seu desempenho. Ele também usou um método chamado busca em árvore para explorar e lembrar possíveis movimentos no tabuleiro. O próximo grande salto para os modelos de linguagem pode envolver a realização de mais tarefas na internet e nos computadores.
O Gemini ainda está em desenvolvimento, um processo que levará vários meses, diz Hassabis. Pode custar dezenas ou centenas de milhões de dólares. Sam Altman, CEO da OpenAI, disse em abril que a criação do GPT-4 custou mais de 100 milhões de dólares.
Correndo Atrás
Quando o Gemini estiver completo, ele poderá desempenhar um papel importante na resposta do Google à ameaça competitiva representada pelo ChatGPT e outras tecnologias de IA gerativas. A empresa de busca foi pioneiro muitas técnicas que possibilitaram o recente dilúvio de novas ideias de IA, mas optou por desenvolver e implantar produtos com base nelas com cautela.
Desde a estreia do ChatGPT, o Google lançou seu próprio chatbot, Bard, e colocou a IA generativa em seu mecanismo de busca e em muitos outros produtos. Para impulsionar a pesquisa em IA, a empresa em abril uniu a unidade DeepMind de Hassabis com o principal laboratório de IA do Google, Brain, para criar o Google DeepMind. Hassabis diz que a nova equipe reunirá duas potências que foram fundamentais para o recente progresso da IA. "Se você olhar para onde estamos na IA, eu argumentaria que 80 ou 90 por cento das inovações vêm de um ou do outro", diz Hassabis. "Há coisas brilhantes que foram feitas por ambas as organizações na última década."
Hassabis tem experiência em navegar por corridas do ouro de IA que agitam os gigantes da tecnologia - embora da última vez ele mesmo tenha provocado a frenesi.
Em 2014, a DeepMind foi adquirida pelo Google após demonstrar resultados impressionantes de um software que usava aprendizado por reforço para dominar videogames simples. Nos anos seguintes, a DeepMind mostrou como a técnica faz coisas que antes pareciam exclusivamente humanas - muitas vezes com habilidade sobre-humana. Quando o AlphaGo derrotou o campeão de Go, Lee Sedol, em 2016, muitos especialistas em IA ficaram chocados, porque acreditavam que levaria décadas para as máquinas se tornarem proficientes em um jogo de tamanha complexidade.
Novo Pensamento
Treinar um grande modelo de linguagem como o GPT-4 da OpenAI envolve alimentar grandes quantidades de texto curado de livros, páginas da web e outras fontes em um software de aprendizado de máquina conhecido como transformador. Ele usa os padrões desses dados de treinamento para se tornar proficiente em prever as letras e palavras que devem seguir um pedaço de texto, um mecanismo simples que se mostra surpreendentemente poderoso para responder perguntas e gerar texto ou código.
Um passo adicional importante na criação do ChatGPT e de modelos de linguagem igualmente capazes é usar o aprendizado por reforço baseado no feedback dos humanos sobre as respostas de um modelo de IA para aprimorar seu desempenho. A profunda experiência da DeepMind com o aprendizado por reforço pode permitir que seus pesquisadores dêem ao Gemini capacidades inovadoras.
Hassabis e sua equipe também podem tentar aprimorar a tecnologia de grandes modelos de linguagem com ideias de outras áreas de IA. Os pesquisadores da DeepMind trabalham em áreas que vão desde robótica até neurociência, e no início desta semana a empresa demonstrou um algoritmo capaz de aprender a realizar tarefas de manipulação com uma ampla gama de diferentes braços de robô.
Aprender com a experiência física do mundo, como humanos e animais fazem, é amplamente esperado para ser importante para tornar a IA mais capaz. O fato de os modelos de linguagem aprenderem sobre o mundo indiretamente, através do texto, é visto por alguns especialistas em IA como uma grande limitação.
Futuro Incerto
Hassabis tem a tarefa de acelerar os esforços de IA do Google enquanto também gerencia riscos desconhecidos e potencialmente graves. Os recentes e rápidos avanços nos modelos de linguagem fizeram muitos especialistas em IA - incluindo alguns que estão construindo os algoritmos - preocupados com a possibilidade de a tecnologia ser usada para fins malévolos ou se tornar difícil de controlar. Alguns insiders da tecnologia até pediram uma pausa no desenvolvimento de algoritmos mais poderosos para evitar a criação de algo perigoso.
Hassabis diz que os benefícios potenciais extraordinários da IA - como para a descoberta científica em áreas como saúde ou clima - tornam imperativo que a humanidade não pare de desenvolver a tecnologia. Ele também acredita que a imposição de uma pausa é impraticável, pois seria quase impossível de impor. "Se feito corretamente, será a tecnologia mais benéfica para a humanidade de todos os tempos", diz ele sobre a IA. "Temos que ir atrás dessas coisas de forma ousada e corajosa."
Isso não significa que Hassabis defende que o desenvolvimento da IA prossiga de forma precipitada. A DeepMind tem explorado os riscos potenciais da IA desde antes do ChatGPT aparecer, e Shane Legg, um dos cofundadores da empresa, liderou um grupo de "segurança da IA" dentro da empresa por anos. Hassabis se juntou a outras figuras de alto perfil da IA no mês passado ao assinar uma declaração alertando que a IA pode algum dia representar um risco comparável à guerra nuclear ou a uma pandemia.
Um dos maiores desafios agora, diz Hassabis, é determinar quais são os riscos prováveis de uma IA mais capaz. "Acho que mais pesquisas pelo campo precisam ser feitas - muito urgentemente - em coisas como testes de avaliação", diz ele, para determinar quão capazes e controláveis são os novos modelos de IA. Nesse sentido, ele diz, a DeepMind pode tornar seus sistemas mais acessíveis a cientistas externos. "Gostaria de ver a academia ter acesso antecipado a esses modelos de fronteira", diz ele - um sentimento que, se seguido, poderia ajudar a abordar as preocupações de que especialistas fora das grandes empresas estão sendo excluídos da pesquisa mais recente em IA.
Quão preocupado você deveria estar? Hassabis diz que ninguém realmente sabe ao certo que a IA se tornará um grande perigo. Mas ele tem certeza de que, se o progresso continuar no ritmo atual, não haverá muito tempo para desenvolver salvaguardas. "Eu posso ver os tipos de coisas que estamos construindo na série Gemini, e não temos motivo para acreditar que elas não funcionarão", diz ele.