Como usar o ChatGPT para criar gráficos e tabelas
O ChatGPT faz um excelente trabalho na criação de gráficos e tabelas
Fonte: https://www.zdnet.com/article/how-to-use-chatgpt-to-make-charts-and-tables/#ftag=RSSbaffb68
Sabe o que me fascina? Gráficos e tabelas. Dê-me um gráfico interessante para analisar e fico irracionalmente feliz. Adoro assistir às notícias nas noites de eleição, não pelo número de votos, mas por todos os excelentes gráficos. Alterno entre os canais a noite toda para ver todas as possíveis maneiras que cada rede encontra para apresentar dados numéricos. Isso é estranho? Não acho que seja.
Como se vê, o ChatGPT faz um excelente trabalho na criação de gráficos e tabelas. E, dado que este onipresente chatbot de IA generativa pode sintetizar uma tonelada de informações em algo digno de gráfico, o que o ChatGPT perde em apresentação bonita, mais do que compensa em valor informativo.
Então, que tipo de ferramentas de criação de gráficos estão disponíveis para o ChatGPT? Existem três maneiras de prosseguir:
Você pode fazer tabelas (mas não gráficos) na versão gratuita do ChatGPT.
Você pode criar gráficos e tabelas usando o complemento Advanced Data Analysis (anteriormente "Code Interpreter") no ChatGPT Plus.
Você pode fazer tabelas usando o ChatGPT Plus e gráficos usando plugins aleatórios de gráficos.
Neste artigo, discutirei as duas primeiras opções, mas pularei a terceira. Embora existam vários plugins de gráficos para o ChatGPT Plus, todos eles o tiram da interface do ChatGPT e empregam serviços externos. Todos tentam cobrar uma taxa adicional para que você use seus serviços de gráficos baseados em SaaS. Basicamente, eles são listados na loja ChatGPT como anúncios, não como ferramentas funcionais prontas para uso. Além disso, tendem a ser muito pouco confiáveis.
Nota: O que o ChatGPT costumava chamar de "Code Interpreter" agora é chamado de "Advanced Data Analysis". Então, sempre que usávamos o termo Code Interpreter, agora passaremos a chamá-lo de Advanced Data Analysis.
O Advanced Data Analysis produz gráficos relativamente feios. Mas é incrível. Primeiro, vamos discutir de onde o ChatGPT obtém seus dados, depois faremos algumas tabelas.
COMO USAR O CHATGPT PARA FAZER GRÁFICOS E TABELAS
Anteriormente, falamos sobre quais ferramentas de gráficos estão disponíveis em quais versões do ChatGPT. Mas há mais do que simplesmente ferramentas de gráficos. Se você quer usar o ChatGPT produtivamente, precisa entender o que as várias edições podem fazer.
Versão gratuita do ChatGPT: Esta versão usa o modelo de linguagem GPT-3.5, que não é tão capaz quanto a versão GPT-4. Do ponto de vista dos dados, sua visão do conhecimento mundial termina em setembro de 2021. Você pode colar cerca de 1.500 palavras de dados no diálogo de chat, que ele é capaz de processar.
ChatGPT Plus com Advanced Data Analysis: Esta versão usa o modelo de linguagem GPT-4. Ele importará tabelas de dados em uma ampla variedade de formatos de arquivo. Embora não especifique um limite de tamanho para dados importados, ele pode lidar com arquivos bastante grandes, mas falhará se os arquivos excederem algum nível indefinido de complexidade. Sua visão do conhecimento mundial termina em setembro de 2021, mas você pode aumentar esse conhecimento carregando arquivos de dados.
ChatGPT com plugin WebPilot: Esta versão também usa o GPT-4 LLM. Basicamente, você pode executar Advanced Data Analytics ou plugins. Se você optar por executar plugins, o plugin WebPilot é bastante confiável quando se trata de pesquisas na web (embora falhe em grandes solicitações). Isso significa que o conhecimento mundial do ChatGPT não precisa terminar em 2021, mas geralmente pode se estender até a data atual.
ChatGPT Enterprise: Advanced Data Analytics e plugins também estão disponíveis na versão empresarial recém-anunciada. Você pode carregar arquivos no Enterprise e eles permanecerão confidenciais. O Enterprise também deve permitir arquivos maiores e respostas maiores. O preço ainda não foi especificado.
Vamos começar com um exemplo. Para a demonstração a seguir, trabalharemos com as cinco principais cidades em termos de população.
Liste as cinco principais cidades do mundo por população. Inclua o país.
Perguntei isso à versão gratuita do ChatGPT e aqui está o que recebi de volta:
Transformá-lo em uma tabela é simples. Basta dizer ao ChatGPT que você quer uma tabela:
Faça uma tabela das cinco principais cidades do mundo por população. Inclua o país.
Você pode manipular e personalizar uma tabela dando instruções mais detalhadas ao ChatGPT. Novamente, usando a versão gratuita, adicionaremos um campo de contagem de população. Claro, esses dados estão desatualizados, mas são apresentados de qualquer maneira:
Faça uma tabela das cinco principais cidades do mundo por população. Inclua o país e um campo de população.
Você também pode especificar certos detalhes sobre a tabela, como ordem de campo e unidades. Aqui, estou movendo o país primeiro e comprimindo os números da população.
Faça uma tabela das cinco principais cidades do mundo por população. Inclua o país e um campo de população. Exiba os campos na ordem de classificação, país, cidade, população. Exiba a população em milhões (com uma casa decimal), então 37.833.000 seria exibido como 37,8M.
Note que dei ao AI um exemplo de como eu queria que os números fossem exibidos.
Isso é o máximo que a versão gratuita nos levará. A partir de agora, estamos mudando para a versão ChatGPT Plus de $20/mês.
O ChatGPT Plus com Advanced Data Analytics ativado pode fazer gráficos de linha, gráficos de barras, histogramas, gráficos de pizza, gráficos de dispersão, mapas de calor, gráficos de caixa, gráficos de área, gráficos de bolhas, gráficos de Gantt, gráficos de Pareto, diagramas de rede, diagramas de Sankey, mapas de coropletas, gráficos de radar, nuvens de palavras, treemaps e gráficos 3D.
Neste exemplo, vamos fazer apenas um simples gráfico de barras.
Faça um gráfico de barras das cinco principais cidades do mundo por população.
Ferramenta bastante falante, não é?
Os mais atentos entre vocês podem ter notado a discrepância nas populações entre a tabela anterior mostrada e os resultados aqui. Note que a tabela tem um ícone verde e esta tem um ícone roxo. Saltamos do GPT-3.5 (a versão gratuita do ChatGPT) para o GPT-4 (no ChatGPT Plus). É interessante que os LLMs diferentes tenham dados ligeiramente diferentes. Isso faz parte do motivo pelo qual é importante ter cuidado ao usar AIs e verificar novamente seu trabalho. No nosso caso, estamos apenas demonstrando gráficos, mas este é um exemplo tangível de onde os dados apresentados com confiança podem estar errados ou inconsistentes.
Uma das superpotências do Advanced Data Analytics é a capacidade de carregar um conjunto de dados. Para o nosso exemplo, baixei o conjunto de dados de Nomes de Bebês Populares do Data.gov. Este é um arquivo separado por vírgulas de nomes de bebês da cidade de Nova York de 2011 a 2014. Embora esteja uma década desatualizado, é divertido brincar com ele.
O conjunto de dados que escolhi para este artigo está prontamente disponível em um site governamental, então você pode replicar este experimento por conta própria. Existem muitos conjuntos de dados excelentes disponíveis no Data.gov, mas descobri que muitos são grandes demais para o ChatGPT usar. Depois de baixar este, percebi que também incluía informações sobre etnia, então podemos executar vários gráficos diferentes a partir do mesmo conjunto de dados.
Clique no pequeno botão de upload e depois diga-lhe o arquivo de dados que você deseja importar.
Perguntei-lhe para me mostrar as cinco primeiras linhas do arquivo para saber mais sobre o formato do arquivo.
Fiquei curioso sobre como o conjunto de dados distribuía nomes de gênero. Aqui está minha primeira solicitação:
Crie um gráfico de pizza mostrando o gênero como uma porcentagem do conjunto de dados geral.
E aqui está o resultado:
Infelizmente, a tonalidade escura do verde torna os números difíceis de ler. Felizmente, você pode instruir o Advanced Data Analytics a usar cores diferentes. Fui cuidadoso ao escolher cores que não reforçassem estereótipos de gênero.
Crie um gráfico de pizza mostrando o gênero como uma porcentagem do conjunto de dados geral. Use verde claro para masculino e amarelo médio para feminino.
Como vimos anteriormente, os dados coletados incluem etnia. Veja como ver a distribuição das várias etnias que Nova York registrou no início dos anos 2010:
Mostre a distribuição de etnia no conjunto de dados usando um gráfico de pizza. Use apenas cores claras.
E aqui está o resultado. Notou alguma coisa?
Aparentemente, Nova York não normalizou adequadamente seus dados. Usou "WHITE NON HISPANIC" e "WHITE NON HISP" juntos, "BLACK NON HISPANIC" e "BLACK NON HISP" juntos, e "ASIAN AND PACIFIC ISLANDER" e "ASIAN AND PACI" juntos. Isso resultou em representações imprecisas dos dados.
Uma das vantagens do ChatGPT é que ele lembra instruções durante uma sessão. Então, pude dar-lhe esta instrução:
Para todas as solicitações seguintes, agrupe "WHITE NON HISPANIC" e "WHITE NON HISP" juntos. Agrupe "BLACK NON HISPANIC" e "BLACK NON HISP" juntos. Agrupe "ASIAN AND PACIFIC ISLANDER" e "ASIAN AND PACI". Use o nome de etnia mais longo ao exibir etnia.
E ele respondeu:
Vamos tentar o gráfico novamente, usando o mesmo prompt.
Mostre a distribuição de etnia no conjunto de dados usando um gráfico de pizza. Use apenas cores claras.
Isso é melhor:
Você precisa ser diligente ao olhar os resultados. Por exemplo, em uma solicitação para os principais nomes de bebês, a IA separou "Madison" e "MADISON" como dois nomes diferentes:
Para todas as solicitações seguintes, os nomes dos bebês devem ser insensíveis a maiúsculas e minúsculas.
Vamos terminar com um gráfico complexo a partir de um prompt. Aqui está o nosso prompt:
Para cada etnia, apresente dois gráficos de pizza, um para cada gênero. Cada gráfico de pizza deve listar os cinco principais nomes de bebês para aquele gênero e aquela etnia. Use apenas cores claras.
Como se vê, o gráfico gerado tinha um texto muito pequeno para ser lido. Então, para obter um gráfico mais útil, podemos exportá-lo de volta. Vou especificar tanto o formato do arquivo quanto a largura do arquivo:
Exporte este gráfico como um arquivo JPG de 3000 pixels de largura.
E aqui está o resultado:
Note que Sofia e Sophia são muito populares, mas são mostradas como dois nomes diferentes. Mas é isso que torna os gráficos tão fascinantes.
FAQ
QUANTO CUSTA USAR O ADVANCED DATA ANALYTICS? O Advanced Data Analytics vem com o ChatGPT Plus como um recurso beta que você precisa ativar no painel de configurações. O ChatGPT Plus custa $20/mês. O Advanced Data Analytics também está incluído na edição Enterprise, mas o preço ainda não foi divulgado.
OS DADOS CARREGADOS NO CHATGPT PARA GRÁFICOS SÃO MANTIDOS EM PRIVACIDADE OU HÁ RISCO DE EXPOSIÇÃO DE DADOS? Presuma que sempre haja um risco à privacidade.
Perguntei isso ao ChatGPT e isso é o que ele me disse: A privacidade dos dados é uma prioridade para o ChatGPT. Os dados carregados são usados apenas para o propósito da sessão atual do usuário e não são armazenados a longo prazo ou usados para outros propósitos. No entanto, para dados altamente sensíveis, os usuários devem sempre ter cautela e considerar o uso da versão Enterprise do ChatGPT, que oferece maior confidencialidade de dados.
O ADVANCED DATA ANALYSIS DO CHATGPT PODE LIDAR COM DADOS EM TEMPO REAL OU É MAIS ADEQUADO PARA CONJUNTOS DE DADOS ESTÁTICOS? É possível, mas há algumas limitações práticas. Primeiro, a conta Plus limitará o número de solicitações que você pode fazer em um determinado período de tempo. Segundo, você tem que carregar cada arquivo individualmente. Existe a possibilidade de você usar uma API licenciada do ChatGPT para análises em tempo real. Mas para o próprio chatbot, você está olhando para analisar dados em repouso.