Ninguém espera delicadezas emocionais de um chatbot. Escrita medíocre, claro, junto com alguns fatos inventados e um pouco de racismo aleatório. Eu mesmo já escrevi sobre esses aspectos negativos da IA.
Mas esses grandes e novos chatbots podem, como sabemos, também gerar respostas que soam humanas a estímulos e perguntas. E em um recente teste de comparação, essa capacidade deu aos bots uma surpreendente superioridade no que deveria ser uma das atividades mais intrinsecamente humanas: atuar como médico.
Para realizar o teste, uma equipe de pesquisadores da Universidade da Califórnia em San Diego se infiltrou no r/AskDocs, um fórum do Reddit onde profissionais de saúde registrados e verificados respondem às perguntas médicas das pessoas. Os pesquisadores selecionaram quase 200 perguntas representativas no fórum, desde as que soam bobas ("Engoli um palito de dente, meu amigo disse que vou morrer") até as aterrorizantes ("Aborto espontâneo um dia após ultrassom normal?"). Eles então alimentaram as perguntas na boca virtual do bot ChatGPT, e tiveram um grupo separado de especialistas em saúde conduzindo uma avaliação cega das respostas de ambos, IA e médicos.
Os resultados foram chocantes. Para começar, o ChatGPT saiu muito à frente dos médicos humanos em termos de utilidade. Quase invariavelmente, as respostas do chatbot foram classificadas como três ou quatro vezes mais confiáveis do que as dos pobres humanos. Além disso, os bots não mostraram nenhuma das tendências perturbadoras para inventar coisas que costumam ter em outras circunstâncias.
Mas aqui está a parte mais impressionante: as respostas do chatbot, em média, foram classificadas como sete vezes mais empáticas do que as dos humanos. Sete vezes! Eles forneceram exatamente o que você quer de seu médico: cuidado e uma conexão emocional. É como se o androide insensível Sr. Data tivesse descoberto como emular de forma convincente a maneira confortante de Dr. Crusher ao lado da cama.
Agora, admitidamente, a barra é baixa para superar os médicos humanos em demonstrações de empatia. Ainda assim, a aparente facilidade com que o bot poderia lidar com preocupações médicas, tanto em estilo quanto em substância, prenuncia um uso real e prático para essas coisas. Eu sou cético de que bots de IA impulsionados por grandes modelos de linguagem vão revolucionar o jornalismo ou até mesmo melhorar a busca na internet. Suponho que estou aberto à ideia de que eles acelerarão a codificação de software ea análise de planilhas. Mas agora penso que, com alguns ajustes, os chatbots poderiam melhorar radicalmente a maneira como as pessoas interagem com os provedores de saúde e nosso complexo médico-industrial quebrado.
O objetivo do experimento de empatia não era mostrar que o ChatGPT poderia substituir um médico ou uma enfermeira. Era mostrar que um chatbot poderia ter um papel na prestação de cuidados. Nosso sistema de saúde com fins lucrativos não contrata médicos e enfermeiros suficientes, e espera que os que contrata tratem mais e mais pacientes, no estilo de uma linha de montagem. Ninguém gosta disso, exceto as pessoas que estão enriquecendo.
"As pessoas estão desconectadas da saúde, e estão desesperadas", diz John Ayers, um epidemiologista computacional da UC San Diego que foi o autor principal do novo artigo. Então eles estão procurando respostas em fóruns como o r/AskDocs. "É assim que os pacientes fazem isso agora. E os médicos não se inscreveram para isso."
A pressão para responder a essas mensagens se tornou intensa. A pandemia de COVID acelerou o contato remoto e online entre médicos e pacientes - e mesmo no primeiro ano da pandemia, pesquisas sugeriram que os médicos passavam quase uma hora todos os dias úteis lidando com suas caixas de entrada de e-mail. Adicione a isso lidar com outras burocracias de registros médicos eletrônicos e você acaba com alguns médicos dedicando metade do tempo todos os dias a essas idas e vindas. É tanto que o seguro muitas vezes cobra pelo tempo gasto respondendo a mensagens, tornando-as uma fonte potencial de receita acima e além das interações presenciais.
Estudos anteriores perguntaram se pacientes e médicos gostam de usar esses sistemas de mensagens; Ayers analisou se o sistema realmente funciona. "Usamos mensagens reais", diz ele. "Ninguém nunca fez isso antes." O resultado, com base na qualidade das interações, foi definitivo. "ChatGPT ganhou de lavada", diz Ayers. "Essa coisa provavelmente está pronta para o horário nobre."
Com base no sucesso inicial do bot, Ayers está pronto para ver o que mais ele pode lidar. "Queremos começar ensaios controlados randomizados, onde você avalia a mensagens do paciente contra os resultados do paciente", diz ele - não apenas se as mensagens são precisas ou empáticas, mas se ajudam a manter as pessoas mais saudáveis ou vivas por mais tempo. E se um chatbot pudesse ajudar alguém se recuperando de um ataque cardíaco a manter uma dieta baixa em sal, lembrá-los de tomar seus medicamentos, manter seu tratamento atualizado? "Uma mensagem nesse caso poderia salvar a vida desse paciente", diz Ayers.
Para todas as promessas do mundo da tecnologia de animais de estimação robóticos e psicoterapeutas de IA, a ideia de um chatbot cuidadoso ainda parece desestabilizadora - talvez até perigosa. Ninguém acha que o ChatGPT realmente se importa, assim como ninguém acha que ele é realmente inteligente. Mas se nossosistema de saúde atual e quebrado torna impossível para os humanos cuidarem uns dos outros, talvez a falsa preocupação salve vidas reais. Um assistente inteligente artificialmente pode não ser mais humano do que humano, mas talvez seja mais humano.
Sistemas de IA especializados - não chatbots burros - já são bastante bons em diagnósticos. Eles são altamente treinados para detectar uma coisa, como um tumor ou sepse, usando resultados de testes específicos como entrada. Mas eles são caros e difíceis de construir. Então, o estabelecimento médico está apostando em chatbots como uma ferramenta mais barata e mais onipresente. Dezenas de empresas estão trabalhando em aplicações, visando usos desde o diagnóstico de doenças até a ajuda com a enxurrada de papelada que de alguma forma se tornou responsabilidade tanto dos médicos quanto dos pacientes. Se você tem sorte o suficiente para ter seguro de saúde, sua seguradora provavelmente já tem algum tipo de chatbot burro para você conversar antes de conseguir falar com um humano ao telefone.
Se você perguntar às pessoas se elas gostam dessa ideia, a maioria dirá que não. Sessenta por cento dos americanos pesquisados recentemente pelo Pew Research Center disseram que não gostariam que um sistema de IA diagnosticasse o que está acometendo-os ou propusesse tratamentos. Mas eles provavelmente vão conseguir de qualquer maneira. Não conte a ninguém que eu disse isso, mas muito do que os profissionais de saúde fazem já é um pouco formulaico - pelo menos na interface de menor nível voltada para o paciente. Você se sente mal e liga para uma enfermeira de aconselhamento; eles fazem perguntas predefinidas para determinar se você deve ir para um pronto-socorro ou apenas tomar um Tylenol. Isso é chamado de triagem. Ou, se você tem acesso eletrônico aos seus registros médicos, talvez você receba resultados de um novo conjunto de testes, e você envia um e-mail para o seu médico para perguntar o que eles significam. De qualquer forma, você não espera desfrutar desses encontros. Eles são perfunctórios. Robóticos, até.
Bem, você sabe quem é muito bom em coisas robóticas? Robôs! Recentemente, uma equipe de pesquisadores de Harvard mostrou dezenas de descrições de problemas de saúde para três grupos: médicos, pessoas sem treinamento médico e ChatGPT. Eles pediram a todos (e a todas as coisas) para diagnosticar a doença e, em seguida, para recomendações de triagem.
Os humanos não médicos foram autorizados a fazer uma pesquisa na internet - o que os profissionais de saúde chamam, com medo, de "Dr. Google". Mas mesmo com a ajuda online, os humanos não treinados foram péssimos no diagnóstico. Nenhuma surpresa aí. Mas, como os pesquisadores relatam em um preprint recente - o que significa que ainda não foi revisado por pares - o chatbot foi quase tão bom no diagnóstico (marcando mais de 80%) quanto os médicos humanos (que marcaram mais de 90%). E na triagem, o ChatGPT acertou um pouco mais de 70%. Isso parece ruim comparado aos 91% do médico, mas ainda assim! Este é um chatbot de propósito geral, quase tão bom quanto um médico totalmente treinado.
Agora imagine adicionar a esse conjunto de habilidades o tipo de tarefas de saúde mundanas e demoradas que os chatbots deveriam ser capazes de lidar - coisas como agendar consultas, solicitar autorização prévia do seguro e lidar com registros médicos eletrônicos. "Essas são tarefas que ninguém entrou na medicina para fazer, e são dores de cabeça enormes, drenos de tempo massivos, fisicamente e emocionalmente drenantes", diz Teva Brender, um residente médico na Universidade da Califórnia em San Francisco. Talvez um chatbot pudesse gerar pelo menos o início desse tipo de tráfego burocrático, junto com todos os e-mails para os pacientes. "O médico poderia dar uma olhada rápida e dizer: 'Sim, isso está certo', e enviá-lo", diz Brender.
Isso parece um cenário provável. Chatbots altamente treinados trabalharão em conjunto com médicos, enfermeiros e assistentes médicos para fornecer respostas mais empáticas e mais completas para as pessoas que precisam de cuidados. Como a equipe de Ayers escreveu em 2019, as pessoas estão tão desesperadas por ajuda médica que postam imagens de seus próprios genitais no subreddit r/STD na esperança de obter um diagnóstico preciso. Isso é simplesmente triste além da crença, e uma acusação impressionante de nosso sistema de saúde verdadeiramente péssimo e desumano.
Em um sistema tão ruim, a IA poderia realmente ser uma melhoria. "Um clínico humano respaldado pela base de conhecimento e pelo poder de processamento dos sistemas de IA só será melhor", diz Jonathan Chen, médico da Stanford University School of Medicine que tem estudado sistemas de IA. "É totalmente provável que os pacientes optem por conselhos médicos imperfeitos de sistemas automatizados disponíveis 24/7, em vez de esperar meses por uma consulta com um especialista humano."
Para tornar esses sistemas orientados por IA melhores, muitas pessoas - incluindo a equipe de Ayers - estão agora trabalhando em modelos de linguagem menores e finamente ajustados com informações médicas. A atração do ChatGPT, tal como é, é que é um generalista que recebe entrada de tudo na internet. Mas é assim que os preconceitos e desinformações se infiltram. Dê a esses chatbots médicos acesso aos registros médicos individuais das pessoas, e eles poderiam oferecer conselhos mais precisamente direcionados. "Quando essa tecnologia tiver acesso aos registros de saúde eletrônicos, esse será o verdadeiro divisor de águas", diz Ayers.
Se um futuro de conselhos de saúde orientados por IA - completo com acesso aos seus registros médicos - faz você se preocupar, eu não te culpo. Os resultados ruins de ficção científica aqui são bastante distópicos. Depois de anos de trabalho, a Food and Drug Administration ainda não tem um framework que esteja pronto para regular a IA e o aprendizado de máquina em dispositivos médicos. Alguém terá que descobrir todas as questões de responsabilidade em torno do conselho do chatbot, especialmente quando é ruim. As startups de saúde de IA vão querer as versões mais baratas com o maior retorno financeiro, que não necessariamente terão os melhores resultados para os pacientes. E se uma empresa de saúde conseguir ajustar um chatbot com medicina de ponta, então qualquer empresa pode fazer a mesma coisa com homeopatia ou velas perfumadas - ou com bobagens anti-vacina. Esses chatbots vão espalhar desinformação perigosa, de forma eloquente e empática.
"Esse é o pior caso", diz Greg Corrado, chefe de Saúde AI no Google. "Isso não é algo para as pessoas do Vale do Silício fazerem isoladamente." Isso significa desenvolver esses sistemas em conjunto com especialistas em saúde, não apenas executivos de saúde - para garantir que eles sejam privados e seguros e que realmente ajudem as pessoas.
Não será fácil, mas pode ser necessário. Nosso sistema de saúde, infelizmente, não é construído para fornecer a todos cuidadores humanos decentes. E até que isso mude, seria bom ter robôs que pudessem nos ajudar a permanecer saudáveis. Se eles puderem simular que se importam conosco ao mesmo tempo - talvez até melhor do que os médicos humanos fazem - bem, ainda seria uma boa mensagem para receber.