Quase metade de nós usa IA para obter informações e ideias. É fácil perceber porquê. A mídia social está podre. O Google é apenas um portal para o Reddit agora. Estamos famintos por confiabilidade. Além disso, os bots não são úteis? Perguntei a um deles se ele sabia que desperdiçava energia. Recebi uma receita de queijo vegano 30 minutos depois.
Não fiz o queijo. Encontrou uma receita feita por humanos que provavelmente roubou. É assim que eles funcionam. Eles reembalam o conhecimento em lixo personalizado. Bom para comida. Não pela verdade. Sou verificador de fatos da WIRED. As apostas são maiores.
As pessoas têm pena de mim ultimamente. Eles acham que estou obsoleto. Tolice. Acho que muito pouco conhecimento humano realmente vive na internet. A IA é pior do que as pessoas pensam. Mais errado.
Colin Dickey diz que Tom Wolfe via os verificadores de fatos como uma conspiração de dominadores. Justo. Meu chefe é um homem. Somos irritantes. Esse é o trabalho.
Velha escola
WIRED faz isso da maneira mais difícil. Linha por linha. Fontes primárias. Chamamos as pessoas. Esperamos em espera. Discutimos com ética e advogados. É uma revisão por pares sobre velocidade.
A IA não matou isso. Ainda. Ele está tentando verificações post hoc. Como Snopes, mas automatizado. No Reino Unido, um grupo chamado Full Fact criou ferramentas para isso. Eles examinam postagens e podcasts. Eles sinalizam reivindicações. Então os humanos investigam. Mark Frankel, da Full Fact, entende. Você precisa de um humano.
“Você definitivamente precisa de um ser humano.”
Quão errado é errado?
A IA falha. Muitas vezes. Com que frequência? Difícil dizer. 17.00 artigos sobre arXiv desde 2018. Principalmente sobre confiabilidade.
Na recepção, verificamos b-matéria. Estatísticas. Datas. Citações. Eu uso visões gerais de IA. Eu os odeio. Errado cerca de um terço das vezes. Talvez pior.
Um estudo do Tow Center de março de 2025 afirma que mais de 60% dos resultados de pesquisa de IA são imprecisos. A BBC diz 45%. Sejamos francos. Está meio errado.
Qual modelo? Musk acha que Grok é o melhor. A pesquisa discorda. Claude superou o RealFactBench no ano passado com 73% de precisão. Grok nem estava nisso. SimpleQA, executado pela OpenAI em outubro de 2024? Nenhum modelo superou 50%. O Google atualizou recentemente. Gêmeos 2,5 venceu com 55,6%.
Bate-papoGPT? Ele me disse que os modelos são 90-96% precisos. Em seguida, vinculei um artigo sobre medicina do sono. Ele disse que as alucinações acontecem de 1 a 2% das vezes. A fonte não existia.
Mais inteligente não significa mais verdadeiro. Às vezes é o oposto. Um relatório de IA de 2025 descobriu que 60% dos pesquisadores duvidam que a factualidade seja resolvida em breve. Os bots se esforçam demais para agradar. Eles inventam em vez de admitir a derrota.
O teste
Tenho o teste de contratação que passei anos atrás. História falsa. Robocalling chefão. Três perguntas bônus. Eu dei para ChatGPT. Cláudio. Gêmeos. Grok. Versões gratuitas.
Grok era agressivo. “Sim.” Odiava a verdade. Queria dados infinitos. Observou que a verificação de factos é historicamente um trabalho das mulheres. Interessante. Inútil.
Claude e Gêmeos eram decentes. Planos razoáveis. Bandeiras legais. Gêmeos queria “Trilhas de Papel” para “Trilhas de Pessoas”. Desgosto.
ChatGPT estava ansioso. Inseguro. Palavras-chave. Queria diagramar frases. Em seguida, compôs um parágrafo da história. Nenhum deles realmente verificou os fatos. Eles prometeram planos. Então parou.
“Não acho que seja uma opção… deixar a IA de fora”, diz Angie Holan, do Poynter. Ela prefere noivado. Aprenda as ferramentas. Veja suas pausas.
Concordo. Eu me sinto mais aguçado agora.
A vantagem analógica
A diversão começa quando o Google falha. Uma placa na fronteira. Taxas de crescimento de algas. Um Burger King em 1979, Los Angeles. Essas coisas são fantasmas na rede.
Um bot não fica sentado ao telefone por uma hora enquanto uma viúva chora. Não vai se importar com a dor. Não pode haver hostilidade passiva em “Obrigado pelo seu e-mail”. Ele não consegue ver a diferença entre as fontes, confundindo os fatos.
Jack Bialik escreveu que achamos que a tecnologia antiga é nova. Linhas de montagem. Cirurgia de catarata. Nosso armazenamento digital apodrece. Os microchips duram cinco anos. A pedra dura milênios.
Ada Palmer diz que conhecemos menos de 1% da história de 500 anos atrás. E dois terços estão errados. Gerações transmitiram isso. Pedaços foram perdidos. Agora confiamos nos servidores? Servidores morrem.
Os humanos cometem erros. Eu sei disso. Holan disse que não usar chatbots não é segurança. Pelo menos… acho que ela disse isso. 33% a 90% de certeza.
Verifiquei o gravador no final da nossa entrevista.
Estava desligado.
Sua vez
Os comentários estão abaixo. Envie-nos um email para [email protegido] se você odeia a vibração. Ou ame.


























