Près de la moitié d’entre nous utilisent l’IA pour obtenir des informations et des idées. Il est facile de comprendre pourquoi. Les réseaux sociaux sont pourris. Google n’est plus qu’un portail vers Reddit. Nous avons soif de fiabilité. De plus, les robots ne sont-ils pas utiles ? J’en ai demandé à un s’il savait qu’il gaspillait de l’énergie. J’ai reçu une recette de fromage végétalien 30 minutes plus tard.
Je n’ai pas fait le fromage. J’ai trouvé une recette faite par l’homme qu’elle a probablement volée. C’est comme ça qu’ils fonctionnent. Ils reconditionnent leurs connaissances dans un contenu sur mesure. Très bien pour la nourriture. Pas pour la vérité. Je suis un vérificateur de faits pour WIRED. Les enjeux sont plus élevés.
Les gens me plaignent ces derniers temps. Ils pensent que je suis obsolète. Idiot. Je pense que très peu de connaissances humaines vivent réellement sur Internet. L’IA est pire qu’on ne le pense. Plus faux.
Colin Dickey dit que Tom Wolfe nous considérait, les vérificateurs des faits, comme une cabale de poules. Équitable. Mon patron est un homme. Nous sommes ennuyeux. C’est le travail.
Vieille école
WIRED fait cela à la dure. Ligne par ligne. Sources primaires. Nous appelons les gens. Nous attendons en attente. Nous discutons avec l’éthique et les avocats. Il s’agit d’un examen par les pairs sur la vitesse.
L’IA n’a pas tué ça. Encore. Il essaie d’effectuer des contrôles post hoc. Comme Snopes mais automatisé. Au Royaume-Uni, un groupe appelé Full Fact a créé des outils à cet effet. Ils scannent les publications et les podcasts. Ils signalent les réclamations. Ensuite, les humains enquêtent. Mark Frankel de Full Fact comprend. Vous avez besoin d’un humain.
« Il faut absolument un être humain. »
À quel point le mal est-il faux ?
L’IA échoue. Souvent. À quelle fréquence? Difficile à dire. 17 00 articles sur arXiv depuis 2018. Principalement sur la fiabilité.
Au bureau, nous vérifions b-matter. Statistiques. Dates. Citations. J’utilise les aperçus de l’IA. Je les déteste. Faux environ un tiers du temps. Peut-être pire.
Une étude du Tow Center réalisée en mars 2025 indique que plus de 60 % des résultats de recherche IA sont inexacts. La BBC parle de 45 %. Soyons francs. C’est à moitié faux.
Quel modèle ? Musk pense que Grok est le meilleur. La recherche n’est pas d’accord. Claude a dominé RealFactBench l’année dernière avec une précision de 73 %. Grok n’était même pas dedans. SimpleQA, géré par OpenAI en octobre 2024 ? Aucun modèle ne dépasse les 50 %. Google l’a mis à jour récemment. Gemini 2.5 a gagné avec 55,6%.
ChatGPT ? Il m’a dit que les modèles étaient précis à 90-96 %. Puis j’ai lié un article sur la médecine du sommeil. On dit que les hallucinations surviennent 1 à 2 % du temps. La source n’existait pas.
Plus intelligent ne veut pas dire plus vrai. Parfois c’est le contraire. Un rapport sur l’IA de 2025 révèle que 60 % des chercheurs doutent que la réalité soit bientôt résolue. Les robots essaient trop de plaire. Ils inventent au lieu d’admettre leur défaite.
Le test
J’ai passé le test d’embauche il y a des années. Fausse histoire. La cheville ouvrière des appels automatisés. Trois questions bonus. Je l’ai donné à ChatGPT. Claude. Gémeaux. Grok. Versions gratuites.
Grok était agressif. “Oui.” Il détestait la vérité. Je voulais des données infinies. Il a souligné que la vérification des faits est historiquement le travail des femmes. Intéressant. Inutile.
Claude et Gemini étaient corrects. Des plans raisonnables. Drapeaux légaux. Les Gémeaux voulaient des « Paper Trails » pour les « People Trails ». Grincer des dents.
ChatGPT était impatient. Précaire. Mots à la mode. Il voulait schématiser des phrases. Ensuite, il a constitué un paragraphe de l’histoire. Aucun d’entre eux n’a réellement vérifié les faits. Ils ont promis des plans. Puis arrêté.
“Je ne pense pas que ce soit une option… de laisser de côté l’IA”, déclare Angie Holan de Poynter. Elle préfère les fiançailles. Apprenez les outils. Voir leurs pauses.
Je suis d’accord. Je me sens plus vif maintenant.
L’avantage analogique
Le plaisir commence lorsque Google échoue. Un panneau à une frontière. Taux de croissance du varech. Un Burger King en 1979 à Los Angeles. Ces choses sont des fantômes sur le net.
Un robot ne reste pas au téléphone pendant une heure pendant qu’une veuve pleure. Il ne se souciera pas du chagrin. Il ne peut pas ressentir d’hostilité passive dans « Merci pour votre e-mail ». Il ne peut pas voir les conflits entre les sources qui brouillent les faits.
Jack Bialik a écrit que nous pensons que les anciennes technologies sont nouvelles. Lignes d’assemblage. Chirurgie de la cataracte. Notre stockage numérique pourrit. Les puces électroniques durent cinq ans. La pierre dure des millénaires.
Ada Palmer dit que nous connaissons moins de 1 % de l’histoire d’il y a 500 ans. Et les deux tiers sont faux. Les générations l’ont transmis. Des morceaux ont été perdus. Maintenant, nous faisons confiance aux serveurs ? Les serveurs meurent.
Les humains font des erreurs. Je le sais. Holan a déclaré que ne pas utiliser de chatbots n’était pas une mesure de sécurité. Au moins… je pense qu’elle a dit ça. 33% à 90% sûr.
J’ai vérifié l’enregistreur à la fin de notre entretien.
C’était éteint.
À votre tour
Les commentaires sont ci-dessous. Envoyez-nous un e-mail à [email protected] si vous détestez l’ambiance. Ou j’adore ça.
