Quasi la metà di noi utilizza l’intelligenza artificiale per informazioni e idee. Facile capire perché. I social media sono marciumi. Google è solo un portale per Reddit ora. Abbiamo fame di affidabilità. Inoltre, i robot non sono utili? Ho chiesto a uno se sapeva che sprecava energia. Ho ricevuto una ricetta di formaggio vegano 30 minuti dopo.
Non ho fatto il formaggio. Ho trovato una ricetta creata dall’uomo che probabilmente ha rubato. È così che funzionano. Riconfezionano la conoscenza in una brodaglia su misura. Va bene per il cibo. Non per la verità. Sono un fact-checker per WIRED. La posta in gioco è più alta.
La gente mi compatisce ultimamente. Pensano che io sia obsoleto. Folle. Penso che pochissima conoscenza umana risieda effettivamente su Internet. L’intelligenza artificiale è peggiore di quanto si pensi. Sbagliato.
Colin Dickey dice che Tom Wolfe vedeva noi fact-checker come una cabala di tirapiedi. Giusto. Il mio capo è un uomo. Siamo fastidiosi. Questo è il lavoro.
Vecchia scuola
WIRED lo fa nel modo più duro. Riga per riga. Fonti primarie. Chiamiamo le persone. Aspettiamo in attesa. Discutiamo con l’etica e gli avvocati. È una revisione tra pari sulla velocità.
L’intelligenza artificiale non ha ucciso tutto questo. Ancora. Sta tentando di eseguire controlli post hoc. Come Snopes ma automatizzato. Nel Regno Unito, un gruppo chiamato Full Fact ha creato strumenti a questo scopo. Eseguono la scansione di post e podcast. Segnalano le rivendicazioni. Quindi gli umani indagano. Mark Frankel di Full Fact lo capisce. Hai bisogno di un essere umano.
“Hai sicuramente bisogno di un essere umano.”
Quanto è sbagliato?
L’intelligenza artificiale fallisce. Spesso. Quante volte? Difficile da dire. 17,00 articoli su arXiv dal 2018. Principalmente sull’affidabilità.
Alla scrivania controlliamo b-matter. Statistiche. Date. Citazioni. Utilizzo le panoramiche AI. Li odio. Sbagliato circa un terzo delle volte. Forse peggio.
Uno studio del Tow Center del marzo 2025 afferma che oltre il 60% dei risultati di ricerca dell’intelligenza artificiale sono imprecisi. La BBC dice il 45%. Cerchiamo di essere schietti. È mezzo sbagliato.
Quale modello? Musk pensa che Grok sia il migliore. La ricerca non è d’accordo. Claude ha superato RealFactBench lo scorso anno con una precisione del 73%. Grok non c’era nemmeno. SimpleQA, gestito da OpenAI nell’ottobre 2024? Nessun modello supera il 50%. Google lo ha aggiornato di recente. Gemelli 2.5 ha vinto con il 55,6%.
ChatGPT? Mi ha detto che i modelli sono accurati al 90-96%. Poi ho collegato un articolo sulla medicina del sonno. Diceva che le allucinazioni si verificano nell’1-2% delle volte. La fonte non esisteva.
Più intelligente non significa più vero. A volte è il contrario. Un rapporto sull’intelligenza artificiale del 2025 ha rilevato che il 60% dei ricercatori dubita che la realtà dei fatti verrà presto risolta. I robot si sforzano troppo di accontentarli. Inventano invece di ammettere la sconfitta.
La prova
Ho il test di assunzione che ho superato anni fa. Storia falsa. Il boss delle chiamate robotiche. Tre domande bonus. L’ho dato a ChatGPT. Claudio. Gemelli. Grok. Versioni gratuite.
Grok era aggressivo. “SÌ.” Odiava la verità. Volevo dati infiniti. Ha osservato che il fact-checking è storicamente un lavoro da donne. Interessante. Inutile.
Claude e Gemini erano decenti. Piani ragionevoli. Bandiere legali. I Gemelli volevano “Paper Trails” per “People Trails”. Servilismo.
ChatGPT era entusiasta. Insicuro. Parole d’ordine. Voleva schematizzare le frasi. Poi ha composto un paragrafo della storia. Nessuno di loro ha effettivamente verificato i fatti. Hanno promesso dei piani. Poi si fermò.
“Non penso che sia un’opzione… escludere l’intelligenza artificiale”, afferma Angie Holan di Poynter. Preferisce il fidanzamento. Impara gli strumenti. Guarda le loro pause.
Sono d’accordo. Mi sento più sveglio adesso.
Il vantaggio analogico
Il divertimento inizia quando Google fallisce. Un cartello al confine. Tassi di crescita delle alghe. Un Burger King nel 1979 a Los Angeles. Queste cose sono fantasmi in rete.
Un bot non sta seduto al telefono per un’ora mentre una vedova piange. Non gli importerà del dolore. Non si può sentire ostilità passiva in “Grazie per la tua email”. Non riesce a vedere la controversia tra le fonti che offusca i fatti.
Jack Bialik ha scritto che pensiamo che la vecchia tecnologia sia nuova. Linee di assemblaggio. Intervento chirurgico alla cataratta. La nostra memoria digitale marcisce. I microchip durano cinque anni. La pietra dura millenni.
Ada Palmer afferma che conosciamo meno dell’1% della storia di 500 anni fa. E due terzi sono sbagliati. Le generazioni lo hanno tramandato. I pezzi sono andati persi. Adesso ci fidiamo dei server? I server muoiono.
Gli esseri umani commettono errori. Lo so. Holan ha affermato che non utilizzare i chatbot non è sicuro. Almeno… penso che l’abbia detto. Sicuro dal 33% al 90%.
Ho controllato il registratore alla fine della nostra intervista.
Era spento.
È il tuo turno
I commenti sono qui sotto. Scrivici a [email protected] se odi l’atmosfera. Oppure lo adoro.


























