Casi la mitad de nosotros utilizamos la IA para obtener información e ideas. Es fácil ver por qué. Las redes sociales están podridas. Google ahora es solo un portal a Reddit. Estamos hambrientos de confiabilidad. Además, ¿no son útiles los bots? Le pregunté a uno si sabía que desperdiciaba energía. Obtuve una receta de queso vegano 30 minutos después.
No hice el queso. Encontré una receta hecha por humanos que probablemente robó. Así es como funcionan. Vuelven a empaquetar el conocimiento en una basura hecha a medida. Bien para la comida. No por la verdad. Soy verificador de datos para WIRED. Hay mucho en juego.
La gente me tiene lástima últimamente. Creen que estoy obsoleto. Necio. Creo que muy poco conocimiento humano vive en Internet. La IA es peor de lo que la gente piensa. Equivocado.
Colin Dickey dice que Tom Wolfe nos veía a los verificadores de hechos como una camarilla de calzoncillos. Justo. Mi jefe es un hombre. Estamos molestos. Ese es el trabajo.
Vieja escuela
WIRED hace esto de la manera más difícil. Línea por línea. Fuentes primarias. Llamamos a la gente. Esperamos en espera. Discutimos con la ética y los abogados. Es una revisión por pares sobre la velocidad.
La IA no ha acabado con esto. Todavía. Está intentando realizar comprobaciones post hoc. Como Snopes pero automatizado. En el Reino Unido, un grupo llamado Full Fact creó herramientas para esto. Escanean publicaciones y podcasts. Señalan reclamaciones. Entonces los humanos investigan. Mark Frankel de Full Fact lo entiende. Necesitas un humano.
“Definitivamente necesitas un ser humano”.
¿Qué tan malo es lo malo?
La IA falla. A menudo. ¿Con qué frecuencia? Es difícil de decir. 17.000 artículos sobre arXiv desde 2018. Principalmente sobre confiabilidad.
En el escritorio comprobamos materia b. Estadísticas. Fechas. Citas. Utilizo descripciones generales de IA. Los odio. Se equivoca aproximadamente un tercio de las veces. Quizás peor.
Un estudio del Tow Center realizado en marzo de 2025 dice que más del 60% de los resultados de búsqueda de IA son inexactos. La BBC dice 45%. Seamos francos. Está medio mal.
¿Qué modelo? Musk cree que Grok es el mejor. La investigación no está de acuerdo. Claude superó RealFactBench el año pasado con un 73% de precisión. Grok ni siquiera estaba allí. ¿SimpleQA, administrado por OpenAI en octubre de 2024? Ningún modelo superó el 50%. Google lo actualizó recientemente. Gemini 2.5 ganó con un 55,6%.
¿ChatGPT? Me dijo que los modelos tienen una precisión del 90-96%. Luego vinculó un artículo sobre medicina del sueño. Dijo que las alucinaciones ocurren entre el 1 y el 2% del tiempo. La fuente no existía.
Más inteligente no significa más verdadero. A veces es lo contrario. Un informe de IA de 2025 encontró que el 60% de los investigadores dudan que la factibilidad se resuelva pronto. Los robots se esfuerzan demasiado en complacer. Inventan en lugar de admitir la derrota.
La prueba
Tengo la prueba de contratación que aprobé hace años. Historia falsa. Capo de las llamadas automáticas. Tres preguntas extra. Se lo di a ChatGPT. Claudio. Géminis. Grok. Versiones gratuitas.
Grok se mostró agresivo. “Sí.” Odiaba la verdad. Quería datos infinitos. Señaló que la verificación de datos es históricamente un trabajo de mujeres. Interesante. Inútil.
Claude y Géminis eran decentes. Planes razonables. Banderas legales. Géminis quería “Senderos de papel” para “Senderos de personas”. Avergonzarse.
ChatGPT estaba ansioso. Inseguro. Palabras de moda. Quería diagramar oraciones. Luego compuso un párrafo de la historia. Ninguno de ellos comprobó realmente los hechos. Prometieron planes. Luego se detuvo.
“No creo que sea una opción… dejar fuera a la IA”, dice Angie Holan de Poynter. Ella prefiere el compromiso. Conozca las herramientas. Vea sus descansos.
Estoy de acuerdo. Me siento más agudo ahora.
La ventaja analógica
La diversión comienza cuando Google falla. Un cartel en una frontera. Tasas de crecimiento de algas. Un Burger King en Los Ángeles de 1979. Estas cosas son fantasmas en la red.
Un robot no se queda sentado al teléfono durante una hora mientras una viuda llora. No le importará el dolor. No puede sentir hostilidad pasiva en “Gracias por tu correo electrónico”. No puede ver la disputa entre fuentes que desdibujan los hechos.
Jack Bialik escribió que creemos que la tecnología antigua es nueva. Líneas de montaje. Cirugía de cataratas. Nuestro almacenamiento digital se pudre. Los microchips duran cinco años. La piedra dura milenios.
Ada Palmer dice que conocemos menos del 1% de la historia de hace 500 años. Y dos tercios están equivocados. Las generaciones lo transmitieron. Se perdieron bits. ¿Ahora confiamos en los servidores? Los servidores mueren.
Los humanos cometemos errores. Lo sé. Holan dijo que no usar chatbots no es seguro. Al menos… creo que ella dijo eso. 33% a 90% seguro.
Revisé la grabadora al final de nuestra entrevista.
Estaba apagado.
Tu turno
Los comentarios están a continuación. Envíenos un correo electrónico a [email protected] si odia el ambiente. O amarlo.

























