Fast die Hälfte von uns nutzt KI für Informationen und Ideen. Es ist leicht zu erkennen, warum. Soziale Medien sind faul. Google ist jetzt nur noch ein Portal zu Reddit. Wir sind hungrig nach Zuverlässigkeit. Und sind Bots nicht hilfreich? Ich habe jemanden gefragt, ob er wüsste, dass er Strom verschwendet. 30 Minuten später bekam ich ein veganes Käserezept.
Habe den Käse nicht gemacht. Ein von Menschen gemachtes Rezept gefunden, das es wahrscheinlich gestohlen hat. So funktionieren sie. Sie verpacken Wissen in maßgeschneiderten Slop. Gut zum Essen. Nicht für die Wahrheit. Ich bin Faktenprüfer für WIRED. Die Einsätze sind höher.
Die Leute haben in letzter Zeit Mitleid mit mir. Sie halten mich für veraltet. Töricht. Ich glaube, dass im Internet tatsächlich nur sehr wenig menschliches Wissen existiert. KI ist schlimmer als die Leute denken. Falsch.
Colin Dickey sagt, Tom Wolfe habe uns Faktenprüfer als eine Horde von Pantoffeln betrachtet. Gerecht. Mein Chef ist ein Mann. Wir sind nervig. Das ist der Job.
Old-School
WIRED macht das auf die harte Tour. Zeile für Zeile. Primärquellen. Wir rufen Menschen an. Wir warten in der Warteschleife. Wir streiten mit Ethikern und Anwälten. Es handelt sich um eine Peer-Review zum Thema Geschwindigkeit.
KI hat das nicht getötet. Noch. Es werden Post-hoc -Überprüfungen durchgeführt. Wie Snopes, aber automatisiert. In Großbritannien hat eine Gruppe namens Full Fact Tools dafür entwickelt. Sie scannen Beiträge und Podcasts. Sie kennzeichnen Ansprüche. Dann untersuchen die Menschen. Mark Frankel von Full Fact versteht es. Du brauchst einen Menschen.
„Du brauchst auf jeden Fall einen Menschen.“
Wie falsch ist falsch?
KI versagt. Oft. Wie oft? Schwer zu sagen. 17.00 Artikel zu arXiv seit 2018. Hauptsächlich zum Thema Zuverlässigkeit.
Am Schreibtisch überprüfen wir b-materie. Statistiken. Termine. Zitate. Ich verwende KI-Übersichten. Ich hasse sie. In etwa einem Drittel der Fälle falsch. Vielleicht schlimmer.
Eine Studie des Tow Center vom März 2025 besagt, dass über 60 % der KI-Suchergebnisse ungenau sind. BBC sagt 45 %. Seien wir ehrlich. Es ist halb falsch.
Welches Modell? Musk hält Grok für den Besten. Die Forschung ist anderer Meinung. Claude lag letztes Jahr mit einer Genauigkeit von 73 % an der Spitze von RealFactBench. Grok war nicht einmal dabei. SimpleQA, durchgeführt von OpenAI im Oktober 2024? Kein Modell übertraf 50 %. Google hat es kürzlich aktualisiert. Gemini 2.5 gewann mit 55,6 %.
ChatGPT? Mir wurde gesagt, dass die Modelle zu 90–96 % genau sind. Dann habe ich einen Artikel über Schlafmedizin verlinkt. Es hieß, dass Halluzinationen in 1–2 % der Fälle auftreten. Die Quelle existierte nicht.
Klüger bedeutet nicht wahrer. Manchmal ist es das Gegenteil. Ein KI-Bericht aus dem Jahr 2025 ergab, dass 60 % der Forscher bezweifeln, dass die Faktizität bald geklärt wird. Die Bots versuchen zu sehr, es ihnen recht zu machen. Sie erfinden, anstatt sich geschlagen zu geben.
Der Test
Ich habe den Einstellungstest, den ich vor Jahren bestanden habe. Falsche Geschichte. Robocalling-Kingpin. Drei Bonusfragen. Ich habe es ChatGPT gegeben. Claude. Zwillinge. Grok. Kostenlose Versionen.
Grok war aggressiv. “Ja.” Es hasste die Wahrheit. Wollte unendlich viele Daten. Es wurde darauf hingewiesen, dass die Überprüfung von Fakten historisch gesehen Frauensache sei. Interessant. Nutzlos.
Claude und Gemini waren anständig. Vernünftige Pläne. Legale Flaggen. Gemini wollte „Paper Trails“ für „People Trails“. Schaudern.
ChatGPT war gespannt. Unsicher. Schlagworte. Es wollte Sätze grafisch darstellen. Dann wurde ein Absatz aus der Geschichte verfasst. Keiner von ihnen überprüfte tatsächlich die Fakten. Sie versprachen Pläne. Dann blieb es stehen.
„Ich glaube nicht, dass es eine Option ist, KI auszusitzen“, sagt Angie Holan von Poynter. Sie bevorzugt Engagement. Lernen Sie die Werkzeuge. Sehen Sie sich ihre Pausen an.
Ich stimme zu. Ich fühle mich jetzt schärfer.
Der analoge Vorteil
Der Spaß beginnt, wenn Google versagt. Ein Schild an einer Grenze. Kelp-Wachstumsraten. Ein Burger King im LA von 1979. Diese Dinger sind Geister im Netz.
Ein Bot sitzt nicht eine Stunde lang am Telefon, während eine Witwe weint. Es wird sich nicht um die Trauer kümmern. Es kann keine passive Feindseligkeit in „Danke für Ihre E-Mail“ verspüren. Es ist nicht zu erkennen, dass der Konflikt zwischen den Quellen die Fakten verwischt.
Jack Bialik schrieb, dass wir alte Technik für neu halten. Montagelinien. Kataraktoperation. Unser digitaler Speicher verrottet. Mikrochips halten fünf Jahre. Stein hält Jahrtausende.
Ada Palmer sagt, wir kennen weniger als 1 % der Geschichte von vor 500 Jahren. Und zwei Drittel sind falsch. Generationen haben es weitergegeben. Bits gingen verloren. Jetzt vertrauen wir Servern? Server sterben.
Menschen machen Fehler. Ich weiß das. Holan sagte, der Verzicht auf Chatbots sei nicht sicher. Zumindest… glaube ich, dass sie das gesagt hat. 33 % bis 90 % sicher.
Am Ende unseres Interviews habe ich den Rekorder überprüft.
Es war aus.
Du bist dran
Kommentare finden Sie unten. Schicken Sie uns eine E-Mail an [email protected], wenn Sie die Atmosphäre hassen. Oder ich liebe es.
