Hampir separuh dari kita menggunakan AI untuk mendapatkan informasi dan ide. Mudah untuk melihat alasannya. Media sosial membusuk. Google hanyalah portal ke Reddit sekarang. Kami haus akan keandalan. Selain itu, bukankah bot bermanfaat? Saya bertanya kepada seseorang apakah ia tahu bahwa ia membuang-buang daya. Dapatkan resep keju vegan 30 menit kemudian.

Tidak membuat keju. Menemukan resep buatan manusia yang kemungkinan besar dicurinya. Begitulah cara kerjanya. Mereka mengemas kembali pengetahuan ke dalam air kotor yang disesuaikan. Baik untuk makanan. Bukan untuk kebenaran. Saya seorang pemeriksa fakta untuk WIRED. Taruhannya lebih tinggi.

Orang-orang kasihan padaku akhir-akhir ini. Mereka mengira saya ketinggalan jaman. Konyol. Saya pikir sangat sedikit pengetahuan manusia yang benar-benar ada di internet. AI lebih buruk dari yang diperkirakan orang. Salah.

Colin Dickey berkata bahwa Tom Wolfe memandang kami, para pemeriksa fakta, sebagai komplotan rahasia para penipu. Adil. Bos saya seorang laki-laki. Kami menjengkelkan. Itulah pekerjaannya.

Sekolah Tua

WIRED melakukan ini dengan cara yang sulit. Baris demi baris. Sumber primer. Kami memanggil orang-orang. Kami menunggu di tunggu. Kami berdebat dengan etika dan pengacara. Ini adalah tinjauan sejawat tentang kecepatan.

AI belum menghentikan ini. Belum. Ia sedang mencoba pemeriksaan post hoc. Seperti Snopes tetapi otomatis. Di Inggris, sebuah kelompok bernama Full Fact membuat alat untuk melakukan hal ini. Mereka memindai postingan dan podcast. Mereka menandai klaim. Lalu manusia menyelidikinya. Mark Frankel dari Full Fact mengerti. Anda membutuhkan manusia.

“Anda pasti membutuhkan manusia.”

Seberapa Salah Itu Salah?

AI gagal. Sering. Seberapa sering? Sulit untuk mengatakannya. 17,00 makalah tentang arXiv sejak 2018. Kebanyakan tentang keandalan.

Di meja, kami memeriksa b-matter. Statistik. Tanggal. Kutipan. Saya menggunakan Ikhtisar AI. Aku benci mereka. Salah sekitar sepertiga dari waktu. Mungkin lebih buruk.

Sebuah studi Tow Center pada Maret 2025 mengatakan lebih dari 60% hasil pencarian AI tidak akurat. BBC mengatakan 45%. Jujur saja. Itu setengah salah.

Model yang mana? Musk menganggap Grok adalah yang terbaik. Penelitian tidak setuju. Claude menduduki puncak RealFactBench tahun lalu dengan akurasi 73%. Grok bahkan tidak ada di dalamnya. SimpleQA, dijalankan oleh OpenAI pada Oktober 2024? Tidak ada model yang mengalahkan 50%. Google memperbaruinya baru-baru ini. Gemini 2,5 menang dengan 55,6%.

ObrolanGPT? Ini memberi tahu saya bahwa modelnya 90-96% akurat. Kemudian ditautkan makalah tentang obat tidur. Dikatakan halusinasi terjadi 1-2% dari seluruh kejadian. Sumbernya tidak ada.

Lebih pintar bukan berarti lebih benar. Terkadang justru sebaliknya. Laporan AI tahun 2025 menemukan 60% peneliti meragukan faktualitas akan segera terpecahkan. Bot berusaha terlalu keras untuk menyenangkan. Mereka menciptakan, bukannya mengakui kekalahan.

Ujian

Saya menjalani tes perekrutan yang saya lewati bertahun-tahun yang lalu. Cerita palsu. Gembong panggilan robot. Tiga pertanyaan bonus. Saya memberikannya ke ChatGPT. Claude. Gemini. Grok. Versi gratis.

Grok agresif. “Ya.” Ia membenci kebenaran. Ingin data tak terbatas. Laporan tersebut mencatat bahwa pengecekan fakta secara historis merupakan pekerjaan perempuan. Menarik. Tidak berguna.

Claude dan Gemini baik-baik saja. Rencana yang masuk akal. Bendera hukum. Gemini menginginkan “Jejak Kertas” untuk “Jejak Orang”. Jijik.

ChatGPT sangat bersemangat. Merasa tidak aman. Kata kunci. Ia ingin membuat diagram kalimat. Kemudian dibuatlah satu paragraf dari cerita tersebut. Tak satu pun dari mereka benar-benar memeriksa fakta. Mereka menjanjikan rencana. Lalu berhenti.

“Menurut saya, tidak ada pilihan lain… tidak menyertakan AI,” kata Angie Holan dari Poynter. Dia lebih memilih pertunangan. Pelajari alatnya. Lihat waktu istirahat mereka.

Saya setuju. Saya merasa lebih tajam sekarang.

Keunggulan Analog

Kegembiraan dimulai ketika Google gagal. Sebuah tanda di perbatasan. Tingkat pertumbuhan rumput laut. Burger King pada tahun 1979 LA. Hal-hal ini adalah hantu di internet.

Bot tidak akan duduk di telepon selama satu jam sementara seorang janda menangis. Ia tidak akan peduli dengan kesedihannya. Tidak ada permusuhan pasif dalam “Terima kasih atas email Anda.” Ia tidak bisa melihat perbedaan antar sumber yang mengaburkan fakta.

Jack Bialik menulis bahwa menurut kami teknologi lama itu baru. Jalur perakitan. Operasi katarak. Penyimpanan digital kita membusuk. Microchip bertahan lima tahun. Batu bertahan ribuan tahun.

Ada Palmer mengatakan kita mengetahui kurang dari 1% sejarah dari 500 tahun yang lalu. Dan dua pertiganya salah. Generasi-generasi mewariskannya. Beberapa bagian hilang. Sekarang kami mempercayai server? Server mati.

Manusia membuat kesalahan. Saya tahu ini. Holan mengatakan tidak menggunakan chatbot bukanlah hal yang aman. Setidaknya… Saya pikir dia mengatakan itu. 33% hingga 90% yakin.

Saya memeriksa perekam di akhir wawancara kami.

Tidak aktif.

Giliran Anda

Komentar ada di bawah. Kirimkan email kepada kami di [email dilindungi] jika Anda tidak menyukai suasananya. Atau menyukainya.