Según se informa, los usuarios de la herramienta de inteligencia artificial OpenClaw están eludiendo las medidas anti-bot de los sitios web, lo que genera preocupaciones sobre el scraping y el acceso no autorizado a datos. La tendencia pone de relieve una carrera armamentista cada vez mayor entre la automatización impulsada por la IA y la seguridad de los sitios web.

La aparición del desguace

Una herramienta de código abierto basada en Python llamada Scrapling, diseñada para evitar sistemas anti-bot como Cloudflare Turnstile, ha ganado fuerza, particularmente entre los usuarios de OpenClaw. Scrapling se ha descargado más de 200.000 veces desde su lanzamiento. El atractivo de la herramienta radica en su capacidad para extraer datos sin activar mecanismos estándar de detección de bots. Como dice una publicación viral: “OpenClaw le dice a Scrapling qué extraer. Scrapling se encarga del sigilo”.

Respuesta de Cloudflare

Cloudflare, una empresa líder en ciberseguridad, ya bloqueó versiones anteriores de Scrapling, pero los usuarios continúan adaptándose, lo que obliga a la empresa a un ciclo constante de parches y desarrollo de contramedidas. “Nosotros hacemos cambios y luego ellos hacen cambios”, explica el CTO de Cloudflare, Dane Knecht. La empresa aprovecha los amplios datos de su sitio web y el seguimiento de tendencias para mantenerse a la vanguardia. Han bloqueado 416 mil millones de intentos de scraping no solicitados solo en el último año. Cloudflare también ofrece herramientas pagas para bloquear los rastreadores de IA, incentivando el cumplimiento a través de la monetización.

Contexto histórico: scraping y entrenamiento de IA

La situación actual se hace eco de los métodos utilizados para entrenar modelos de lenguajes grandes (LLM). Los LLM se crearon a partir de vastos conjuntos de datos extraídos de Internet, y los usuarios de Scrapling esencialmente están replicando este proceso a menor escala. Esto subraya la tensión inherente entre el acceso y el control de los datos.

El memecoin fallido del $scrapling

La atención que rodeó a Scrapling llevó a la rápida creación y colapso de una memecoin, $Scrapling. El desarrollador de la moneda, Karim Shoair, promocionó brevemente el token antes de eliminar publicaciones relacionadas después de un aumento de precios y una posterior caída. Shoair afirma que no tenía intención de sacar provecho del plan y que donará los fondos retirados a organizaciones benéficas. El evento provocó que la cuenta no oficial de la comunidad de proyectos GitHub, con más de 300.000 seguidores, se distanciara del proyecto.

El futuro de la automatización web

A pesar del conflicto actual, los líderes de la industria ven las herramientas autónomas de IA como el futuro de la web. Incluso Knecht reconoce el potencial de un ecosistema equilibrado en el que tanto los humanos como los agentes de IA puedan beneficiarse de los datos en línea respetando los deseos de los propietarios de sitios web.

El desarrollo continuo de herramientas como Scrapling demuestra que la batalla entre la automatización y la seguridad probablemente persistirá, lo que obligará a ambas partes a adaptarse continuamente.