Andriy Onufriyenko/Getty ImagesSi te preocupa que los bots de IA raspen el contenido de tu sitio web para entrenar a la IA, Cloudflare puede ayudarte a contraatacar. La empresa, que afirma representar a alrededor del 20% de la web, ha presentado una nueva herramienta que impide que todos los bots de IA raspen el texto de un sitio. Cloudflare dice que la herramienta está disponible para todos los clientes, incluso los que tienen el nivel gratuito. Además: ¿Todavía necesitas pagar por el software antivirus en 2024? Con el auge de la IA generativa, las empresas necesitan contenido para entrenar a los chatbots. Muchas están recurriendo a raspadores web que extraen texto de los sitios para su análisis (como lo está haciendo ChatGPT con tus publicaciones de Reddit). Algunas empresas son directas y honestas sobre los bots que raspan la web, pero otras no. Cloudflare lanzó una función en septiembre pasado para que los usuarios bloqueen los rastreadores web de IA «malos», o los que raspan sitios sin permiso. Naturalmente, algunas empresas encontraron una forma de evitar esto al tener raspadores que simulan ser auténticos. Por eso, esta nueva herramienta bloquea todos los rastreadores de IA, incluso los que siguen el protocolo adecuado para el scraping. En junio de 2024, los bots de IA accedieron a alrededor del 39% del millón de «propiedades de Internet» principales que usaban Cloudflare, dijo la compañía. Menos del 3% de esas propiedades tomaron medidas para bloquear los bots de IA. Según Cloudflare, los cuatro bots principales que rasparon sus sitios fueron Bytespider, Amazonbot, ClaudeBot y GPTBot. Bytespider, propiedad de Bytedance, la empresa propietaria de TikTok, se utiliza para recopilar datos de entrenamiento para sus grandes modelos de lenguaje, incluido el rival de ChatGPT, Doubao. Amazonbot se utiliza para entrenar el lado de preguntas y respuestas de Alexa, ClaudeBot entrena a Claude AI y GPTBot entrena a ChatGPT. Además: 5 formas en las que Amazon puede hacer que valga la pena pagar una suscripción a Alexa impulsada por IA Si eres usuario de Cloudflare, usar la herramienta es sencillo. Solo dirígete a la sección de configuración de tu panel de control, luego haz clic en «Seguridad» y «Bots». Desde allí, verás un botón de alternancia con la etiqueta «Rastreadores y raspadores de IA». Actívalo y los bots de IA ya no tendrán acceso a tu contenido. Por supuesto, los bots de IA evolucionan constantemente. Cloudflare dice que esta función también evolucionará automáticamente a medida que detecte las «huellas digitales» de los bots infractores. La nueva herramienta ya está disponible para todos los usuarios de Cloudflare a partir de hoy.