Hay una paradoja que empieza a afectar de lleno a la visibilidad informativa en internet. Mientras millones de personas preguntan a ChatGPT, Gemini o Perplexity para orientarse, el 35 % de los 100 medios más influyentes de España limita total o parcialmente el acceso a rastreadores de inteligencia artificial.
Ese dato aparece en La Brecha de Cobertura de la IA, un estudio elaborado por Hotwire que pone el foco en un cambio menos visible que una portada, pero cada vez más decisivo. Si una herramienta generativa no puede rastrear un contenido, tampoco puede incorporarlo con normalidad a sus respuestas.
Los bloqueos ya alteran qué información llega a la IA
No hablamos de un único muro técnico. El análisis identifica restricciones en archivos robots.txt, bloqueos aplicados desde el servidor o la CDN y también modelos de suscripción que obligan a registrarse o pagar antes de acceder al contenido.
Al final, el problema no consiste solo en publicar, sino en poder ser leído por máquinas que hoy median buena parte del acceso a la información. Esa capa técnica, que durante años quedó en segundo plano, empieza a pesar sobre la presencia pública de marcas y medios.
Beatrice Agostinacchio, managing director de Hotwire España e Italia, sitúa ahí el núcleo del cambio.
"Estamos asistiendo a un cambio fundamental en cómo se construye la reputación de las marcas". - Beatrice Agostinacchio, managing director de Hotwire España e Italia
La frase tiene implicaciones muy concretas. Si los sistemas generativos seleccionan, resumen y reutilizan información para responder a los usuarios, quedar fuera de sus rastreadores puede equivaler a perder una parte de la conversación pública, aunque el contenido siga publicado y disponible para lectores humanos.
Hotwire midió cómo acceden GPTBot, ClaudeBot y PerplexityBot
Para observar ese comportamiento, Hotwire utilizó su tecnología propietaria Radiate, que evalúa cómo rastreadores como GPTBot, ClaudeBot o PerplexityBot intentan acceder a contenidos publicados en internet. La cuestión no es menor, porque cada acceso permitido o denegado condiciona qué materiales entran en el circuito de la IA generativa.
Ahí encaja también la competencia entre asistentes, donde la calidad de las respuestas depende en parte de qué fuentes puede rastrear cada sistema y cuáles quedan fuera por barreras técnicas o comerciales.
No todas las restricciones responden a la misma lógica. A veces pesan decisiones editoriales o de negocio, como los muros de pago. Otras veces manda una configuración técnica que quizá nació para ordenar el tráfico web y ahora tiene un efecto lateral sobre la presencia en entornos generativos.
La recomendación pasa por revisar accesibilidad y lenguaje
Frente a ese escenario, la investigación propone tres movimientos bastante directos. Recomienda auditar la accesibilidad de los medios para sistemas de inteligencia artificial, optimizar los contenidos con estructuras claras y lenguaje natural, y medir la visibilidad y la reutilización de la información en esos entornos.
Visto de cerca, no se trata solo de escribir bien. También influye cómo viaja un texto por la red, si puede ser leído por rastreadores automáticos y en qué condiciones termina convertido en respuesta, resumen o referencia para un usuario que ya no entra necesariamente en la web original.
Esa tensión entre acceso abierto, control editorial y circulación automatizada recuerda a el crecimiento de ChatGPT, donde la escala de uso convierte cada restricción técnica en una decisión con efectos mucho más amplios.
El dato que queda al final resulta difícil de ignorar. Si 35 de los 100 medios más influyentes de España cierran total o parcialmente la puerta a los rastreadores de IA, la respuesta que un usuario reciba en una herramienta generativa puede depender menos de qué se ha publicado y más de qué ha logrado entrar.