La IA se entrena con periodismo ajeno: el 25% de los datos de calidad ya no son accesibles

14 de diciembre de 2025 a las 08:05h
solo el 1% de los usuarios hace clic en los enlaces
solo el 1% de los usuarios hace clic en los enlaces

La inteligencia artificial se alimenta de palabras. De historias. De hechos. Pero hay un problema creciente esas palabras no son gratis. Ni deberían serlo. Y mientras los grandes techeros entrenan sus algoritmos con contenidos ajenos, los medios de comunicación empiezan a reclamar su sitio en este nuevo orden digital. Meta, una de las protagonistas del cambio, acaba de dar un paso que suena a pacto más que a imposición ha sellado acuerdos con CNN, Fox News, Le Monde, USA TODAY y otros nueve medios para integrar sus publicaciones en Meta AI.

Un banquete de información con licencia

Estos acuerdos no son meras formalidades. Suponen un giro en la relación entre plataformas tecnológicas y productores de contenido. Hasta ahora, muchos sistemas de inteligencia artificial han funcionado como comensales silenciosos, tomando de la mesa sin pedir permiso. Ahora, Meta reconoce que la calidad de la información depende de quién la genera y cómo se accede a ella. Al integrar fuentes de noticias verificadas y contratadas, la compañía busca mejorar la precisión y oportunidad de sus respuestas.

"Los eventos en tiempo real pueden ser difíciles de seguir para los sistemas de IA actuales, pero al integrar más y diferentes tipos de fuentes de noticias, nuestro objetivo es mejorar la capacidad de Meta AI para proporcionar contenido oportuno y relevante con una amplia gama de perspectivas y formatos" 

- Meta, portavoz de la compañía

Es un reconocimiento tácito la IA no nace sabia. Se entrena. Y si se entrena con ruido, produce ruido. Pero si se alimenta con periodismo riguroso, puede devolver algo más cercano a la verdad. Meta promete además que sus usuarios podrán acceder a los enlaces originales, una promesa que intenta remediar uno de los males más extendidos la lectura superficial. Aunque, como veremos, no está claro que eso cambie el comportamiento de las personas.

El negocio de la credibilidad

Estos acuerdos no solo son técnicos. Son económicos. Son políticos. Son culturales. Cada firma que Meta anuncia es una bandera clavada en un territorio que antes era tierra de nadie. En 2023, la compañía ya había pactado con Reuters. Ahora suma nombres como The Washington Examiner o People Inc., ampliando un menú de fuentes que intenta equilibrar el espectro informativo. El objetivo no es solo informar, sino hacerlo desde múltiples ángulos, evitando sesgos que puedan desacreditar al sistema.

OpenAI, por su parte, ha ido construyendo su propio menú. Desde Associated Press hasta Condé Nast, pasando por Axel Springer y Financial Times, la lista de socios es una constelación de prestigio periodístico. Pero también es un mapa de supervivencia en un mundo donde las búsquedas se resumen en un párrafo generado por IA, los medios necesitan nuevas formas de monetización. Porque si la gente ya no hace clic en los enlaces, el modelo de negocio se tambalea.

La paradoja del lector moderno

El Pew Research Center lo ha dejado claro solo el 1% de los usuarios hace clic en los enlaces citados en los resúmenes generados por inteligencia artificial. Es un dato frío, pero revelador. Leemos menos que nunca, aunque creamos que sabemos más. La IA nos da la respuesta en bandeja, sin necesidad de abrir el artículo. Es cómodo. Es rápido. Pero también es peligroso. Porque la noticia no está en el titular ni en el resumen. Está en el contexto, en el detalle, en el esfuerzo de quien salió a la calle a comprobar un dato.

Y mientras tanto, el acceso al conocimiento está encogiéndose. El Data Provenance Initiative, liderada por el Instituto de Tecnología de Massachusetts, ha detectado que el 5% de los contenidos antes públicos ya no están disponibles para la investigación. Peor aún el 25% de los datos de mayor calidad se han vuelto inaccesibles. Es como si, justo cuando más necesitamos información fiable, las puertas empezaran a cerrarse.

Una nueva esperanza el estándar que quiere cambiar las reglas

En medio del caos, surge una propuesta con aire de solución técnica y justicia distributiva el Really Simple Licensing (RSL). Este estándar pretende crear una infraestructura común para que los editores puedan licenciar su contenido de forma automática, transparente y justa. Es un intento de poner orden en un mercado que ha funcionado como selva durante años.

Los desarrolladores de RSL creen que con esta herramienta, la industria de internet puede establecer precios de mercado justos y fortalecer la capacidad de negociación de todos los editores, no solo de los gigantes. Suena a utopía tecnológica. Pero también a necesidad. Porque si no se regulan estas relaciones, el periodismo de calidad no tendrá futuro.

La batalla legal ya ha comenzado

No todo es diplomacia. The New York Times ha emprendido acciones legales contra Perplexity, acusándolo de violar derechos de autor durante 18 meses. Y Penske Media Corporation, dueña de Rolling Stone y Variety, demandó a Google por su función AI Overviews, que según ellos desvía tráfico de sus sitios. Estas demandas no son solo sobre dinero son sobre supervivencia.

Detrás de cada pleito hay una pregunta no dicha ¿quién se beneficia del conocimiento colectivo? ¿El que lo produce o el que lo reorganiza? La historia de internet está llena de casos donde la innovación pisoteó el trabajo ajeno. Hoy, los creadores de contenido exigen sentarse a la mesa. No como proveedores, sino como socios.

La inteligencia artificial no es neutral. Está hecha de decisiones. De alianzas. De acuerdos tácitos y cláusulas firmadas. Lo que parece un avance técnico es, en el fondo, una negociación constante por el valor de la verdad. Y mientras los algoritmos aprenden a hablar, los humanos seguimos aprendiendo a defendernos.

Sobre el autor
Redacción
Ver biografía