Más de 100 pleitos ponen en duda quién puede entrenar IA con obras protegidas

En junio de 2026, EE. UU. suma más de 100 demandas activas sobre IA y copyright. Los jueces aceptan el entrenamiento en algunos casos, pero cuestionan cómo se obtuvieron los datos y si hubo reproducción indebida.

28 de junio de 2026 a las 15:36h
Más de 100 pleitos ponen en duda quién puede entrenar IA con obras protegidas
Más de 100 pleitos ponen en duda quién puede entrenar IA con obras protegidas

La batalla por entrenar inteligencia artificial con obras protegidas ya no gira solo en torno a una pregunta técnica. En junio de 2026, los tribunales de Estados Unidos acumulan más de 100 denuncias activas y cada una discute algo muy concreto, quién puede alimentar un modelo con trabajo ajeno y bajo qué condiciones.

Los jueces aceptan el entrenamiento, pero no siempre aceptan cómo se obtuvo el material

Ahí aparece la primera grieta que complica el relato de las grandes tecnológicas. El caso Bartz contra Anthropic terminó con un acuerdo de 1.500 millones de dólares después de demostrarse que la empresa liderada por Dario Amodei descargó cientos de miles de libros desde repositorios no oficiales, aunque el tribunal validó el entrenamiento como uso legítimo y puso el foco en la forma de conseguir los datos.

Anthropic vale 183.000 millones de dólares.

Esa cifra vuelve más visible la escala del problema, porque ya no se discute sobre un laboratorio pequeño que experimenta en los márgenes, sino sobre compañías con tamaño suficiente para convertir una práctica de entrenamiento en un conflicto industrial. Algo parecido ocurre en Kadrey contra Meta, donde la empresa de Mark Zuckerberg ganó en la parte del entrenamiento, pero todavía afronta juicio por la distribución de contenido pirata.

Más de 100 pleitos dibujan un mapa donde cada sector reclama algo distinto

No todas las demandas miran al mismo daño ni al mismo tipo de obra. El caso de The New York Times contra OpenAI sigue en curso con la acusación de que ChatGPT reproduce sus artículos casi literalmente y sustituye la fuente original, mientras Disney mantiene su pleito contra Midjourney por generación de imágenes.

También siguen abiertos los frentes de las discográficas Concord, BMG y Universal contra Anthropic por la reproducción de letras protegidas. Cuando se ponen uno al lado del otro prensa, libros, imágenes y canciones, la discusión deja de parecer un choque aislado y empieza a parecer una revisión completa de las reglas de propiedad intelectual en la era de los modelos generativos.

Mientras tanto, una parte de la defensa corporativa se repite con notable disciplina.

Empresas como OpenAI suelen apoyarse en la doctrina del uso legítimo y en las excepciones de minería de texto y datos. Ese argumento intenta separar dos actos distintos, copiar para aprender y copiar para redistribuir, pero varios procedimientos abiertos muestran que los jueces no siempre están dispuestos a mezclar ambas cosas en el mismo paquete.

Estados Unidos analiza caso por caso y Europa aprieta por la trazabilidad

La Oficina de Derechos de Autor de Estados Unidos publicó en mayo de 2025 un informe de 108 páginas que llegó a una conclusión poco cómoda para quienes buscaban una regla simple. Determinar si usar obras para entrenar inteligencia artificial encaja en el uso legítimo exige analizar cada caso por separado.

En Europa el enfoque se mueve por otra vía y resulta más concreto en sus exigencias prácticas. La normativa europea de inteligencia artificial obliga a publicar qué datos se usaron en el entrenamiento, permite que los creadores reserven sus derechos y exige eliminar los datos tras utilizarlos, una lógica que ya asomaba en debates sobre libros usados para entrenar modelos.

Además, esa diferencia regulatoria crea una escena curiosa para las multinacionales.

Al otro lado del Atlántico, el centro del litigio suele estar en si el uso fue legítimo o si hubo reproducción indebida. En la Unión Europea, en cambio, la presión recae también sobre la trazabilidad de los datos y sobre el derecho del creador a apartarse, una tensión cercana a la que ya se ve en la discusión sobre minería de datos para entrenar IA.

El gráfico de los litigios muestra una industria que ya discute su materia prima

David McCandless puso esa maraña en imágenes con un gráfico elaborado a partir de datos de una página web de referencia y de reportajes especializados. A veces un dibujo aclara mejor que un escrito judicial lo que está en juego, porque deja ver que en el centro del negocio no solo están los modelos, también está la procedencia de los materiales con que aprenden.

OpenAI, Google, Meta, Anthropic, NVIDIA y Perplexity aparecen dentro del mismo paisaje judicial, aunque sus casos no sean idénticos. La coincidencia importa porque sugiere que la disputa ya no afecta a una empresa concreta, sino a la costumbre entera de usar textos, imágenes o letras como combustible estadístico para entrenar máquinas.

Más de 100 demandas activas dicen una cosa con bastante claridad, el pleito ya no está en si la inteligencia artificial aprende, sino en de quién aprende.

Sobre el autor
Redacción
Ver biografía