Cómo la IA cambia el copyright: tres claves de fondo

La inteligencia artificial no solo reescribe textos o compone imágenes: también está obligando a reescribir las reglas del copyright. El uso masivo de obras protegidas para entrenar modelos generativos ha abierto un conflicto legal sin precedentes.
Y, en medio de demandas millonarias y proyectos regulatorios en Europa, aparece un fenómeno inesperado: la gestión colectiva de derechos —el mismo mecanismo que transformó la música hace un siglo— como posible modelo para regular el futuro de la IA.
Protocolos técnicos: del robots.txt a la blockchain
Para entender qué está en juego, conviene mirar atrás. A finales del siglo XIX, los compositores franceses descubrieron que era imposible negociar de manera individual con cada café, teatro o pianista que interpretaba sus obras. La solución fue la creación de entidades de gestión colectiva, como la SACEM en 1850 o la SGAE en 1899. Más tarde, en Estados Unidos, la ASCAP estandarizó el cobro de licencias a bares, radios y televisiones. Así nació un sistema de tarifas colectivas en el que cada local paga una cuota fija y esa recaudación se reparte entre los autores.
El paralelismo con la IA es inmediato. Si en el siglo XIX había miles de cafés tocando canciones sin permiso, en el XXI hay millones de páginas web, artículos y libros usados para entrenar modelos. Negociar licencia por licencia sería inviable. La respuesta empieza a tomar forma con protocolos técnicos.
Uno de ellos es el Real Simple Licensing (RSL), creado por Eckart Walther, cocreador del estándar RSS. Para entenderlo basta pensar en el archivo robots.txt: un pequeño documento que toda web incluye y que indica a los bots qué pueden rastrear. RSL da un paso más: permite incluir en ese archivo no solo permisos de acceso, sino también condiciones de uso y tarifas para el entrenamiento de IA.
Una web podría señalar: «Puedes usar mi contenido gratis si me citas» o «puedes usarlo, pero debes pagar una suscripción mensual». Incluso contempla un modelo de pago por inferencia, en el que cada vez que un modelo emplea esa información para generar una respuesta, se factura al creador original.
Grandes plataformas como Reddit, Yahoo o Quora ya apoyan esta idea. Y no es casualidad: la presión legal es enorme. Solo Anthropic, uno de los laboratorios más avanzados, ha tenido que pagar 1.500 millones de dólares para cerrar una de las múltiples demandas en curso.
En paralelo surge otra propuesta: el estándar DSNP-AI, ideado por Dave Winer, pionero de la web. Su lógica es distinta: etiquetas incrustadas en el propio contenido, registradas en blockchain. Funcionan como huellas dactilares: cada vez que un dato se usa para entrenar un modelo, queda constancia y se factura automáticamente. La promesa es atractiva: un sistema transparente, automático y casi imposible de manipular. Pero, como ocurre con cualquier estándar, solo funcionará si millones de medios y plataformas lo adoptan.
Gestión colectiva y legislación europea
Europa explora otro camino: las licencias colectivas ampliadas. España ya ha propuesto un Real Decreto inspirado en la Directiva 2019/790. En la práctica significa que una entidad de gestión, como la SGAE en música, puede autorizar el uso de millones de obras para entrenar IA, sin necesidad de que cada autor negocie por separado. Los creadores mantienen el derecho de exclusión , pero, si no lo ejercen, sus obras entran en el paquete colectivo.
El sistema prevé una duración máxima de tres años, remuneración incluso para autores no afiliados y aplicación exclusiva al entrenamiento de IA. Es un intento de trasladar al terreno digital el mismo mecanismo que permitió que la música sonara en bares y radios sin un caos contractual permanente.
La Ley de IA de la UE introduce, además, obligaciones de transparencia, etiquetado de outputs y respeto de reservas de derechos. Sobre el papel, protege a los creadores. En la práctica, corre el riesgo de consolidar monopolios: solo las grandes tecnológicas tienen recursos para negociar miles de licencias o defenderse en los tribunales.
Ejemplos recientes lo muestran: la startup Ross Intelligence quebró tras ser demandada por Westlaw, mientras Getty Images denunció a Stable Diffusion y luego lanzó su propio generador de imágenes. Además, exigir licencias caso por caso podría hacer inviable la investigación científica basada en minería de datos. Herramientas como AlphaFold, que han revolucionado la biomedicina, dependen de analizar grandes volúmenes de información. Si cada dato necesitara permiso, avances cruciales se paralizarían.
El dilema del poder: quién gana y quién pierde
Más allá de lo legal y lo técnico, el núcleo del debate es quién se beneficia de este nuevo paradigma.
Por un lado, las grandes corporaciones cuentan con los recursos para negociar licencias, litigar y hasta imponer sus propios estándares. Por otro, los pequeños medios, las startups y los artistas independientes corren el riesgo de quedar fuera del sistema. El resultado podría ser un mercado concentrado, donde los que ya dominan internet refuercen su poder.
El debate afecta también a la libertad de expresión. La IA generativa permite que cualquiera, sin formación artística, cree imágenes, textos o música. Para comunidades marginadas, es una herramienta de democratización. Limitar las fuentes de entrenamiento puede restringir esa capacidad. La artista Nettrice Gaskins lo recuerda: el hip hop y el collage nacieron de la reutilización de materiales preexistentes. Un copyright demasiado rígido corre el riesgo de levantar las mismas barreras que ya han excluido a muchas voces.
El copyright como arquitectura de poder
El futuro parece orientarse hacia un modelo híbrido: protocolos como RSL o DSNP-AI, combinados con licencias colectivas gestionadas por entidades tradicionales. Un sistema así podría dar seguridad jurídica a las empresas de IA, permitir a los creadores monetizar su contenido y evitar un bloqueo a la investigación científica.
Pero la pregunta sigue abierta: ¿será un sistema equitativo o un estándar impuesto por unos pocos grandes actores?
Lo que está en juego no es solo la protección de autores, sino el modelo de gobernanza del conocimiento en la era digital. Igual que la música encontró en las licencias colectivas una solución a su caos inicial, la IA está forzando una transición hacia estructuras más colectivas y protocolarias.
El copyright nació como un derecho individual en el siglo XVIII. En el XXI parece transformarse en una arquitectura distribuida, hecha de protocolos y contratos colectivos. La IA no solo genera textos o imágenes: está generando un nuevo paradigma de propiedad intelectual.