Como el alimento que sirve a las plantas para crecer, la inteligencia artificial necesita grandes conjuntos de datos para enriquecerse y mejorar su funcionamiento y capacidades. El problema es el origen de esos datos. Los artistas y escritores dieron la voz de alarma el año pasado con el auge de esta tecnología al ver sus obras engullidas por esos modelos generativos capaces de imitar su estilo y dejarles sin trabajo. Esta batalla judicial está en auge con varias sentencias a favor de los autores.

La lucha también se ha extendido a las redes sociales y el uso de los datos de los usuarios. La Unión Europea obligó a Meta a parar el uso de los datos de Instagram y Facebook para entrenar su IA. En España, la Agencia Española de Protección de Datos (AEPD) y sus equivalentes en otros países europeos, han recibido críticas por el mismo trato por parte de Elon Musk y su red social X en esta última semana. 

Aunque ahora se actúa con mayor celeridad, aquellos datos que se usan para entrenar una IA difícilmente se recuperan. En este punto se encuentran los artistas que han visto su obra en herramientas como Stable Diffusion y ChatGPT. Estos generadores de imágenes artificiales se han entrenado con grandes volúmenes de obras de arte protegidas por el derecho de autor, pero sin el permiso de sus creadores, y ahora replican su estilo para los usuarios.

Demanda con la IA

Una reciente sentencia da cierta esperanza a los demandantes. El año pasado, el juez William Orrick admitió una demanda contra Stability, operador del popular generador de imágenes de inteligencia artificial Stable Diffusion, y otras empresas. Aunque se desestimó una variedad de reclamaciones y pidió a los abogados de los artistas que las modificaran con más detalles.

En la sentencia más reciente, el juez ha desestimado algunos recursos, pero admitido otros, lo que permite continuar con la demanda. Kelly McKernan, una de las artistas que está detrás de la demanda, describió en su cuenta de X (Twitter) este nuevo fallo como "muy emocionante" y "una GRAN victoria".

La principal alternativa a Midjournet, Stable Diffusion, al evolucionado a lo grande

Entre los argumentos admitidos, los abogados de los artistas denuncian que Midjourney engañó a los usuarios con una "Lista de estilos de Midjourney" que incluía 4.700 artistas cuyos nombres podían utilizarse para generar obras con su estilo. Los artistas sostienen que no tenían conocimiento ni habían aprobado el uso de su nombre y obra en esa lista, lo que implica una falsa promoción.

El juez ha considerado que la acusación es lo suficientemente sustancial, así como otras que señalan las herramientas DeviantArt y Runway AI que deberán ser debatidas en el tribunal. Por el contrario, el juez desestimó afirmaciones como que DeviantArt había incumplido sus términos de servicio al permitir que se extrajeran los trabajos de los usuarios para rellenar el conjunto de datos de entrenamiento de IA.

Utilizando artículos y libros

Por otro lado, el grupo de cumplimiento de derechos de autor BREIN, con sede en Holanda, ha retirado un gran conjunto de datos lingüísticos que se ofrecía para su uso en el entrenamiento de modelos de inteligencia artificial. El conjunto de datos incluía información recopilada sin permiso de decenas de miles de libros, sitios de noticias y subtítulos en holandés extraídos de "innumerables" películas y series de televisión, afirmó BREIN en un comunicado. No se sabe aún si el conjunto se ha usado en alguna IA.

Las empresas, por su parte, argumentan que el entrenamiento con estos datos debería considerarse un uso legítimo y legal. Hasta ahora, algunas de las demandas han sido desestimadas, mientras otras siguen en curso como la batalla legal entre el periódico New York Times y OpenAI por el uso de sus artículos para entrenar a ChatGPT. 

Para evitar nuevas críticas, algunos de los generadores de IA más poderosos como OpenAI o Google han cerrado acuerdos multimillonarios con editoriales, Vox Media por ejemplo, y proveedores de fotografías para acceder a los datos de forma continua. Sin embargo, no todos los desarrolladores tienen esa capacidad económica para adquirir contenido pagando a sus autores.