El Fallo de Hamburgo. Un hito en el uso de la minería de datos para el entrenamiento de la IA.
La Sentencia del pasado 27 de setiembre, emitida por el Tribunal Regional de Hamburgo, constituye un precedente claro en el uso de la minería de datos y textos para el entrenamiento de sistemas de inteligencia artificial (IA) con fines científicos.
Se trata de la primera sentencia europea que permite usar obras protegidas sin contar con la autorización del autor a través de la técnica de la minería de datos y textos (o TDM, por sus siglas en inglés) para fines de investigación científica. Esta técnica consiste en la extracción y recopilación de grandes volúmenes de datos para descubrir patrones, tendencias y correlaciones que serán usadas posteriormente para utilidades como la creación de estadísticas de mercado o el entrenamiento de sistemas de IA. El material utilizado puede provenir de páginas web, libros, artículos, imágenes, etc.
Contexto del Caso. El fotógrafo Robert Kneschke contra LAION.
El caso enfrentaba al fotógrafo Robert Kneschke contra la organización sin ánimo de lucro LAION, una organización dedicada a la creación de grandes bases de datos para el entrenamiento de sistemas de IA.
LAION descargó una imagen del fotógrado desde Bigstockphoto, una plataforma de promoción y venta de fotografías. La imagen del fotógrafo acabó en LAION-5B, un dataset de la compañía con más de 5 mil millones de URLs de imágenes y textos destinada al entrenamiento de distintas IA.
Tras lo anterior, el fotógrafo alegó que la descarga y uso de la imagen sin su consentimiento constituye una infracción de sus derechos de autor, concretamente, del derecho de reproducción protegido por la ley alemana de derechos de autor, la Urheberrechtsgesetz (UrhG).
La tarea del Tribunal se centró en analizar si la actividad de LAION constituye una infracción de los derechos de autor del fotógrafo o si, por el contrario, se encuentra protegida por las excepciones legales establecidas por la legislación alemana y, por tanto, la entidad podía minar la imagen para sus propios fines.
La defensa de LAION. Excepciones de la ley alemana de derechos de autor y la vinculatoriedad de la cláusula opt-out.
En la disputa legal, LAION no negó haber realizado una copia de la imagen del fotógrafo, pero afirmó que su uso se encuentra amparado en las excepciones 44a, 44b y 60d de la UrhG. En concreto, estas son:
- Sección 44a UrhG. Este precepto establece que son lícitos los actos de reproducción provisional sobre obras protegidas, siempre y cuando se cumplan una serie de condiciones, entre las que se encuentran la transitoriedad o accesoriedad de las copias y que no generen, por sí mismas, beneficios económicos.
- Sección 44b UrhG. Permite la minería de obras digitalizadas y legalmente accesibles al público para la obtención de información, que es el propósito último de la minería de textos y datos. No obstante, no permite la minería si el titular de los derechos (Robert Kneschke, en este caso), hubiera expresado una exclusión voluntaria o cláusula “opt out” sobre dicho uso, exclusión que, como menciona el artículo, sólo será efectiva si se realiza en un formato que sea legible por máquina.
El “formato legible por máquina” al que hace mención dicha sección, es aquel susceptible de ser captado por sistemas automatizados, esto es, capaces de presentar la información de manera tal que pueda ser reconocida y procesada por sistemas informáticos. A estos efectos, el Tribunal alemán ha sostenido que el lenguaje natural es perfectamente comprensible para los sistemas de IA actuales.
En el caso que nos ocupa, Bigstockphoto contaba con una exclusión “opt-out” en sus Términos de Servicio, por la cual quedaba expresamente prohibido que bots y programas automatizados minaran el contenido de la plataforma. A pesar de que esta cláusula se encontrara redactada en lenguaje natural, el Tribunal dio indicios de que podía ser “legible por máquina”, dada la reciente evolución de las IA y su capacidad para procesar textos redactados con intervención humana.
- Sección 60d UrhG. Esta sección permite que algunas entidades, como organizaciones de investigación, extraigan textos y datos con fines científicos, siempre y cuando no se persigan propósitos comerciales, destinen todos los beneficios a la investigación científica o actúen en nombre del interés público, sobre las bases de un mandato aprobado por el Estado.
En este contexto, LAION defendió su postura argumentado que, al ser una entidad sin ánimo de lucro dedicada al avance de la investigación científica de la inteligencia artificial, su propósito se encuentra lejos de intereses comerciales y que los datos recopilados se encuentran disponibles públicamente.
La admisión de la excepción 60d Urhg por parte del Tribunal.
Tras valorar los argumentos de ambas partes, el Tribunal alemán consideró que la actividad de LAION se encuentra dentro de la excepción 60d UrhG, al ser una entidad sin ánimo de lucro formada por investigadores que persiguen el propósito de desarrollar algoritmos de autoaprendizaje en el contexto de la Inteligencia artificial y ponerlos a disposición del público en general, contribuyendo al desarrollo de modelos de aprendizaje automático y de técnicas avanzadas de IA como un recurso que terceros podrán usar.
No obstante, el Tribunal no admitió la excepción del 44a, al considerar que la descarga de la imagen del fotógrafo no fue transitoria ni accidental, sino que se trató de una actividad controlada.
Consecuencias e impacto jurídico del fallo de Hamburgo sobre la minería de datos y textos
El resultado del caso deja entrever la compleja conexión existente entre la inteligencia artificial y el ámbito de la propiedad intelectual (concretamente, en relación con los derechos de autor). Como se ha expuesto, el fallo establece un precedente para que entidades sin fines comerciales y dedicadas a la investigación científica usen la minería de datos y textos sin costes ni licencias, sin que eso constituya una infracción de los derechos de autor, de conformidad con lo establecido en la Sección 60d de la ley alemana de derechos de autor, la Urheberrechtsgesetz (UrhG).
Aunque no hay dudas de que esta disposición es un claro incentivo para el campo de la innovación tecnológica, genera asimismo incertidumbre respecto la posible falta de control sobre el uso de las obras para sus creadores, lo que podría incidir en su decisión de explotar o no sus creaciones. El debate sobre el equilibrio justo entre fomentar la innovación tecnológica y proteger el derecho de autor está servido.
Si necesitas asesoramiento en temas de derecho digital y propiedad intelectual, contamos con abogados especializados que pueden ayudarte a resolver cualquier inquietud sobre el uso de datos en inteligencia artificial.