Litigio en Alemania entre Gema y OpenAI por uso de letras de canciones en entrenamiento de IA

EntornoInteligencia artificial

Litigio en Alemania entre Gema y OpenAI por uso de letras de canciones en entrenamiento de IA

Un proceso legal en Alemania analiza si OpenAI infringió derechos de autor al usar letras de canciones en su entrenamiento de IA.

Descripción

Un litigio importante en Alemania sobre el uso de letras de canciones por parte de OpenAI, la empresa matriz de ChatGPT, parece inclinarse a favor de la organización de gestión de derechos Gema. La primera evaluación realizada por la jueza Elke Schwager en la fase preliminar del proceso ante el Tribunal Regional de Múnich indicó que, en la mayoría de los aspectos centrales, los argumentos de Gema tienen mayor peso. Sin embargo, todavía no se puede determinar si la cifra del juicio, que alcanza los 600.000 €, se mantendrá al cierre del proceso.

El conflicto legal se centra exclusivamente en los textos de nueve canciones, entre ellas «Atemlos», «Bochum», «Männer», «Über den Wolken» e «In der Weihnachtsbäckerei». Todos estos textos fueron utilizados como parte del entrenamiento de la inteligencia artificial. Gema acusa a OpenAI de memorizar y reproducir estos textos en su sistema, lo que implicaría una reproducción reiterada y, por tanto, una violación de derechos de autor. Además, sostiene que los textos se copian de nuevo cada vez que se generan respuestas, lo que causaría una posible infracción adicional.

OpenAI argumenta que sus datos no se memorizan, sino que el sistema refleja simplemente lo aprendido durante el entrenamiento, lo que permitiría que las respuestas sean versiones modificadas de los textos originales. La defensa también señaló que, en algunos casos, las respuestas contienen versiones alteradas de las letras, lo que sugiere que no hay una reproducción exacta. Sin embargo, la jueza Schwager consideró en su evaluación preliminar que la evidencia indica que sí existe memorización y reproducción de los textos.

Un punto clave en la argumentación es que, si el sistema, tras entrenarse con estos textos, reproduce respuestas casi idénticas a las originales en consultas sencillas, difícilmente puede atribuirse solo a la casualidad o a una función del sistema, lo que sugiere que los datos se habrían memorizado efectivamente. Además, la jueza rechazó que la responsabilidad recaiga únicamente en el usuario final y responsabilizó a OpenAI por su selección de datos y la arquitectura del sistema, que parecen facilitar esta reproducción de contenidos protegidos.

El proceso judicial continúa en marcha y no se descarta que, en algún momento, la causa sea remitida al Tribunal de Justicia de la Unión Europea por la posible trascendencia de los derechos implicados.