2023-07-22 01:44:46
La comediante y autora Sarah Silverman, así como los autores Christopher Golden y Richard Kadrey, han demandado a OpenAI y Meta por infracción de derechos de autor. OpenAI y Meta cada uno en un Tribunal de Distrito de EE.UU. sobre doble demanda por infracción de derechos de autor.
En las demandas se alega, entre otras cosas, que ChatGPT de OpenAI y LLaMA de Meta se entrenaron con conjuntos de datos adquiridos ilegalmente que contenían sus obras, que, según dicen, se adquirieron en sitios web de «bibliotecas en la sombra» como Bibliotik, Library Genesis, Z-Library y otros, señalando que los libros están «disponibles a granel a través de sistemas de torrents».
Golden y Kadrey declinaron hacer comentarios sobre la demanda, mientras que el equipo de Silverman no respondió al cierre de esta edición.
En la demanda de OpenAI, el trío ofrece pruebas que demuestran que, cuando se le solicita, ChatGPT resume sus libros, infringiendo sus derechos de autor. Silverman Bedwetter es el primer libro que aparece resumido por ChatGPT en las pruebas, mientras que el libro de Golden Ararat también se utiliza como ejemplo, al igual que el libro de Kadrey Sandman Slim. La demanda dice que el chatbot nunca se molestó en «reproducir ninguna de las informaciones de gestión de derechos de autor que los demandantes incluyeron con sus obras publicadas.»
En cuanto a la demanda separada contra Meta, alega que los libros de los autores eran accesibles en los conjuntos de datos que Meta utilizaba para entrenar sus modelos LLaMA, un cuarteto de modelos de IA de código abierto que la empresa presentó en febrero.
En la denuncia se exponen pormenorizadamente los motivos por los que los demandantes creen que los conjuntos de datos tienen un origen ilícito -en un Meta paper que detalla LLaMA, la empresa señala fuentes para sus conjuntos de datos de entrenamiento, uno de los cuales se llama ThePile, que fue reunido por una empresa llamada EleutherAI. ThePile, señala la denuncia, se describió en un EleutherAI como elaborado a partir de «una copia del contenido del rastreador privado Bibliotik». Bibliotik y las otras «bibliotecas en la sombra» enumeradas, dice la demanda, son «flagrantemente ilegales».
En ambas demandas, los autores afirman que «no consintieron el uso de sus libros protegidos por derechos de autor como material de entrenamiento» para los modelos de IA de las empresas. Cada una de sus demandas contiene seis cargos por diversos tipos de violación de los derechos de autor, negligencia, enriquecimiento injusto y competencia desleal. Los autores reclaman daños y perjuicios, restitución de beneficios, etc.
Los abogados Joseph Saveri y Matthew Butterick, que representan a los tres autores, escriben en su página web LLMlitigation website que han tenido noticias de «escritores, autores y editores que están preocupados por [ChatGPT’s] extraña capacidad para generar texto similar al que se encuentra en materiales textuales protegidos por derechos de autor, incluidos miles de libros».
Saveri también ha iniciado litigios contra empresas de IA en nombre de programadores y artistas. Getty Images también presentó una demanda por IA, alegando que Stability AI, creadora de la herramienta de generación de imágenes por IA Stable Diffusion, entrenó su modelo en «millones de imágenes protegidas por derechos de autor.» Saveri y Butterick también representan a los autores Mona Awad y Paul Tremblay en un caso similar sobre el chatbot de la empresa.
Demandas como ésta no son sólo un quebradero de cabeza para OpenAI y otras empresas de IA; están desafiando los límites mismos de los derechos de autor. Como hemos dicho en El Vergecast cada vez que alguien se pone Nilay en marcha en la ley de derechos de autor, vamos a ver demandas centradas en torno a estas cosas en los años venideros.
Nos hemos puesto en contacto con Meta, OpenAI y el bufete de abogados Joseph Saveri para hacer comentarios, pero no han respondido al cierre de esta edición.