Comenta esta historiaComentarAgregar a tus historias guardadasGuardarSi un medio de comunicación copiara un montón de historias del New York Times y las publicara en su sitio, probablemente se consideraría una violación flagrante de los derechos de autor del Times. Pero, ¿qué pasa cuando una empresa de tecnología copia esas mismas? artículos, los combina con innumerables otros trabajos copiados y los utiliza para entrenar un chatbot de inteligencia artificial capaz de conversar sobre casi cualquier tema, incluidos los que conoció a través del Times. Esa es la cuestión legal en el centro de una demanda que el Times presentó contra OpenAI y Microsoft comparecieron ante un tribunal federal la semana pasada, alegando que las empresas de tecnología utilizaron ilegalmente “millones” de artículos del Times con derechos de autor para ayudar a desarrollar los modelos de IA detrás de herramientas como ChatGPT y Bing. Es el último, y algunos creen que el más fuerte, de una serie de demandas activas que alegan que varias empresas de tecnología e inteligencia artificial han violado la propiedad intelectual de empresas de medios, sitios de fotografía, autores de libros y artistas. los cimientos de la floreciente industria de la IA generativa, dicen algunos expertos legales, pero también podrían fracasar. Esto se debe a que es probable que las empresas de tecnología se apoyen en gran medida en un concepto legal que les ha sido útil en el pasado: la doctrina conocida como “uso justo”. En términos generales, la ley de derechos de autor distingue entre copiar palabra por palabra el trabajo de otra persona, lo cual generalmente es ilegal. – y “remezclar” o darle un uso nuevo y creativo. Lo que es confuso acerca de los sistemas de IA, dijo James Grimmelmann, profesor de derecho digital y de la información en la Universidad de Cornell, es que en este caso parecen estar haciendo ambas cosas. La IA generativa representa «esta gran transformación tecnológica que puede crear una versión remezclada de cualquier cosa». ”, dijo Grimmelmann. «El desafío es que estos modelos también pueden memorizar descaradamente obras en las que fueron entrenados y, a menudo, producir copias casi exactas», lo cual, dijo, es «tradicionalmente el núcleo de lo que prohíbe la ley de derechos de autor». utilizado para grabar programas de televisión y películas, hasta Google Books, que digitalizó millones de libros, las empresas estadounidenses han convencido a los tribunales de que sus herramientas tecnológicas equivalían a un uso legítimo de obras protegidas por derechos de autor. OpenAI y Microsoft ya están montando una defensa similar. “Creemos que el entrenamiento de modelos de IA califica como un uso legítimo, que coincide exactamente con los precedentes establecidos que reconocen que el uso de materiales protegidos por derechos de autor por parte de innovadores tecnológicos de manera transformadora es totalmente consistente con los derechos de autor. ley”, escribió OpenAI en una presentación ante la Oficina de Derechos de Autor de EE. UU. en noviembre. Los sistemas de IA generalmente están “entrenados” en conjuntos de datos gigantescos que incluyen grandes cantidades de material publicado, gran parte del cual está protegido por derechos de autor. A través de esta capacitación, llegan a reconocer patrones en la disposición de palabras y píxeles, que luego pueden utilizar para ensamblar prosa e imágenes plausibles en respuesta a casi cualquier indicación. Algunos entusiastas de la IA ven este proceso como una forma de aprendizaje, no como a diferencia de un estudiante de arte que devora libros sobre Monet o un adicto a las noticias que lee el Times de principio a fin para desarrollar su propia experiencia. Pero los demandantes ven un proceso más cotidiano en funcionamiento bajo el capó de estos modelos: es una forma de copia, y además una copia no autorizada. «No se trata de aprender los hechos como lo haría un cerebro», dijo Danielle Coffey, directora ejecutiva de News. /Media Alliance, un grupo comercial que representa a más de 2.000 organizaciones de medios, incluidos el Times y The Washington Post. «Es literalmente escupirte las palabras». Hay dos aspectos principales del caso del New York Times contra OpenAI y Microsoft. En primer lugar, al igual que otras demandas recientes por derechos de autor de IA, el Times argumenta que sus derechos fueron infringidos cuando sus artículos fueron “raspados” (o escaneados y copiados digitalmente) para incluirlos en los gigantescos conjuntos de datos en los que se entrenaron GPT-4 y otros modelos de IA. A esto a veces se le llama el lado de la “entrada”. En segundo lugar, la demanda del Times cita ejemplos en los que el modelo de lenguaje GPT-4 de OpenAI (versiones del cual funcionan tanto para ChatGPT como para Bing) pareció arrojar resúmenes detallados de artículos de pago, como el producto Wirecutter de la compañía. reseñas o secciones enteras de artículos específicos del Times. En otras palabras, alega el Times, las herramientas también violaron sus derechos de autor con su “salida”. Hasta ahora, los jueces han sido cautelosos ante el argumento de que entrenar un modelo de IA en obras protegidas por derechos de autor (el lado de la “entrada”) equivale a una violación en mismo, dijo Jason Bloom, socio de la firma de abogados Haynes and Boone y presidente de su grupo de litigios de propiedad intelectual. “Técnicamente, hacer eso puede ser una infracción de derechos de autor, pero es más probable que se considere uso legítimo, según el precedente, porque no estás mostrando públicamente el trabajo cuando simplemente lo estás bebiendo y entrenando”, dijo Bloom. (Bloom no está involucrado en ninguna de las demandas activas por derechos de autor de IA). El uso legítimo también puede aplicarse cuando la copia se realiza con un propósito diferente a la simple reproducción del trabajo original, como criticarlo o usarlo con fines educativos o de investigación. , como un profesor que fotocopia un artículo de noticias para entregarlo en una clase de periodismo. Así es como Google defendió Google Books, un ambicioso proyecto para escanear y digitalizar millones de libros protegidos por derechos de autor de bibliotecas públicas y académicas para que sus contenidos pudieran buscarse en línea. El proyecto desató una demanda en 2005 por parte del Authors Guild, que lo calificó de “descarado”. violación de la ley de derechos de autor”. Pero Google argumentó que al mostrar sólo “fragmentos” de los libros en respuesta a las búsquedas, no estaba socavando el mercado de libros sino brindando un servicio fundamentalmente diferente. En 2015, un tribunal federal de apelaciones estuvo de acuerdo con Google. Ese precedente debería funcionar a favor de OpenAI, Microsoft y otras empresas de tecnología, dijo Eric Goldman, profesor de la Facultad de Derecho de la Universidad de Santa Clara y codirector de su Instituto de Derecho de Alta Tecnología. «Voy a adoptar la posición, basándome en los precedentes, de que si los resultados no infringen la ley, entonces cualquier cosa que haya ocurrido antes tampoco lo es», dijo Goldman. “Muéstrame que la salida está infringiendo. Si no es así, entonces se acabó el caso de derechos de autor”. OpenAI y Microsoft también son objeto de otras demandas por derechos de autor de IA, al igual que empresas rivales de IA, incluidas Meta, Stability AI y Midjourney, algunas de las cuales apuntan a chatbots basados ​​en texto y otras a generadores de imágenes. Hasta ahora, los jueces han desestimado partes de al menos dos casos en los que los demandantes no lograron demostrar que los resultados de la IA eran sustancialmente similares a sus obras protegidas por derechos de autor. En contraste, la demanda del Times proporciona numerosos ejemplos en los que una versión de GPT-4 reproducía grandes pasajes de texto idénticos a los de los artículos del Times en respuesta a ciertas indicaciones. Eso podría ser de gran ayuda para un jurado, si el caso llega tan lejos, dijo Blake Reid, profesor asociado de Derecho de Colorado. Pero si los tribunales determinan que sólo esos productos específicos están infringiendo, y no el uso del material protegido por derechos de autor para capacitación, agregó, eso podría resultar mucho más fácil de arreglar para las empresas de tecnología. La posición de OpenAI es que los ejemplos en la demanda del Times son aberraciones. – una especie de error en el sistema que hizo que leyera pasajes palabra por palabra. Tom Rubin, jefe de propiedad intelectual y contenido de OpenAI, dijo que el Times parece haber manipulado intencionalmente sus indicaciones al sistema de IA para que reproduzca sus datos de entrenamiento. . Dijo por correo electrónico que los ejemplos de la demanda «no reflejan el uso previsto o el comportamiento normal del usuario y violan nuestros términos de uso». «Muchos de sus ejemplos no son replicables hoy», agregó Rubin, «y continuamente fabricamos nuestros productos». más resistentes a este tipo de uso indebido”. El Times no es la única organización que ha encontrado sistemas de inteligencia artificial que producen resultados que se parecen a obras protegidas por derechos de autor. Una demanda presentada por Getty Images contra Stability AI señala ejemplos de su generador de imágenes Stable Diffusion que reproduce la marca de agua de Getty. Y una publicación de blog reciente del experto en inteligencia artificial Gary Marcus muestra ejemplos en los que Image Creator de Microsoft parecía generar imágenes de personajes famosos de películas y programas de televisión. Microsoft no respondió a una solicitud de comentarios. El Times no especificó la cantidad que busca. , aunque la empresa estima que los daños ascienden a “miles de millones”. También pide una prohibición permanente del uso sin licencia de su trabajo. Más dramáticamente, pide que se destruyan todos los modelos de IA existentes entrenados en el contenido del Times. Debido a que los casos de IA representan un nuevo terreno en la ley de derechos de autor, no está claro cómo los jueces y jurados decidirán en última instancia, coincidieron varios expertos legales. Mientras que el caso de Google Books podría funcionar a favor de las empresas tecnológicas, el panorama del uso legítimo se vio empañado por la reciente decisión de la Corte Suprema en un caso que involucraba el uso por parte del artista Andy Warhol de una fotografía de la estrella de rock Prince, dijo Daniel Gervais, profesor de Vanderbilt Law y director de su programa de propiedad intelectual. El tribunal determinó que si la copia se realiza para competir con la obra original, “eso va en contra del uso legítimo” como defensa. Así que el caso del Times puede depender en parte de su capacidad para demostrar que productos como ChatGPT y Bing compiten con su negocio y lo perjudican. “Cualquiera que prediga el resultado está asumiendo un gran riesgo”, dijo Gervais. Dijo que para los demandantes empresariales como el New York Times, un resultado probable podría ser un acuerdo que otorgue a las empresas de tecnología una licencia para el contenido a cambio de un pago. El Times pasó meses en conversaciones con OpenAI y Microsoft, que posee una participación importante en OpenAI, antes de que el periódico presentara una demanda, según reveló el Times en su demanda. Algunas empresas de medios ya han llegado a acuerdos sobre el uso de su contenido. El mes pasado, OpenAI acordó pagar al conglomerado de medios alemán Axel Springer, que publica Business Insider y Politico, para que muestre partes de artículos en las respuestas de ChatGPT. La compañía de tecnología también llegó a un acuerdo con Associated Press para acceder a los archivos del servicio de noticias. Una victoria del Times podría tener importantes consecuencias para la industria de las noticias, que ha estado en crisis desde que Internet comenzó a suplantar a los periódicos y revistas hace casi 20 años. . Desde entonces, los ingresos por publicidad en los periódicos han disminuido constantemente, el número de periodistas activos ha disminuido dramáticamente y cientos de comunidades en todo el país ya no tienen periódicos locales. Pero incluso cuando los editores buscan pago por el uso de sus materiales generados por humanos para capacitar AI, algunos también publican trabajos producidos por AI, lo que ha provocado reacciones negativas y vergüenza cuando esos artículos creados por máquinas están plagados de errores. Grimmelmann, de Cornell, dijo que los casos de derechos de autor de AI podrían, en última instancia, depender de las historias que cada lado cuente sobre cómo sopesar las ventajas de la tecnología. daños y beneficios. “Mire todas las demandas, y están tratando de contar historias sobre cómo estas son simplemente máquinas de plagio que estafan a los artistas”, dijo. “Mira el [AI firms’ responses]y están tratando de contar historias sobre todas las cosas realmente interesantes que estas IA pueden hacer y que son genuinamente nuevas y emocionantes”. Reid, de Colorado Law, señaló que los gigantes tecnológicos pueden ser acusados ​​menos comprensivos hoy para muchos jueces y jurados que hace una década. hace cuando se estaba decidiendo el caso de Google Books. “Hay una razón por la que se escucha mucho sobre innovación, código abierto y nuevas empresas” de la industria tecnológica, dijo. «Hay una carrera para determinar quién es el David y quién es el Goliat aquí».

Source link