Aquí vienen los abogados. La semana pasada, el New York Times demandó a Microsoft y OpenAI, en las que Microsoft ha invertido 13.000 millones de dólares y contando, por violaciones de derechos de autor. El Times afirma que Copilot, basado en genAI de Microsoft, y ChatGPT de OpenAI, que impulsa a Copilot, fueron entrenados utilizando millones de artículos sin el permiso del Times. Continúa argumentando que esas herramientas (y el motor de búsqueda de Microsoft, Bing) “ahora compiten con los medios de comunicación”. como fuente de información confiable”. El Times no solicita una cantidad específica de indemnización por daños y perjuicios… todavía. Sin embargo, en última instancia, quiere mucho – “miles de millones de dólares en daños legales y reales” – debido a la “copia y uso ilegal de las obras excepcionalmente valiosas del Times”. Más allá de eso, la presentación exige que Microsoft y OpenAI destruyan ambos conjuntos de datos. se utiliza para entrenar las herramientas y las herramientas mismas. Esta no es la primera demanda que alega que las empresas de inteligencia artificial violaron los derechos de autor al crear sus chatbots, y no será la última. Pero es el Gran Kahuna: el Times está entre los periódicos más conocidos del mundo y el estándar de oro en periodismo. Y su medida podría llegar a ser una de las demandas más influyentes de la era de las computadoras e Internet, quizás la más influyente. Esto se debe a que el resultado bien podría determinar el futuro de la IA generativa. ¿Quién tiene razón aquí? ¿El Times simplemente busca dinero y utiliza la demanda para negociar un mejor acuerdo de derechos con Microsoft y OpenAI para el uso de sus artículos? ¿O está defendiendo los derechos de todos los titulares de derechos de autor, por pequeños que sean, contra el ataque de los titanes de la IA? ¿Qué hay en la demanda? Para comprender mejor lo que implica, primero echemos un vistazo más de cerca a la tecnología subyacente involucrada y a la demanda en sí. Los chatbots GenAI como Copilot y ChatGPT están entrenados en grandes modelos de lenguaje (LLM), que incluyen enormes cantidades de datos, para que sean efectivos y útiles. Cuantos más datos, mejor. E igualmente importante es la calidad de los datos. Cuanto mejor sea la calidad de los datos, mejores serán los resultados de genAI. Microsoft y OpenAI utilizan contenido disponible en Internet para entrenar sus herramientas, independientemente de si ese contenido es información de dominio público, datos de fuente abierta o material protegido por derechos de autor; todo es ingerido por las grandes y hambrientas fauces de genAI. Eso significa que millones y millones de artículos del Times y muchas otras publicaciones se utilizan para la capacitación. Microsoft y OpenAI sostienen que esos artículos y todo el resto del material protegido por derechos de autor están cubiertos por la doctrina del uso legítimo. El uso legítimo es un concepto legal extremadamente complicado y confuso, y existe un flujo interminable de demandas que determinan qué es uso legítimo y qué no. Está ampliamente abierto a la interpretación. Por eso la demanda del Times es tan importante. Determinará si todas las herramientas genAI, no sólo las de Microsoft y OpenAI, pueden seguir entrenándose en material protegido por derechos de autor. (El contenido protegido por derechos de autor es muy valioso porque tiende a ser el más amplio y preciso. Y hay mucho). El uso legítimo del material protegido por derechos de autor generalmente se divide en dos categorías: comentarios y parodias. El uso del material debe ser “transformador”, en otras palabras; no puede simplemente copiar el material protegido por derechos de autor. Tiene que transformarlo de alguna manera. Entonces, por ejemplo, si alguien está escribiendo una reseña de una novela, puede citar varias líneas para dejar claro un punto. En un informe de noticias, el uso legítimo le permite resumir un artículo sobre un informe de investigación médica y citarlo brevemente. Microsoft y OpenAI dicen que su uso de material protegido por derechos de autor es transformador. Sostienen que el resultado de los chatbots transforma el contenido original en algo diferente. La demanda del Times afirma que no hay una transformación real, que lo que están haciendo Microsoft y OpenAI es un robo absoluto. Afirma que las empresas no sólo están robando el contenido del Times, sino también su audiencia, y ganando miles de millones de dólares con ello. La gente no tendrá necesidad de leer el Times ni en línea ni en forma impresa, si pueden obtener toda la información del periódico de forma gratuita a través de un chatbot, alega la demanda. Este párrafo resume los argumentos del Times: “No hay nada ‘transformador’ en utilizar el contenido del Times sin pago para crear productos que sustituyan al Times y le roben audiencias. Debido a que los resultados de los modelos GenAI de los demandados compiten con los insumos utilizados para entrenarlos y los imitan estrechamente, copiar el Times funciona para ese propósito no es un uso legítimo”. La demanda ofrece abundante evidencia para sus afirmaciones. Los ejemplos más atroces son muchos casos en los que ChatGPT plagia abiertamente artículos, incluida una investigación de 18 meses en cinco partes, ganadora del premio Pulitzer, sobre prácticas crediticias abusivas en la industria del taxi de la ciudad de Nueva York. La demanda acusa: «OpenAI no tuvo ningún papel en la creación de este contenido, pero con un mínimo de indicaciones, recitará grandes porciones palabra por palabra». Por su parte, OpenAI acusó el lunes al Times de manipular intencionalmente las indicaciones para lograr que ChatGPT regurgite su contenido. «Incluso cuando utilizamos tales indicaciones, nuestros modelos normalmente no se comportan de la forma en que insinúa The New York Times, lo que sugiere que le ordenaron al modelo que regurgitara o seleccionaron sus ejemplos de muchos intentos», dijo la compañía en una publicación de blog. No sólo el plagio es un problema. El Times señala que gasta una enorme cantidad de dinero y esfuerzo en su organización de noticias, y que si la gente puede recibir las últimas noticias de forma gratuita (incluso si están parafraseadas por un chatbot) no tendrán necesidad de leer el periódico. Más allá de eso , el editor descubrió que los chatbots de Microsoft y OpenAI toman información del sitio de revisión de productos Wirecutter del periódico, la publican y eliminan enlaces de referencia a los productos, de los cuales el Times obtiene ingresos. “Los demandados no solo copiaron el contenido del Times, sino también alteró el contenido eliminando enlaces a los productos, privando así al Times de la oportunidad de recibir ingresos por referencias y apropiándose de esa oportunidad para los demandados”, argumenta la demanda. Entonces, ¿quién tiene razón? Esta no es una decisión difícil. La respuesta es simple. El Times tiene razón. Microsoft y OpenAI están equivocados. Microsoft y OpenAI están obteniendo un viaje gratis para utilizar material protegido por derechos de autor cuya creación requiere una enorme cantidad de tiempo y dinero, y utilizan ese material para obtener grandes ganancias. Si el tribunal falla en contra del Times, los titulares de derechos de autor en todas partes (desde gigantes como el Times hasta escritores, artistas, fotógrafos y otros) tendrán dificultades para sobrevivir mientras Microsoft, OpenAI y otros fabricantes de IA engordan con ganancias. Una de las grandes ironías del Esta demanda es la que un joven Bill Gates se quejó enérgicamente cuando la gente pirateaba el primer producto de Microsoft, una versión de BASIC para la computadora personal Altair 8800, en lugar de pagar por él. Esto fue en 1975, cuando surgió la idea de pagar dinero por software. era un anatema para la mayoría de las personas que utilizaron las primeras computadoras personales. Reinaba un espíritu idealista de compartir y compartir por igual, especialmente entre aquellos que eran miembros del influyente Home Brew Computer Club. Así que un enojado Gates envió su “Carta abierta a los aficionados” al Home Brew Computer Club y a organizaciones relacionadas con la informática. publicaciones. Escribió, en parte: “La cantidad de regalías que hemos recibido por las ventas a aficionados hace que el tiempo dedicado a Altair BASIC valga menos de 2 dólares la hora. Como la mayoría de los aficionados deben saber, la mayoría de ustedes roba su software… ¿A quién le importa si las personas que trabajan en él cobran? “¿Quién puede permitirse el lujo de hacer un trabajo profesional a cambio de nada? ¿Qué aficionado puede poner? [three] ¿Años-hombre en programación, encontrando todos los errores, documentando su producto y distribuyéndolo de forma gratuita? … Más directamente, lo que haces es robar”. No hay mucha diferencia entre lo que se quejaba Gates y lo que Microsoft está haciendo ahora. Gates tenía razón en aquel entonces. Microsoft y OpenAI están equivocados en este momento. Deberían llegar a un acuerdo con el Times y otros titulares de derechos de autor o volver a entrenar su IA de una manera que no viole las leyes de derechos de autor. Y lo mismo ocurre con todos los demás creadores de IA. Copyright © 2024 IDG Communications, Inc.

Source link