Etiqueta: libros3

Groucho Marx dijo que no quería pertenecer a ningún club que lo tuviera como socio. Me pregunto cómo se sentiría si fuera uno de los autores cuyos libros han sido pirateados por, entre otros, Meta, que ha introducido una enorme base de datos de libros en LLaMMa, su entrada en la carrera armamentista de inteligencia artificial. Después de todo, Groucho es un miembro, reclutado desde más allá de la tumba, con dos de sus libros entre las decenas de miles de la lista. A los demás autores tampoco nadie les preguntó si querían pertenecer al club de los escritores explotados, suponiendo sin duda que la respuesta sería no. Puedo escuchar el tono: Hola. Has pasado tu vida contando historias. Ahora nos gustaría tomar todo ese trabajo duro y dárselo a nuestros sistemas de IA, a pesar de sus protecciones de derechos de autor, para que pueda alimentar programas que, sí, amenazan con sacarlo del negocio y hacer que la IA gane mucho dinero. mientras no ganes ni un centavo. Suena genial, ¿verdad? ¿No? OK no importa. Simplemente lo registraremos de todos modos y no se lo diremos. Se han presentado demandas, lo que lamentablemente recuerda el cliché de cerrar la puerta del granero después de que el caballo se haya escapado. En este caso estamos hablando de una estampida: Books3, un conjunto de datos que alimenta a LLaMMa así como a algunos de sus competidores, sugiere de manera obvia y precisa la existencia de Books1 y Books2, y no son los únicos programas que están devorando libros. en nombre de empresas de IA. Supongo que los autores que demanden podrían obtener un acuerdo financiero en el futuro, y tal vez incluso eliminar sus trabajos del conjunto de datos, pero en realidad, quién sabe si es posible desenseñar la IA, hacer que olvide las lecciones aprendidas de los trabajos. de Sarah Silverman, o Zadie Smith, o Jonathan Franzen, por mencionar algunos de los demandantes. Peor aún, o al menos tremendamente irónico, Books3 es una creación de un programador independiente que reclama la ventaja de los pequeños y espera ampliar el acceso a los datos que ha reunido más allá de los usuarios grandes como OpenAI y Meta. Robar al escritor comparativamente pobre y dárselo al aspirante a empresario tecnológico rico: un interesante giro inverso a Robin Hood. Al igual que Groucho, soy un miembro involuntario del club Books3. Un periodista del Atlantic ha creado una herramienta de búsqueda que combina el conjunto de datos y se han apropiado de tres de mis libros (una obra de no ficción, una novela y un libro de cocina). Cuando lo descubrí, solo por un instante retro, sentí la pequeña emoción patética aunque familiar que conlleva estar en una lista: una lista de libros más vendidos, una lista de lectura obligada, una lista de 10 libros para septiembre, una lista de regalos navideños. Érase una vez, estar en la lista significaba que alguien había leído su libro y lo apreciaba. Por lo que sé, Books3 «eligió» el libro de cocina que escribí simplemente porque incluía las palabras «cucharadita», «pimiento de pájaro» y «merluza». No es que alguien se haya enamorado de la receta del pollo al carrito. En el nuevo mundo, ya no soy un narrador de cuentos. Me veo reducido a una fuente de datos para palabras, frases y construcción de oraciones. AI está cenando fuera de los seis meses no remunerados que pasé en una propuesta y permisos, en los debates sobre palabras que me hacen mantener una libreta y un lápiz junto a la cama para inspirarme durante el insomnio, en el largo proyecto de prueba y error que es la estructura de un libro. Y esa lamentable historia se repite para todos los autores de la lista. No es que quiera romantizar la escritura. Estamos hablando de explotación igualitaria de oportunidades. Toma lo que sea que hagas para ganarte la vida, imagina que alguien te robó los frutos de tu trabajo y observa lo mal que te sientes. Y no asuma que no vendrán por usted: durante el último mes, he escuchado a personas de todas las edades, en una variedad de campos, predecir que sus trabajos no serán los mismos en cinco años, si tienen puestos de trabajo una vez que la IA realmente se ponga en marcha. Ingresé nombre tras nombre en la herramienta de búsqueda del Atlántico. AI ha consumido Philip Roth en inglés y español, así como 33 obras de Margaret Atwood. No puedo esperar a ver cómo se desarrolla esa colisión en la mente de la colmena de IA. Los premios Nobel Toni Morrison y Kazuo Ishiguro también están allí. Piensa en un autor y échale un vistazo; probablemente estará en la lista. De alguna manera, nunca esperé tener ninguna superposición con Groucho, pero aquí estamos, sin querer pertenecer al club Book3 pero sin poder encontrar la salida. No podemos simplemente enviar una carta de renuncia y echarnos atrás, como hizo con el Friars Club. Me gusta pensar que existe un universo en el que la IA podría funcionar a nuestro favor y no en nuestra contra, pero si esta configuración es una indicación, me aboco a la decepción. Los directivos del club parecen ver a sus miembros como nada más que un flujo de datos con pulso. Nos inscribieron a escondidas, saquearon el contenido de los casilleros de nuestra casa club y ahora están listos para ganar dinero pretendiendo que pueden replicar lo que hacemos. El libro más reciente de Karen Stabiner es “Generation Chef”, que forma parte del conjunto de datos de Books3.

Source link

Hiltzik: La revolución del chat con IA está revolucionando la ley de derechos de autor

por Javier Javier Rodriguez

el noviembre 10, 2023

en Tecnolgia

Acabo de descubrir que soy parte de la revolución del chat con IA. Por favor, no me odien. Mi papel es el de autor de tres de los casi 200.000 libros que se introducen en el cerebro electrónico de LLaMa, el chatbot desarrollado y distribuido por Meta Platforms (anteriormente Facebook), en competencia con el más conocido ChatGPT. bots comercializados por OpenAI. Alex Reisner del Atlántico compiló una práctica herramienta de búsqueda para la base de datos, conocida como Books3, que brinda a los autores de todo el mundo la oportunidad de buscar sus nombres y decidir cómo pensar en los resultados. ¿Prohibiría la enseñanza (si esa es la palabra) de mis cuentos a las computadoras? Ni siquiera si pudiera. — Stephen King No lo he decidido por mí mismo; por un lado, estoy un poco molesto porque supuestamente sólo tres de mis siete libros se han utilizado para “entrenar” a LLaMa; por el otro, me dedico a reflexionar sobre cuánto debería valer mi contribución y ¿por qué no debería recibir un pago por ella? Las reacciones de otros autores, destacados y no tan destacados, han estado por todas partes. Algunos han expresado una indignación convincente. Incluyen a los novelistas John Grisham, George RR Martin, Scott Turow y otros que son miembros del Authors Guild y se encuentran entre los demandantes en una demanda por infracción de derechos de autor presentada contra OpenAI, y Sarah Silverman, demandante en una demanda similar contra Meta Platforms. Boletín Obtenga lo último de Michael Hiltzik Comentarios sobre economía y más de un ganador del Premio Pulitzer. Ingrese la dirección de correo electrónico Regístrate Es posible que ocasionalmente recibas contenido promocional de Los Angeles Times. Algunos han recurrido a las redes sociales para expresar su irritación o su absoluta furia, entre ellos Margaret Atwood y la novelista Lauren Groff. Luego está el grupo que pregunta: ¿cuál es el problema? Por ejemplo, Ian Bogost, autor o coautor de 10 libros, la mayoría sobre juegos, escribió un artículo reciente para Atlantic titulado “Mis libros se utilizaron para entrenar la IA generativa de Meta. Bien, también puede tener el próximo”. Finalmente, está Stephen King, cuya reacción ante una base de datos que enumera 87 de sus obras parece ser algo parecido a la resignación. “¿Prohibiría la enseñanza (si esa es la palabra) de mis historias a las computadoras?” el escribe. “Ni siquiera si pudiera. Bien podría ser el Rey Canuto, prohibiendo que suba la marea”. Antes de profundizar más en las cuestiones legales, desviémonos hacia lo que significa la base de datos y su uso en el contexto de la “IA generativa”, la categoría de tecnología a la que estos chatbots pertenecen. Como he escrito antes, para estos productos el término «inteligencia artificial» es un nombre inapropiado. No son inteligentes en el sentido en que los humanos y los animales lo son; simplemente están diseñados para parecer inteligentes ante un extraño que desconoce los procesos electrónicos que ocurren en su interior. De hecho, utilizar el mismo término distorsiona nuestra percepción de lo que están haciendo. No están aprendiendo en ningún sentido real, como por ejemplo creando percepciones del mundo que los rodea basándose en la información que ya tienen en sus circuitos. No son creativos en ningún sentido remotamente humano: «La creatividad no puede ocurrir sin sensibilidad», observa King, aunque cubre su apuesta respondiendo su propia pregunta sobre si los sistemas son creativos con las palabras: «Todavía no». los desarrolladores “entrenan” sus sistemas infundiéndoles billones de palabras y frases presentes en Internet o en bases de datos especializadas; Cuando un chatbot responde a su pregunta, convoca una serie probabilística de esas entradas para producir algo que se parezca (a menudo sorprendentemente) a lo que un humano podría producir. Pero es más que nada un simulacro del pensamiento humano, no el producto de la meditación. Lo gratificante de la revelación de que Books3 se ha utilizado para “entrenar” a LLaMa es que subraya cómo todo lo que arrojan los chatbots proviene, en esencia, de fuentes humanas. Aunque OpenAI se niega a revelar qué utiliza para “entrenar” ChatGPT, es casi seguro que esté haciendo algo similar. (Meta no ha reconocido formalmente el uso de Books3, pero la función de la base de datos fue revelada en un documento técnico por los desarrolladores de LLaMa en la empresa. Otro punto importante a tener en cuenta es que ninguna de esta capacitación ha permitido a los desarrolladores resolver los problemas más importantes y Un problema persistente con los chatbots: hacen las cosas mal, a menudo de manera espectacular. Cuando no pueden encontrar material factual para responder una pregunta, tienden a inventarla o citar irrelevancias; la semejanza de las respuestas con el pensamiento y el habla humanos induce a error a los usuarios. tomarlos al pie de la letra, lo que lleva a no pocas consecuencias embarazosas y costosas. Esto es endémico en el campo de la IA en general. Tan recientemente como el 20 de septiembre, la prestigiosa revista Nature se retractó de un artículo de investigadores de Google que había informado que un sistema de IA sólo necesitaba «Me tomó unas pocas horas diseñar chips de computadora que requirieron meses de trabajo por parte de diseñadores humanos. El autor del artículo supuestamente concluyó que era todo lo contrario. En mi caso, la triste verdad es que, por muy riguroso que fuera «entrenado» a LLaMa con mis libros, no Parece que no he aprendido mucho. De hecho, sus respuestas a mis preguntas demostraron que es tan idiota como sus primos de la familia de la IA generativa. Cuando le pregunté qué sabían sobre mí, su respuesta fue una mezcla de un biobox publicado en latimes.com, junto con la mención de tres libros, ninguno de los cuales figura en la base de datos Books3: uno que no es mío (aunque Me citan en sus notas finales) y dos que, por lo que puedo decir, no existen en absoluto. Sin embargo, sí me etiquetó como “un periodista consumado y muy respetado que ha hecho importantes contribuciones al campo del periodismo”, lo que sugiere que no carece del todo de sagacidad y buen juicio. Cuando le pedí a LLaMa que describiera los tres libros que están en la base de datos de Books3, sus respuestas se recopilaron a partir de textos repetitivos que podrían haber provenido de anuncios publicitarios en las portadas de los libros y de errores directos, incluso extraños. Eso nos lleva de nuevo a las preocupaciones planteadas en el mundo literario. Si las reacciones de los escritores establecidos parecen confusas, es principalmente porque la ley de derechos de autor es confusa. Esto es especialmente cierto cuando el tema es el “uso legítimo”, una exclusión de los derechos de autor que permite que partes de obras protegidas por derechos de autor se utilicen sin permiso. El uso legítimo es lo que permite citar fragmentos de obras publicadas en reseñas, resúmenes e informes de noticias. o trabajos de investigación, o para ser parodiados o reutilizados de una manera “transformadora”. ¿Qué es “transformador”? Como lo expresa un resumen de las bibliotecas de Stanford, “se han gastado millones de dólares en honorarios legales tratando de definir lo que califica… No existen reglas estrictas, sólo pautas generales y decisiones judiciales variadas”. Esto es así cuando surge una nueva tecnología, como la reproducción digital o, ahora, la formación de chatbots. La demanda presentada contra OpenAI por los novelistas y el Authors Guild afirma que OpenAI copió sus obras “al por mayor, sin permiso ni contraprestación”. [that is, payment]”, lo que equivale a un “robo sistemático a gran escala”. Los autores observan que la Oficina de Patentes de EE. UU. ha descubierto que la IA “el ‘entrenamiento’… casi por definición implica[s] la reproducción de obras enteras o de partes sustanciales de las mismas”. Dicen que «entrenar» es simplemente «un eufemismo que suena técnico para ‘copiar e ingerir'». Los autores dicen que los chatbots OpenAI «ponen en peligro la capacidad de los escritores de ficción para ganarse la vida», porque «permiten que cualquiera genere… … textos que de otro modo pagarían a los escritores para que los crearan”. Los robots “pueden escupir obras derivadas: material que se basa en, imita, resume o parafrasea las obras de los demandantes y daña el mercado de ellas”. Esas son afirmaciones cruciales, porque la interferencia con la comerciabilidad de una obra protegida por derechos de autor es un factor clave. factor que pesa en contra de una defensa de uso legítimo en los tribunales. Vale la pena mencionar que la invasión de la IA en el mercado de habilidades profesionales fue un factor clave en la reciente huelga de escritores de Hollywood, y lo sigue siendo para los actores que aún están en huelga. Las limitaciones al uso de la IA son una disposición importante del contrato que resolvió la huelga de escritores, y seguramente serán parte de cualquier acuerdo con los actores. La demanda presentada por Silverman y sus compañeros demandantes contra Meta sigue de cerca el caso del Authors Guild. Puede que no ayude a la defensa de Meta que Books3 sea en sí mismo un presunto producto de piratería; al menos algunas de las obras que contiene provienen de versiones ilícitas que circulan en la web. De hecho, un servidor de la base de datos la desconectó tras una denuncia de una organización danesa antipiratería. Meta, en su respuesta a la demanda de Silverman, sostiene que su uso de Books3 es «transformador por naturaleza y uso justo por excelencia». (Su moción para desestimar el caso está programada para ser escuchada por un juez federal en San Francisco el 16 de noviembre). La compañía dice que los demandantes no pueden señalar «ningún ejemplo» de la producción de LLaMa que reproduzca alguna parte de su trabajo. . Eso puede ser cierto, pero dependerá del juez Vincent Chhabria decidir si es relevante. Meta también implica que le está haciendo un favor al mundo al desarrollar las capacidades de LLaMa, que según dice se encuentran entre «los casos más claros de los beneficios potenciales sustanciales». La IA puede ofrecer servicios a escala a miles de millones de personas”. Si esto suena un poco a las defensas de Meta contra las acusaciones de que ha infringido la privacidad de sus usuarios con fines de lucro (que sólo proporciona información a otros que harán del mundo un lugar mejor) probablemente no sea un accidente. Bogost argumentó en el Atlántico que entrenar robots con material publicado y protegido por derechos de autor no debería requerir el permiso de sus creadores, y no es fundamentalmente diferente de lo que sucede cuando un lector recomienda un libro a un amigo o familiar. “Uno de los hechos (y placeres) de la autoría es que el trabajo de uno se utilizará de maneras impredecibles”, escribe. Pero en este contexto, eso es absurdo. Recomendar un libro no implica copiarlo. Incluso prestar o regalar un libro a otra persona es perfectamente lícito, ya que en algún momento del proceso se compró el libro y una parte del precio de compra acabó en el bolsillo del autor. Ese no es el caso en este caso. OpenAI y Meta son empresas comerciales que esperan ganar dinero con sus chatbots. En la medida en que utilicen material protegido por derechos de autor para desarrollar su funcionalidad, les deben algo a los creadores. Quizás ahora sé qué pensar sobre el uso de mis libros para “entrenar” estas máquinas, especialmente si nadie en la cadena Books3/Meta u OpenAI pagó por ellos. Puede ser difícil descubrir qué papel desempeñaron en la “capacitación”, pero sea cual fuere, no debería ser gratuito.

Source link

Todo lo que necesitas saber sobre tecnología

Etiqueta: libros3

Opinión: La IA se apropió de mis libros. Alguien se beneficiará, pero no seré yo.

Hiltzik: La revolución del chat con IA está revolucionando la ley de derechos de autor