OpenAI dijo el lunes que The New York Times (NYT) no cuenta la historia completa sobre la demanda que presentó contra la compañía dirigida por Sam Altman y Microsoft el 27 de diciembre. “Curiosamente, las regurgitaciones que indujo The New York Times parecen ser de Artículos de hace años que han proliferado en múltiples sitios web de terceros. Parece que manipularon intencionalmente las indicaciones, que a menudo incluyen extensos extractos de artículos, para que nuestro modelo regurgite”, escribió OpenAI en una publicación de blog. Como parte de la demanda, el NYT presentó aproximadamente 100 ejemplos de violaciones de derechos de autor que muestran ChatGPT o su modelo subyacente devuelve fragmentos de texto que son casi idénticos a párrafos publicados como parte de artículos o contenido editorial del NYT. Sin embargo, OpenAI ha afirmado que incluso cuando se utilizan indicaciones «manipuladas», sus modelos «no suelen comportarse como The New York Times». «OpenAI dijo que los ejemplos presentados por el NYT no son ejemplos típicos de mal uso o actividad permitida del usuario. Señaló que los textos generados no sustituyen al prestigioso periódico. OpenAI trabaja para resolver el problema de la regurgitación. La compañía liderada por Sam Altman dijo que ha identificado y está trabajando para resolver el problema de la “regurgitación” de ChatGPT, que denomina “memorización”. ” y dijo que es un fracaso del proceso de formación del modelo. La memorización, según la compañía, tiende a ocurrir más comúnmente cuando un contenido particular aparece más de una vez en los datos de entrenamiento, en este caso, los artículos del NYT que aparecen también en otros sitios web. «Por lo tanto, contamos con medidas para limitar la memorización inadvertida y prevenir la regurgitación. en los resultados del modelo. También esperamos que nuestros usuarios actúen de manera responsable; Manipular intencionalmente nuestros modelos para regurgitar no es un uso apropiado de nuestra tecnología y va en contra de nuestros términos de uso”, escribió la compañía en la publicación del blog. Los expertos discuten sobre reclamos de derechos de autor. Si bien ha habido muchos comentarios sobre la demanda del NYT contra OpenAI, varios innovadores tecnológicos parecen simpatizar con la lógica de OpenAI. “Después de leer la demanda del @nytimes contra @OpenAI y @Microsoft, encuentro que mis simpatías son más hacia OpenAI y Microsoft que con el NYT”, escribió Andrew Ng, uno de los principales científicos en el campo de la IA, en X, anteriormente Twitter. Ng afirmó que así como a los humanos se les permite leer documentos en la Internet abierta, aprender de ellos y Sintetizar ideas completamente nuevas, a la IA también se le debería permitir hacerlo. “Me gustaría que la capacitación en la Internet pública estuviera cubierta por el uso legítimo (la sociedad estará mejor de esta manera), aunque en última instancia dependerá de los legisladores si esto realmente se hace. y los tribunales”, explicó el científico de IA en el boletín semanal de DeepLearning.AI. En apoyo de alguna manera a las afirmaciones de OpenAI, Ng dijo además que los ejemplos de violaciones presentados por el NYT se produjeron debido a un mecanismo similar a RAG en el que el mensaje del usuario hace que el sistema navegue por la web, recupere un artículo específico y luego lo imprima. Arquitecto de sistemas Daniel Jeffries también recurrió a Twitter para explicar por qué el caso del Times tiene una probabilidad casi nula de ganar y apoyó de alguna manera las afirmaciones de OpenAI. Jeffries estaba reaccionando a la publicación de Jason Klint en Twitter, que argumentaba que era más probable que ganara el caso del Times. Klint es el director ejecutivo de Digital Content Next, una asociación comercial para empresas de contenidos. El arquitecto de sistemas también señaló que el caso del Times podría seguir el mismo camino que el caso de Sarah Silverman, en el que un juez de distrito de EE. UU. había dictaminado que determinar si las imágenes generadas podían violar directamente las leyes de derechos de autor «no era plausible» en este momento. OpenAI ya ha declarado que cree que entrenar modelos de IA utilizando materiales de Internet disponibles públicamente es un uso legítimo. Esta práctica, según la empresa, está respaldada por precedentes de larga data y ampliamente aceptados. Antes de que el NYT presentara la demanda, OpenAI dijo que estaba manteniendo negociaciones sobre un acuerdo con el NYT hasta el 19 de diciembre. “Las negociaciones se centraron en una asociación de alto valor en torno a la visualización en tiempo real con atribución en ChatGPT, en la que The New York Times obtendrían una nueva forma de conectarse con sus lectores nuevos y existentes, y nuestros usuarios obtendrían acceso a sus informes”, escribió en la publicación del blog, agregando que ya había explicado al Times que su contenido no contribuía significativamente a la formación de sus modelos existentes y tampoco tendría suficiente impacto para la formación futura. Copyright © 2024 IDG Communications, Inc.

Source link