Etiqueta: Base de datos

Acabo de descubrir que soy parte de la revolución del chat con IA. Por favor, no me odien. Mi papel es el de autor de tres de los casi 200.000 libros que se introducen en el cerebro electrónico de LLaMa, el chatbot desarrollado y distribuido por Meta Platforms (anteriormente Facebook), en competencia con el más conocido ChatGPT. bots comercializados por OpenAI. Alex Reisner del Atlántico compiló una práctica herramienta de búsqueda para la base de datos, conocida como Books3, que brinda a los autores de todo el mundo la oportunidad de buscar sus nombres y decidir cómo pensar en los resultados. ¿Prohibiría la enseñanza (si esa es la palabra) de mis cuentos a las computadoras? Ni siquiera si pudiera. — Stephen King No lo he decidido por mí mismo; por un lado, estoy un poco molesto porque supuestamente sólo tres de mis siete libros se han utilizado para “entrenar” a LLaMa; por el otro, me dedico a reflexionar sobre cuánto debería valer mi contribución y ¿por qué no debería recibir un pago por ella? Las reacciones de otros autores, destacados y no tan destacados, han estado por todas partes. Algunos han expresado una indignación convincente. Incluyen a los novelistas John Grisham, George RR Martin, Scott Turow y otros que son miembros del Authors Guild y se encuentran entre los demandantes en una demanda por infracción de derechos de autor presentada contra OpenAI, y Sarah Silverman, demandante en una demanda similar contra Meta Platforms. Boletín Obtenga lo último de Michael Hiltzik Comentarios sobre economía y más de un ganador del Premio Pulitzer. Ingrese la dirección de correo electrónico Regístrate Es posible que ocasionalmente recibas contenido promocional de Los Angeles Times. Algunos han recurrido a las redes sociales para expresar su irritación o su absoluta furia, entre ellos Margaret Atwood y la novelista Lauren Groff. Luego está el grupo que pregunta: ¿cuál es el problema? Por ejemplo, Ian Bogost, autor o coautor de 10 libros, la mayoría sobre juegos, escribió un artículo reciente para Atlantic titulado “Mis libros se utilizaron para entrenar la IA generativa de Meta. Bien, también puede tener el próximo”. Finalmente, está Stephen King, cuya reacción ante una base de datos que enumera 87 de sus obras parece ser algo parecido a la resignación. “¿Prohibiría la enseñanza (si esa es la palabra) de mis historias a las computadoras?” el escribe. “Ni siquiera si pudiera. Bien podría ser el Rey Canuto, prohibiendo que suba la marea”. Antes de profundizar más en las cuestiones legales, desviémonos hacia lo que significa la base de datos y su uso en el contexto de la “IA generativa”, la categoría de tecnología a la que estos chatbots pertenecen. Como he escrito antes, para estos productos el término «inteligencia artificial» es un nombre inapropiado. No son inteligentes en el sentido en que los humanos y los animales lo son; simplemente están diseñados para parecer inteligentes ante un extraño que desconoce los procesos electrónicos que ocurren en su interior. De hecho, utilizar el mismo término distorsiona nuestra percepción de lo que están haciendo. No están aprendiendo en ningún sentido real, como por ejemplo creando percepciones del mundo que los rodea basándose en la información que ya tienen en sus circuitos. No son creativos en ningún sentido remotamente humano: «La creatividad no puede ocurrir sin sensibilidad», observa King, aunque cubre su apuesta respondiendo su propia pregunta sobre si los sistemas son creativos con las palabras: «Todavía no». los desarrolladores “entrenan” sus sistemas infundiéndoles billones de palabras y frases presentes en Internet o en bases de datos especializadas; Cuando un chatbot responde a su pregunta, convoca una serie probabilística de esas entradas para producir algo que se parezca (a menudo sorprendentemente) a lo que un humano podría producir. Pero es más que nada un simulacro del pensamiento humano, no el producto de la meditación. Lo gratificante de la revelación de que Books3 se ha utilizado para “entrenar” a LLaMa es que subraya cómo todo lo que arrojan los chatbots proviene, en esencia, de fuentes humanas. Aunque OpenAI se niega a revelar qué utiliza para “entrenar” ChatGPT, es casi seguro que esté haciendo algo similar. (Meta no ha reconocido formalmente el uso de Books3, pero la función de la base de datos fue revelada en un documento técnico por los desarrolladores de LLaMa en la empresa. Otro punto importante a tener en cuenta es que ninguna de esta capacitación ha permitido a los desarrolladores resolver los problemas más importantes y Un problema persistente con los chatbots: hacen las cosas mal, a menudo de manera espectacular. Cuando no pueden encontrar material factual para responder una pregunta, tienden a inventarla o citar irrelevancias; la semejanza de las respuestas con el pensamiento y el habla humanos induce a error a los usuarios. tomarlos al pie de la letra, lo que lleva a no pocas consecuencias embarazosas y costosas. Esto es endémico en el campo de la IA en general. Tan recientemente como el 20 de septiembre, la prestigiosa revista Nature se retractó de un artículo de investigadores de Google que había informado que un sistema de IA sólo necesitaba «Me tomó unas pocas horas diseñar chips de computadora que requirieron meses de trabajo por parte de diseñadores humanos. El autor del artículo supuestamente concluyó que era todo lo contrario. En mi caso, la triste verdad es que, por muy riguroso que fuera «entrenado» a LLaMa con mis libros, no Parece que no he aprendido mucho. De hecho, sus respuestas a mis preguntas demostraron que es tan idiota como sus primos de la familia de la IA generativa. Cuando le pregunté qué sabían sobre mí, su respuesta fue una mezcla de un biobox publicado en latimes.com, junto con la mención de tres libros, ninguno de los cuales figura en la base de datos Books3: uno que no es mío (aunque Me citan en sus notas finales) y dos que, por lo que puedo decir, no existen en absoluto. Sin embargo, sí me etiquetó como “un periodista consumado y muy respetado que ha hecho importantes contribuciones al campo del periodismo”, lo que sugiere que no carece del todo de sagacidad y buen juicio. Cuando le pedí a LLaMa que describiera los tres libros que están en la base de datos de Books3, sus respuestas se recopilaron a partir de textos repetitivos que podrían haber provenido de anuncios publicitarios en las portadas de los libros y de errores directos, incluso extraños. Eso nos lleva de nuevo a las preocupaciones planteadas en el mundo literario. Si las reacciones de los escritores establecidos parecen confusas, es principalmente porque la ley de derechos de autor es confusa. Esto es especialmente cierto cuando el tema es el “uso legítimo”, una exclusión de los derechos de autor que permite que partes de obras protegidas por derechos de autor se utilicen sin permiso. El uso legítimo es lo que permite citar fragmentos de obras publicadas en reseñas, resúmenes e informes de noticias. o trabajos de investigación, o para ser parodiados o reutilizados de una manera “transformadora”. ¿Qué es “transformador”? Como lo expresa un resumen de las bibliotecas de Stanford, “se han gastado millones de dólares en honorarios legales tratando de definir lo que califica… No existen reglas estrictas, sólo pautas generales y decisiones judiciales variadas”. Esto es así cuando surge una nueva tecnología, como la reproducción digital o, ahora, la formación de chatbots. La demanda presentada contra OpenAI por los novelistas y el Authors Guild afirma que OpenAI copió sus obras “al por mayor, sin permiso ni contraprestación”. [that is, payment]”, lo que equivale a un “robo sistemático a gran escala”. Los autores observan que la Oficina de Patentes de EE. UU. ha descubierto que la IA “el ‘entrenamiento’… casi por definición implica[s] la reproducción de obras enteras o de partes sustanciales de las mismas”. Dicen que «entrenar» es simplemente «un eufemismo que suena técnico para ‘copiar e ingerir'». Los autores dicen que los chatbots OpenAI «ponen en peligro la capacidad de los escritores de ficción para ganarse la vida», porque «permiten que cualquiera genere… … textos que de otro modo pagarían a los escritores para que los crearan”. Los robots “pueden escupir obras derivadas: material que se basa en, imita, resume o parafrasea las obras de los demandantes y daña el mercado de ellas”. Esas son afirmaciones cruciales, porque la interferencia con la comerciabilidad de una obra protegida por derechos de autor es un factor clave. factor que pesa en contra de una defensa de uso legítimo en los tribunales. Vale la pena mencionar que la invasión de la IA en el mercado de habilidades profesionales fue un factor clave en la reciente huelga de escritores de Hollywood, y lo sigue siendo para los actores que aún están en huelga. Las limitaciones al uso de la IA son una disposición importante del contrato que resolvió la huelga de escritores, y seguramente serán parte de cualquier acuerdo con los actores. La demanda presentada por Silverman y sus compañeros demandantes contra Meta sigue de cerca el caso del Authors Guild. Puede que no ayude a la defensa de Meta que Books3 sea en sí mismo un presunto producto de piratería; al menos algunas de las obras que contiene provienen de versiones ilícitas que circulan en la web. De hecho, un servidor de la base de datos la desconectó tras una denuncia de una organización danesa antipiratería. Meta, en su respuesta a la demanda de Silverman, sostiene que su uso de Books3 es «transformador por naturaleza y uso justo por excelencia». (Su moción para desestimar el caso está programada para ser escuchada por un juez federal en San Francisco el 16 de noviembre). La compañía dice que los demandantes no pueden señalar «ningún ejemplo» de la producción de LLaMa que reproduzca alguna parte de su trabajo. . Eso puede ser cierto, pero dependerá del juez Vincent Chhabria decidir si es relevante. Meta también implica que le está haciendo un favor al mundo al desarrollar las capacidades de LLaMa, que según dice se encuentran entre «los casos más claros de los beneficios potenciales sustanciales». La IA puede ofrecer servicios a escala a miles de millones de personas”. Si esto suena un poco a las defensas de Meta contra las acusaciones de que ha infringido la privacidad de sus usuarios con fines de lucro (que sólo proporciona información a otros que harán del mundo un lugar mejor) probablemente no sea un accidente. Bogost argumentó en el Atlántico que entrenar robots con material publicado y protegido por derechos de autor no debería requerir el permiso de sus creadores, y no es fundamentalmente diferente de lo que sucede cuando un lector recomienda un libro a un amigo o familiar. “Uno de los hechos (y placeres) de la autoría es que el trabajo de uno se utilizará de maneras impredecibles”, escribe. Pero en este contexto, eso es absurdo. Recomendar un libro no implica copiarlo. Incluso prestar o regalar un libro a otra persona es perfectamente lícito, ya que en algún momento del proceso se compró el libro y una parte del precio de compra acabó en el bolsillo del autor. Ese no es el caso en este caso. OpenAI y Meta son empresas comerciales que esperan ganar dinero con sus chatbots. En la medida en que utilicen material protegido por derechos de autor para desarrollar su funcionalidad, les deben algo a los creadores. Quizás ahora sé qué pensar sobre el uso de mis libros para “entrenar” estas máquinas, especialmente si nadie en la cadena Books3/Meta u OpenAI pagó por ellos. Puede ser difícil descubrir qué papel desempeñaron en la “capacitación”, pero sea cual fuere, no debería ser gratuito.

Source link

Recopilación del conjunto de datos del programa: últimas noticias sobre tecnología

por Javier Javier Rodriguez

el noviembre 2, 2023

en Computadoras

Un DBMS realiza la recopilación de datos o un conjunto de programas para manipular los datos almacenados en una base de datos. eso se llama sistema de gestión de bases de datos o DBMS. Un sistema de gestión de bases de datos proporciona funcionalidades básicas como manipulación del almacenamiento o usuario de datos. Hay cuatro componentes principales del sistema de gestión de bases de datos que forman el entorno del sistema de bases de datos que se enumeran a continuación. CÓMO UN DBMS HACE EL CONJUNTO DE PROGRAMAS DataHardwareSoftwareUsers La siguiente figura muestra estos cuatro componentes. Estos componentes se describen en las siguientes subsecciones. Datos La recopilación de datos relacionados se denomina base de datos. En otras palabras, la base de datos es un depósito de datos relacionados. Los datos integrados significan que son correctos y consistentes. La exactitud sugiere que los datos satisfacen las reglas de integridad, como que el saldo no debe ser negativo. La coherencia sugiere que todos los datos almacenados en una base de datos deben ser coherentes. Por ejemplo, una cuenta no debe tener un nombre de sucursal que no exista. Dependiendo de la cantidad de usuarios que interactúan con el sistema. un sistema de base de datos puede ser un sistema de usuario único o un sistema multiusuario. En un sistema de usuario único, como máximo un usuario puede acceder a la base de datos a la vez. En un sistema multiusuario, más de un usuario puede acceder a la base de datos al mismo tiempo. Hardware Todos los dispositivos físicos de un sistema informático se denominan hardware. Un sistema informático puede tener varios hardware diferentes, como procesador, memoria, disco duro, monitor, teclado, mouse, impresora, escáner, etc. Desde el punto de vista del sistema de base de datos, el hardware importante se puede dividir en dos categorías: procesador y memoria principal. – Soporta la ejecución del software de base de datos. Dispositivo de almacenamiento secundario: se utiliza para almacenar datos de un sistema u organización de forma permanente. Estos incluyen discos duros, cintas magnéticas, discos compactos, etc. Los discos duros son los dispositivos de almacenamiento secundario más utilizados en la actualidad. Software El software proporciona la interfaz entre los usuarios y las bases de datos almacenadas en dispositivos físicos. Programas de aplicación, software DBMS y sistemas operativos del componente de software aquí. El sistema operativo gestiona todo el hardware de la computadora. El sistema de archivos del sistema operativo proporciona interacción entre otros componentes de software y hardware, como un disco duro. Usuario Estas son las cuatro categorías principales de usuarios de la base de datos: • Administrador de la base de datos: es responsable del correcto funcionamiento del sistema de la base de datos. • Diseñadores de bases de datos: identifican los datos que se almacenarán en una base de datos y diseñan la estructura de la base de datos para una organización. • Usuarios finales: estos usuarios interactúan con la base de datos de diferentes maneras según sus requisitos. Ventajas del sistema de gestión de bases de datos DBMS contiene gestión y control centralizados sobre la base de datos. Además, el software DBMS se utiliza para proporcionar interacción entre programas de aplicación y bases de datos. Debido a esto, ofrece muchas ventajas. Estas ventajas se detallan a continuación. Redundancia de datos mínima posible para evitar la duplicación innecesaria de información. Por ejemplo, toda la información sobre los clientes del banco se puede mantener centralizada. Esto evita la duplicación innecesaria de información del cliente que tiene ambos tipos de cuentas. conduce a una reducción de la redundancia de datos. La redundancia de datos reducida impide la memoria. pérdida. Consistencia de datos mejorada La inconsistencia se produce debido a la redundancia de datos. Por ejemplo, considere que los requisitos del cliente se mantienen por separado para las cuentas de ahorro y las cuentas corrientes. Acceso eficiente a los datos Utiliza una variedad de técnicas para recuperar datos. Los datos requeridos se pueden recuperar proporcionando una consulta adecuada al DBMS. Se puede acceder a los datos de forma cómoda y eficiente. Intercambio de datos mejorado: la base de datos se mantiene de forma centralizada, todos los usuarios autorizados y programas de aplicación pueden compartir esta base de datos fácilmente. Integridad de datos mejorada: el software proporciona diferentes formas de implementar este tipo de restricciones. Además, garantiza que los datos almacenados en la base de datos sigan dichas restricciones por sí solos. Los programas de aplicación no necesitan preocuparse por esto. La operación de atomicidad garantizada en una base de datos debe ser atómica. Esto significa que debe ocurrir en su totalidad o no ocurrir en absoluto. Por ejemplo, una transferencia de fondos de una cuenta a otra debe realizarse en su totalidad. Es responsabilidad del software DBMS garantizar tal tipo de atomicidad. Si alguna operación falla debido a algún problema, como fallas del sistema, entonces los efectos de la operación parcialmente ejecutada se pueden deshacer. En los sistemas de bases de datos, se puede garantizar la atomicidad. Seguridad mejorada Por ejemplo, un cliente puede consultar el saldo sólo de su cuenta. El software proporciona una manera de controlar el acceso a los datos para diferentes usuarios según sus requisitos. Proporciona varias ventajas sobre otros sistemas de bases de datos, como los sistemas orientados a archivos, como se describe en la sección anterior. A pesar de esto, el DBMS presenta algunos inconvenientes. Las siguientes son las desventajas de usar DBMS. Desventajas del alto costo de DBMS: se requiere un costo inicial para implementar la base de datos y los programas de aplicación. incurre en un alto costo inicial detrás del software DBMS. Además, el hardware debe actualizarse de acuerdo con los requisitos del software DBMS. Pasar de un sistema antiguo orientado a archivos a un sistema de base de datos también es costoso en términos de dinero y tiempo. Mano de obra especializada El sistema requiere mano de obra especializada y capacitada para diseñar y desarrollar bases de datos y proporcionar servicios de administración de bases de datos. debido a los rápidos cambios en la tecnología de bases de datos. este personal debe capacitarse y volverse a capacitar periódicamente Riesgos de seguridad Se mantiene de forma centralizada y puede ser utilizado por varios usuarios de forma remota al mismo tiempo requiere autorizar el acceso a los datos entre los usuarios para evitar el uso indebido de datos confidenciales e importantes. Mayor complejidad Es necesario comprender los requisitos de la organización y los diferentes tipos de usuarios para diseñar e implementar una base de datos eficiente. Necesidad de copia de seguridad y recuperación explícita: toda la base de datos se mantiene de forma centralizada y es necesario proporcionar instalaciones de copia de seguridad y recuperación eficientes. Con todos estos inconvenientes, se vuelve bastante esencial decidir si usar un sistema de base de datos o un sistema orientado a archivos. Es deseable no utilizar sistemas de bases de datos si la base de datos es simple y está bien definida, no necesita cambiar con frecuencia y no se requiere acceso simultáneo entre múltiples usuarios. Soy un blogger profesional. Tener mi sitio web 3+. Obtuve el título de ingeniero en ingeniería informática. Pero aprecio más los negocios en línea. Ahora soy blogger de tiempo completo y también disfruto de mi viaje. Comencé mi operador en línea desde abril de 2018. Después de investigar más, obtuve el blog. Ahora estoy trabajando también en la red de anuncios de Google y en el marketing de afiliados.

Source link

Todo lo que necesitas saber sobre tecnología

Etiqueta: Base de datos

Hiltzik: La revolución del chat con IA está revolucionando la ley de derechos de autor

Recopilación del conjunto de datos del programa: últimas noticias sobre tecnología