La carrera por liderar la IA se ha convertido en una búsqueda desesperada de los datos digitales necesarios para hacer avanzar la tecnología. Para obtener esos datos, empresas de tecnología como OpenAI, Google y Meta han tomado atajos, ignorado las políticas corporativas y debatido sobre cómo infringir la ley, según un análisis del New York Times. En Meta, propietaria de Facebook e Instagram, gerentes, abogados e ingenieros El año pasado se habló de comprar la editorial Simon & Schuster para adquirir obras largas, según grabaciones de reuniones internas obtenidas por The Times. También acordaron recopilar datos protegidos por derechos de autor de Internet, incluso si eso significaba enfrentar demandas. Negociar licencias con editores, artistas, músicos y la industria de las noticias llevaría demasiado tiempo, dijeron. Al igual que OpenAI, Google transcribió vídeos de YouTube para recopilar texto para sus modelos de IA, dijeron cinco personas con conocimiento de las prácticas de la empresa. Esto potencialmente violó los derechos de autor de los videos, que pertenecen a sus creadores. El año pasado, Google también amplió sus términos de servicio. Una motivación para el cambio, según miembros del equipo de privacidad de la compañía y un mensaje interno visto por The Times, fue permitir que Google pudiera acceder a Google Docs, reseñas de restaurantes en Google Maps y otro material en línea disponibles públicamente para obtener más información. Productos de IA. Las acciones de las empresas ilustran cómo la información en línea (noticias, obras de ficción, publicaciones en foros, artículos de Wikipedia, programas de computadora, fotografías, podcasts y fragmentos de películas) se ha convertido cada vez más en el elemento vital de la floreciente industria de la IA. La creación de sistemas innovadores depende de tener suficientes datos para enseñar a las tecnologías a producir instantáneamente textos, imágenes, sonidos y videos que se parezcan a lo que crea un ser humano.

Source link