Una mujer elegante camina por una calle de Tokio llena de luces de neón cálidas y brillantes y carteles animados de la ciudad como parte de un vídeo generado por el modelo Sora AI de OpenAI. OpenAIOpenAI, que irrumpió en la corriente principal el año pasado gracias a la popularidad de ChatGPT, está aportando su inteligencia artificial tecnología al vídeo. La compañía presentó el jueves Sora, su nuevo modelo de IA generativa. Sora funciona de manera similar a la herramienta de inteligencia artificial de generación de imágenes de OpenAI, DALL-E. Un usuario escribe la escena deseada y Sora le devolverá un videoclip de alta definición. Sora también puede generar videoclips inspirados en imágenes fijas y ampliar videos existentes o completar fotogramas faltantes. El video podría ser la próxima frontera para la IA generativa ahora que los chatbots y los generadores de imágenes se han abierto camino en el mundo de los consumidores y los negocios. Si bien las oportunidades creativas entusiasmarán a los entusiastas de la IA, las nuevas tecnologías presentan graves problemas de desinformación a medida que se acercan las principales elecciones políticas en todo el mundo. La cantidad de deepfakes generados por IA ha aumentado un 900% año tras año, según datos de Clarity, una empresa de aprendizaje automático. Con Sora, OpenAI busca competir con herramientas de IA de generación de video de compañías como Meta y Google. que anunció Lumiere el mes pasado. Hay herramientas de inteligencia artificial similares disponibles a través de nuevas empresas como Stability AI, que tiene un producto llamado Stable Video Diffusion. Amazon también ha lanzado Create with Alexa, un modelo especializado en generar contenido infantil animado de formato corto basado en indicaciones. Actualmente, Sora se limita a generar videos de un minuto de duración o menos. OpenAI, respaldado por Microsoft, ha hecho de la multimodalidad (la combinación de generación de texto, imágenes y video) un objetivo en su esfuerzo por ofrecer un conjunto más amplio de modelos de IA. «El mundo es multimodal», dijo el director de operaciones de OpenAI, Brad Lightcap, a CNBC en noviembre. «Si piensas en la forma en que nosotros, como seres humanos, procesamos el mundo y nos relacionamos con él, vemos cosas, oímos cosas, decimos cosas: el mundo es mucho más grande que el texto. Así que para nosotros, siempre nos pareció incompleto el texto y código para ser las modalidades únicas, las interfaces únicas que podríamos tener para saber qué tan poderosos son estos modelos y qué pueden hacer». Hasta ahora, Sora solo ha estado disponible para un pequeño grupo de probadores de seguridad, o «equipos rojos», que prueban el modelo para vulnerabilidades en áreas como la desinformación y el sesgo. La compañía no ha publicado ninguna demostración pública más allá de 10 clips de muestra disponibles en su sitio web, y dijo que el documento técnico que lo acompaña se publicará más tarde el jueves. OpenAI también dijo que está construyendo un «clasificador de detección» que puede identificar videoclips generados por Sora. y que planea incluir ciertos metadatos en su producción que deberían ayudar a identificar el contenido generado por IA. Es el mismo tipo de metadatos que Meta busca utilizar para identificar imágenes generadas por IA este año electoral. Sora es un modelo de IA de difusión que, al igual que ChatGPT, utiliza la arquitectura Transformer, presentada por investigadores de Google en un artículo de 2017. «Sora sirve como base para modelos que pueden comprender y simular el mundo real», escribió OpenAI en su anuncio. MIRAR: OpenAI está en el camino hacia un ‘verdadero avance tecnológico’
Source link
Deja una respuesta