OpenAI anunció su nuevo modelo de difusión, Sora, que aprovecha el poder del texto para la creación de videos. El modelo de IA más nuevo del fabricante ChatGPT es capaz de generar videos en varias resoluciones y relaciones de aspecto y también puede editar videos existentes, lo que permite un cambio rápido de escenario, iluminación y estilo de disparo, todo desde un mensaje de texto. Sora también puede generar vídeos basados ​​en una imagen fija o incluso ampliar vídeos existentes completando los fotogramas faltantes. OpenAI comparte que Sora actualmente puede generar hasta un minuto de contenido de video Full HD y los ejemplos que hemos visto parecen prometedores. Puede consultar la página de inicio de Sora para ver más muestras de videos generados. Sora puede generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo. El modelo comprende no sólo lo que el usuario ha pedido en el mensaje, sino también cómo existen esas cosas en el mundo físico. Funciona mediante el uso de una arquitectura transformadora similar a ChatGPT, donde los videos y las imágenes se presentan como unidades de datos más pequeñas llamadas parches. Los videos generados por Sora comienzan como ruido estático y el modelo elimina gradualmente el ruido para formar el producto final. Parches de entrada ruidosos transformados en video de alta calidad OpenAI compartió que está aprovechando sus protocolos de seguridad existentes utilizados en DALL·E 3. Actualmente, Sora está siendo probado por «equipos rojos», expertos que llevarán a cabo pruebas y evaluarán el modelo para detectar riesgos potenciales antes de su lanzamiento oficial. OpenAI también llevará a cabo conversaciones con responsables políticos, artistas y educadores para ver posibles preocupaciones y casos de uso de Sora. No hay una fecha de lanzamiento oficial proporcionada por ahora. Fuente

Source link