El viernes, Meta anunció una vista previa de Movie Gen, un nuevo conjunto de modelos de inteligencia artificial diseñados para crear y manipular video, audio e imágenes, incluida la creación de un video realista a partir de una sola foto de una persona. La compañía afirma que los modelos superan a otros modelos de síntesis de vídeo cuando los evalúan humanos, lo que nos acerca a un futuro en el que cualquiera pueda sintetizar un vídeo completo de cualquier tema bajo demanda. La compañía aún no tiene planes de cuándo o cómo lanzará estas capacidades al público, pero Meta dice que Movie Gen es una herramienta que puede permitir a las personas «mejorar su creatividad inherente» en lugar de reemplazar a los artistas y animadores humanos. La empresa prevé aplicaciones futuras como la creación y edición sencilla de vídeos del «día de la vida» para plataformas de redes sociales o la generación de saludos de cumpleaños animados personalizados. Movie Gen se basa en el trabajo anterior de Meta en síntesis de video, siguiendo el generador de video Make-A-Scene de 2022 y el modelo de síntesis de imágenes Emu. Utilizando indicaciones de texto como guía, este último sistema puede generar videos personalizados con sonidos por primera vez, editar e insertar cambios en videos existentes y transformar imágenes de personas en videos personalizados realistas. Un video generado por IA de un bebé hipopótamo nadando, creado con Meta Movie Gen. Un video generado por IA de un bebé hipopótamo nadando, creado con Meta Movie Gen. Meta no es el único juego en la ciudad cuando se trata de IA síntesis de vídeo. Google mostró un nuevo modelo llamado «Veo» en mayo, y Meta dice que en las pruebas de preferencia humana, sus productos Movie Gen superaron a Sora de OpenAI, Runway Gen-3 y el modelo de vídeo chino Kling. El modelo de generación de video de Movie Gen puede crear videos de alta definición de 1080p de hasta 16 segundos de duración a 16 fotogramas por segundo a partir de descripciones de texto o una entrada de imagen. Meta afirma que el modelo puede manejar conceptos complejos como movimiento de objetos, interacciones sujeto-objeto y movimientos de cámara. Video generado por IA de Meta Movie Gen con el mensaje: «Un fantasma en una sábana blanca se enfrenta a un espejo. El reflejo del fantasma se puede ver en el espejo. El fantasma está en un ático polvoriento, lleno de vigas viejas y muebles cubiertos de tela. . El ático se refleja en el espejo. La luz es fresca y natural. El fantasma baila frente al espejo. Video generado por IA de Meta Movie Gen con el mensaje: «Un fantasma en una sábana blanca se enfrenta a un espejo. El reflejo del fantasma se puede ver en el espejo. El fantasma está en un ático polvoriento, lleno de vigas viejas y muebles cubiertos de tela. . El ático se refleja en el espejo. La luz es fresca y natural. El fantasma baila frente al espejo. Aun así, como hemos visto con generadores de video de IA anteriores, la capacidad de Movie Gen para generar escenas coherentes sobre un tema en particular probablemente dependa de los conceptos encontrados en los videos de ejemplo que Meta usó para entrenar su modelo de síntesis de video. Vale la pena tener en cuenta que los resultados seleccionados de los generadores de vídeo a menudo difieren dramáticamente de los resultados típicos y obtener un resultado coherente puede requerir mucho ensayo y error.