Sora de OpenAI genera vídeos fotorrealistas

OpenAI lanzó el 15 de febrero un nuevo e impresionante modelo de conversión de texto a video llamado Sora que puede crear imágenes en movimiento fotorrealistas o de dibujos animados a partir de indicaciones de texto en lenguaje natural. Sora aún no está disponible para el público; en cambio, OpenAI entregó a Sora a los equipos rojos (investigadores de seguridad que imitan las técnicas utilizadas por los actores de amenazas) para evaluar posibles daños o riesgos. OpenAI también ofreció Sora a diseñadores y artistas visuales y de audio seleccionados para obtener comentarios sobre cómo optimizar mejor Sora para el trabajo creativo. El énfasis de OpenAI en la seguridad en torno a Sora es estándar para la IA generativa hoy en día, pero también muestra la importancia de tomar precauciones cuando se trata de IA que podría usarse para crear imágenes falsas convincentes, que podrían, por ejemplo, dañar la reputación de una organización. ¿Qué es Sora? Sora es un modelo de difusión de IA generativa. Sora puede generar múltiples personajes, fondos complejos y movimientos de apariencia realista en videos de hasta un minuto de duración. Puede crear múltiples tomas dentro de un video, manteniendo consistentes los personajes y el estilo visual, lo que permite a Sora ser una herramienta narrativa eficaz. En el futuro, Sora podría usarse para generar videos que acompañen el contenido, para promocionar contenido o productos en las redes sociales, o para ilustrar puntos en presentaciones para empresas. Si bien no debería reemplazar las mentes creativas de los creadores de videos profesionales, Sora podría usarse para crear contenido de manera más rápida y sencilla. Si bien aún no hay información sobre los precios, es posible que OpenAI eventualmente tenga una opción para incorporar Sora en su suscripción ChatGPT Enterprise. Más cobertura de IA de lectura obligada «Los medios y el entretenimiento serán la industria vertical que puede ser la primera en adoptar modelos como estos», dijo a TechRepublic el analista y vicepresidente distinguido de Gartner, Arun Chandrasekaran Chandrasekaran, en un correo electrónico. «Las funciones comerciales como el marketing y el diseño dentro de las empresas y empresas de tecnología también podrían ser las primeras en adoptar». ¿Cómo accedo a Sora? A menos que ya haya recibido acceso de OpenAI como parte de su equipo rojo o prueba beta de trabajo creativo, no es posible acceder a Sora ahora. OpenAI lanzó Sora a artistas visuales, diseñadores y cineastas seleccionados para aprender cómo optimizar Sora para usos creativos específicamente. Además, OpenAI ha dado acceso a investigadores del equipo rojo especializados en desinformación, contenido de odio y prejuicios. El analista y vicepresidente distinguido de Gartner, Arun Chandrasekaran, dijo que el lanzamiento inicial de Sora por parte de OpenAI es «un buen enfoque y consistente con las prácticas de OpenAI sobre el lanzamiento seguro de modelos». «Por supuesto, esto por sí solo no será suficiente, y deben implementar prácticas para eliminar a los malos actores que obtienen acceso a estos modelos o sus usos nefastos», dijo Chandrasekaran. ¿Cómo funciona Sora? Sora es un modelo de difusión, lo que significa que refina gradualmente una imagen sin sentido hasta convertirla en una comprensible basándose en el mensaje y utiliza una arquitectura transformadora. La investigación que realizó OpenAI para crear sus modelos DALL-E y GPT, en particular la técnica de recaptura de DALL-E, fueron peldaños hacia la creación de Sora. VER: Hay demanda de ingenieros de inteligencia artificial en el Reino Unido (TechRepublic) Los videos de Sora no siempre parecen completamente realistas. Sora todavía tiene problemas para diferenciar la izquierda de la derecha o seguir descripciones complejas de eventos que suceden con el tiempo, como indicaciones sobre un movimiento específico de la cámara. . Los videos creados con Sora probablemente se detecten a través de errores de causa y efecto, dijo OpenAI, como cuando una persona muerde una galleta pero no deja una marca. Por ejemplo, las interacciones entre personajes pueden mostrar confusión (especialmente alrededor de las extremidades) o incertidumbre en términos de números (por ejemplo, ¿cuántos lobos hay en el video a continuación en un momento dado?). ¿Cuáles son las precauciones de seguridad de OpenAI en torno a Sora? Con las indicaciones y ajustes correctos, los videos que hace Sora pueden confundirse fácilmente con videos de acción en vivo. OpenAI es consciente de posibles problemas de difamación o desinformación derivados de esta tecnología. OpenAI planea aplicar los mismos filtros de contenido a Sora que la compañía aplica a DALL-E 3 que previenen “violencia extrema, contenido sexual, imágenes de odio, parecidos a celebridades o la propiedad intelectual de otros”, según OpenAI. Si Sora se lanza al público, OpenAI planea marcar el contenido creado con Sora con metadatos C2PA; Los metadatos se pueden ver seleccionando la imagen y eligiendo las opciones del menú Información del archivo o Propiedades. Las personas que crean imágenes generadas por IA aún pueden eliminar los metadatos a propósito o hacerlo accidentalmente. OpenAI actualmente no tiene nada implementado para evitar que los usuarios de su generador de imágenes, DALL-E 3, eliminen metadatos. «Ya es [difficult] y será cada vez más imposible detectar contenido generado por IA por parte de seres humanos”, dijo Chandrasekaran. “Los capitalistas de riesgo están invirtiendo en nuevas empresas que crean herramientas de detección de deepfake, y ellas (las herramientas de detección de deepfake) pueden ser parte de la armadura de una empresa. Sin embargo, en el futuro, será necesario que las asociaciones público-privadas identifiquen, a menudo en el momento de la creación, contenidos generados por máquinas”. ¿Cuáles son los competidores de Sora? Los vídeos fotorrealistas de Sora son bastante distintos, pero existen servicios similares. Runway proporciona generación de IA de texto a vídeo lista para uso empresarial. Fliki puede crear videos limitados con sincronización de voz para narraciones en redes sociales. La IA generativa ahora también puede agregar contenido o editar videos tomados de manera convencional de manera confiable. El 8 de febrero, investigadores de Apple revelaron un artículo sobre Keyframer, su modelo de lenguaje grande propuesto que puede crear imágenes animadas y estilizadas. TechRepublic se ha comunicado con OpenAI para obtener más información sobre Sora.

Source link

Todo lo que necesitas saber sobre tecnología

Sora de OpenAI genera vídeos fotorrealistas

Deja una respuesta Cancelar la respuesta

Sora de OpenAI genera vídeos fotorrealistas

La primera vista previa para desarrolladores de Android 15 está aquí para su píxel

Los piratas informáticos de China, Rusia y otros utilizaron sistemas OpenAI, según un informe

Deja una respuesta Cancelar la respuesta