OpenAI lanza Sora, una herramienta de inteligencia artificial de texto a vídeo

SAN FRANCISCO – La empresa de inteligencia artificial OpenAI mostró una nueva herramienta de inteligencia artificial que puede generar videos altamente realistas de 60 segundos basados en un simple mensaje de texto, un salto adelante en calidad para videos de inteligencia artificial y “deepfakes” que ya se han utilizado para engañar a los votantes. La nueva herramienta, llamada «Sora», inicialmente solo estará disponible para un pequeño grupo de artistas y cineastas, así como para «equipos rojos», o investigadores que intentan encontrar formas en que una herramienta de inteligencia artificial pueda usarse con fines maliciosos, dijo OpenAI. en un anuncio el jueves. Sora se basa en la tecnología detrás de la herramienta DALL-E de generación de imágenes de OpenAI. Interpreta el mensaje de un usuario, lo expande a un conjunto más detallado de instrucciones y luego utiliza un modelo de IA entrenado en video e imágenes para crear el nuevo video. La calidad de las imágenes, el audio y el video generados por IA ha aumentado rápidamente en el pasado. año, con empresas como OpenAI, Google, Meta y Stable Diffusion compitiendo para crear herramientas más capaces y encontrar formas de venderlas. Al mismo tiempo, los defensores de la democracia y los investigadores de inteligencia artificial han advertido que las herramientas ya se están utilizando para engañar y mentir a los votantes. Esta no es la primera vez que se crean videos o audios de este tipo y otras empresas han creado sus propios mensajes de texto. -generadores de vídeo AI. Google está probando uno llamado Lumiere, Meta tiene un modelo llamado Emu y la startup de inteligencia artificial Runway ya ha estado creando productos para ayudar a los cineastas a crear videos. Pero los expertos y analistas de IA dijeron que la duración y la calidad de los videos de Sora iban más allá de lo que se había visto hasta ahora. Un clip generado por IA de “Sora” de OpenAI, basado en un mensaje de texto, muestra lo que parecen ser perros jugando en la nieve. . (Video: OpenAI) “No esperaba este nivel de generación de video coherente y sostenida hasta dentro de dos o tres años”, dijo Ted Underwood, profesor de ciencias de la información en la Universidad de Illinois en Urbana-Champaign. Si bien advirtió que OpenAI probablemente eligió videos que muestran el modelo en su máxima expresión, dijo que «parece que ha habido un pequeño salto en la capacidad» con respecto a otras herramientas de conversión de texto a video. En Pakistán, el ex primer ministro Imran Khan ha utilizado IA para crear una versión digital de sí mismo dando discursos, a pesar de que está en prisión. Un anuncio que apoyaba la ahora desaparecida campaña del gobernador de Florida, Ron DeSantis, para el candidato presidencial republicano utilizó un generador de audio de IA para imitar la voz del expresidente Donald Trump. Las empresas de tecnología que construyen las herramientas dicen que están monitoreando el uso de sus herramientas y han instituido algunas políticas contra su uso para producir contenido político. Pero la aplicación de la ley es irregular. En enero, OpenAI suspendió a un desarrollador que había creado un bot del candidato demócrata Dean Phillips, sólo después de un informe en The Washington Post. El desarrollador había creado robots similares para candidatos políticos en el otoño. La rápida mejora de la tecnología está haciendo que personas de una amplia variedad de industrias, desde el cine hasta el negocio de las noticias, se esfuercen por comprender cómo podría afectar su trabajo. Los generadores de vídeo con IA ya han causado un revuelo en Hollywood. Hacer películas es caro, requiere mucho tiempo y requiere decenas o cientos de personas. Algunos tecnólogos han teorizado que la IA podría permitir que una sola persona haga una película con la misma complejidad visual que un éxito de taquilla de Marvel. “Mira hasta dónde hemos llegado en tan solo un año de generación de imágenes. ¿Dónde estaremos dentro de un año? dijo Michael Gracey, director de cine y experto en efectos visuales que ha seguido de cerca el impacto de la IA en la industria. Gracey predice que pronto las herramientas de inteligencia artificial como Sora permitirán a los cineastas controlar cuidadosamente su producción, creando todo tipo de videos desde cero. Un clip generado por inteligencia artificial de “Sora” de OpenAI, basado en un mensaje de texto, muestra a una abuela apagando velas de cumpleaños. (Video: OpenAI) «No necesitarán un equipo de 100 o 200 artistas durante un período de tres años para hacer su película animada», dijo. “Para mí, eso es emocionante”. Al mismo tiempo, dijo Gracey, el hecho de que las herramientas de inteligencia artificial se entrenen en el trabajo de artistas de la vida real sin compensarlos es un gran problema. «No es genial cuando se toma la creatividad, el trabajo, las ideas y la ejecución de otras personas, y no se les da el crédito y la remuneración financiera que merecen». Mutale Nkonde, investigador visitante de políticas en el Oxford Internet Institute, dijo que la idea de que cualquiera poder convertir fácilmente texto en vídeo es emocionante. Pero le preocupa cómo estas herramientas podrían incorporar prejuicios sociales, sus impactos en los medios de vida de las personas y su capacidad para convertir textos llenos de odio o descripciones de acontecimientos desgarradores del mundo real en imágenes angustiosamente realistas. Las recientes huelgas de gremios de escritores y actores, dijo Nkonde, comenzaron abordar preguntas sobre el uso de herramientas de lenguaje de IA en la escritura de guiones y el uso de imágenes de actores en escenas generadas por IA. Pero dijo que herramientas como Sora plantean nuevas preguntas, como si se necesitarán extras humanos. «Desde una perspectiva política, ¿necesitamos empezar a pensar en formas en que podemos proteger a los humanos que deberían estar informados cuando se trata de estas herramientas?» La calidad de los videos de Sora, especialmente los que pretenden parecerse a la vida real, es más alto que lo que la mayoría de las otras empresas de IA han podido producir hasta ahora. Arvind Narayanan, profesor de informática en la Universidad de Princeton, dijo que Sora «parece ser significativamente más avanzada que cualquier otra herramienta de generación de video», según los videos que OpenAI lanzado el jueves. Dijo que es probable que esto dé como resultado videos “deepfake” que son más difíciles de reconocer para las personas como generados por IA. Si miras de cerca algunos de los videos, dijo, aún puedes detectar numerosas inconsistencias. Por ejemplo, señaló en una publicación en X que las piernas derecha e izquierda de una mujer cambian de lugar en el video de una calle de Tokio y la gente en el fondo desaparece después de que algo pasa frente a ellos. Aún así, un espectador casual podría no notar tal detalles, añadió. «Tarde o temprano, debemos adaptarnos al hecho de que el realismo ya no es un marcador de autenticidad». Un clip generado por IA de «Sora» de OpenAI, basado en un mensaje de texto, muestra a una persona caminando por Tokio. (Vídeo: IA abierta)

Source link

Todo lo que necesitas saber sobre tecnología

OpenAI lanza Sora, una herramienta de inteligencia artificial de texto a vídeo

Deja una respuesta Cancelar la respuesta

OpenAI lanza Sora, una herramienta de inteligencia artificial de texto a vídeo

Visual Studio agrega confirmaciones de Git generadas por IA y muestra una vista previa del chat de IA

Google Messages pronto podría permitirte editar textos después de enviarlos

Deja una respuesta Cancelar la respuesta