spfdigital/Getty ImagesActualmente existen muchas herramientas de inteligencia artificial (IA) en el mercado que pueden tomar el texto y las imágenes de los usuarios y transformarlos en imágenes y videos que coincidan con el mensaje inicial. Una nueva patente revela que el audio pronto podría ser una opción de entrada para hacer realidad sus visiones. Como descubrió MSPowerUser, la Oficina de Patentes y Marcas de EE. UU. (USPTO) publicó un documento de 20 páginas presentado por Microsoft el 5 de abril de 2023 y publicado el 10 de octubre de 2024, que detalla un nuevo sistema compatible con IA que convierte audio en vivo en imágenes. Además: el generador de video AI gratuito de Adobe está aquí: cómo probarlo. Este sistema tomaría una transmisión de audio en vivo, como la de una reunión o conferencia, y la convertiría en una transcripción de texto en vivo. Luego, la transcripción se resumiría mediante un modelo de lenguaje grande (LLM) y se introduciría en un modelo de texto a imagen, donde se generaría una imagen y se mostraría en la pantalla, como se ve en la imagen a continuación. Microsoft: este sistema continuaría haciendo esto durante la transmisión de audio, generando continuamente imágenes en vivo. Según Microsoft, mostrar imágenes en tiempo real puede ayudar a que la comunicación sea más efectiva, con ayudas visuales que mantienen a las personas más comprometidas y hacen que los conceptos sean más fáciles de entender. «Mostrar imágenes relacionadas con información comunicada verbalmente puede mejorar la efectividad de la comunicación al hacerla más atractiva, memorable y más fácil de entender», dijo Microsoft. Además: Los mejores chatbots de IA de 2024: ChatGPT, Copilot y alternativas valiosas. Si se pregunta si la función se lanzará pronto, lo más probable es que la respuesta sea no. La presentación de una patente es un largo viaje entre la producción de un producto o característica, y muchas patentes nunca llegan a la fase de producción y siguen siendo una idea. Sin embargo, si Microsoft decide lanzar esta característica, probablemente vivirá en Microsoft Teams, su video plataforma de conferencias y reuniones, y será accesible a través de su complemento de IA, Copilot, como Copilot Pro o Microsoft 365 Copilot para empresas.