Finalmente puede cargar archivos de audio a Gemini

Koshiro K/Shutterstock Google ha estado actualizando constantemente Gemini desde su debut en 2023, dando a su chatbot AI más capacidades y funcionalidad con el tiempo. Ahora, parece que la compañía finalmente ha abordado una de las solicitudes más grandes para el chatbot, al menos según el vicepresidente de Google, al agregar la opción de cargar y procesar archivos de audio en la aplicación Gemini en Android, iOS y la web. Esta es solo la última característica para llegar a Gemini, que ha visto actualizaciones que agregan más personalización a Gemini, así como la reciente incorporación de Gemini a Google Finance. La aplicación también está configurada para obtener un cambio de imagen, que verá que utiliza un nuevo sistema similar a una tarjeta flotante para interactuar con los objetos en la pantalla de su teléfono. Eso debería hacer de Gemini un verdadero reemplazo para el Asistente de Google. Según el vicepresidente de Google Josh Woodward, Audio ha sido la «solicitud#1» de los usuarios de Gemini, y ahora, los usuarios pueden usar Gemini para transcribir archivos de audio, resumir sus contenidos y más, directamente del botón de archivo en la aplicación Gemini. Utilizando archivos de audio en Gemini NWZ/Shutterstock basado en la información compartida en el documento de soporte oficial de Google, los usuarios pueden cargar hasta 10 archivos a la vez, aunque la longitud total de audio solo puede durar hasta 10 minutos. Además, otras tasas de uso de Gemini pueden aplicarse al uso de estos archivos en la propia aplicación, por lo que es bueno tener en cuenta esas limitaciones antes de enviar docenas de archivos de Gemini. Ya era posible hablar con Gemini usando Gemini Live, pero esta nueva funcionalidad permitirá a los usuarios cargar archivos de audio sin procesar que ya han capturado directamente a la aplicación. Por ejemplo, si alguien grabó un seminario o una reunión de trabajo, puede cargar el archivo de audio y usar Gemini para transcribirlo, crear notas de estudio o simplemente extraer información específica del archivo. Sin embargo, la característica todavía se está implementando, y al escribir, todavía no he recibido la actualización en mi aplicación Gemini. Sin embargo, es posible que ya tenga la función disponible en su cuenta. Si desea averiguarlo, cargue un archivo de audio y le dé un comando a Gemini. Si es capaz de procesar el archivo de audio, lo hará. Si no puede, le presentará una advertencia de que no puede procesar archivos de ese tipo.