¡Queremos saber de ti! Responde a nuestra encuesta rápida sobre IA y comparte tus opiniones sobre el estado actual de la IA, cómo la estás implementando y qué esperas ver en el futuro. Más información ElevenLabs, la startup de voz con IA conocida por sus modelos de clonación de voz, texto a voz y voz a voz, acaba de añadir otra herramienta a su cartera de productos: AI Voice Isolator. Disponible en la plataforma ElevenLabs a partir de hoy, la oferta permite a los creadores eliminar el ruido ambiental y los sonidos no deseados de cualquier contenido que tengan, desde una película hasta un podcast o un vídeo de YouTube. Llega apenas unos días después del lanzamiento de una aplicación Reader de la empresa y su uso es gratuito (con algunas limitaciones). Sin embargo, los usuarios también deben tener en cuenta que la capacidad no es algo completamente nuevo en el mercado. Muchos otros proveedores de soluciones creativas, incluido Adobe, ofrecen herramientas para mejorar la calidad del habla en el contenido. Lo único que queda por ver es cuán efectivo es Voice Isolator en comparación con ellos. ¿Cómo funcionará AI Voice Isolator? Al grabar contenido como una película, un podcast o una entrevista, los creadores a menudo se topan con el problema del ruido de fondo, donde los sonidos no deseados interfieren con el contenido (imagínese gente hablando al azar, el viento soplando o algún vehículo pasando en la carretera). Estos ruidos pueden no notarse durante la filmación, pero pueden afectar la calidad del resultado final, principalmente, suprimiendo la voz del orador a veces. Cuenta regresiva para VB Transform 2024 Únase a los líderes empresariales en San Francisco del 9 al 11 de julio para nuestro evento insignia de IA. Conéctese con colegas, explore las oportunidades y los desafíos de la IA generativa y aprenda cómo integrar aplicaciones de IA en su industria. Regístrese ahora Para resolver esto, muchos tienden a usar micrófonos con cancelación de ruido ambiental que eliminan el ruido de fondo durante la fase de grabación. Cumplen el trabajo, pero pueden no ser accesibles en muchos casos, especialmente para los creadores en etapa inicial con recursos limitados. Aquí es donde entran en juego las herramientas basadas en IA como el nuevo Voice Isolator de ElevenLabs. En esencia, el producto funciona en la etapa de posproducción, donde el usuario solo tiene que cargar el contenido que desea mejorar. Una vez cargado el archivo, los modelos subyacentes lo procesan, detectan y eliminan el ruido no deseado y extraen un diálogo claro como salida. ElevenLabs dice que el producto extrae el habla con un nivel de calidad similar al del contenido grabado en un estudio. El jefe de diseño de la empresa, Ammaar Reshi, también compartió una demostración en la que se puede ver la herramienta eliminando el ruido de un soplador de hojas para extraer el habla nítida del hablante. Realizamos tres pruebas para probar la aplicabilidad en el mundo real del aislador de voz. En la primera, dijimos tres frases separadas, cada una perturbada por diferentes ruidos de fondo, mientras que las otras dos tenían tres frases con una mezcla de diferentes ruidos que ocurrían en puntos aleatorios, de forma irregular. En todos los casos, la herramienta pudo procesar el audio en cuestión de segundos. Lo más importante es que eliminó los ruidos (desde los asociados con la apertura y el cierre de puertas y los golpes en la mesa hasta los aplausos y el movimiento de elementos del hogar) en casi todos los casos y extrajo un habla clara, sin ningún tipo de distorsión. Los únicos sonidos que no logró reconocer y eliminar fueron los de golpes en la pared y chasquidos de dedos. Sam Sklar, quien maneja el crecimiento en la compañía, también nos dijo que no funciona con voces musicales en esta etapa, pero los usuarios pueden probarlo en ese caso de uso y pueden tener éxito con algunas canciones. Es probable que haya mejoras en camino Si bien la capacidad de Voice Isolator para eliminar el ruido de fondo que se produce de manera irregular ciertamente lo hace destacar de la mayoría de las otras herramientas que solo funcionan con ruidos planos, aún hay margen de mejora. Con suerte, al igual que todas las demás herramientas, ElevenLabs mejorará aún más su rendimiento. Es importante señalar aquí que la compañía no ha compartido mucho sobre los modelos subyacentes que impulsan la herramienta o si las grabaciones que se incluyen en ella se utilizan para entrenar sus modelos de alguna manera. Sklar dijo que no puede compartir los detalles de lo que implica la creación de modelos, pero enfatizó que la compañía tiene un formulario vinculado en su política de privacidad donde los usuarios pueden optar por no usar datos personales para el entrenamiento. A partir de ahora, la compañía está proporcionando Voice Isolator solo a través de su plataforma. ElevenLabs planea abrir el acceso a la API en las próximas semanas, aunque el cronograma exacto aún no está claro. Para los usuarios que vienen al sitio web o la aplicación para probar la herramienta, ElevenLabs ofrece acceso gratuito con ciertos límites de uso. «El modelo Voice Isolator cuesta 1000 caracteres por minuto de audio. Tenemos un plan gratuito en nuestro sitio que viene con 10k caracteres/mes, por lo que es posible usarlo con 10 minutos de audio por mes de forma gratuita», explicó Sklar. Esto significa que los usuarios que buscan eliminar el ruido de fondo de archivos de audio más grandes tendrán que cambiar a planes pagos que comienzan en $5/mes, facturados mensualmente. VB Daily ¡Manténgase informado! Reciba las últimas noticias en su bandeja de entrada todos los días Al suscribirse, acepta los Términos de servicio de VentureBeat. Gracias por suscribirse. Consulte más boletines de VB aquí. Se produjo un error.