El modelo de detección de audio con inteligencia artificial de próxima generación de Resemble AI, Detect-2B, tiene una precisión del 94 %

No te pierdas a los líderes de OpenAI, Chevron, Nvidia, Kaiser Permanente y Capital One solo en VentureBeat Transform 2024. Obtén información esencial sobre GenAI y amplía tu red en este evento exclusivo de tres días. Más información La empresa de clonación de voz Resemble AI ha lanzado la próxima generación de su modelo de detección de deepfake, que tiene una precisión de alrededor del 94%. Detect-2B utiliza una serie de submodelos entrenados previamente y ajustes finos para examinar un clip de audio y determinar si se generó con IA. «Basándose en la sólida base de nuestro modelo Detect original, DETECT-2B representa un gran avance en términos de arquitectura del modelo, datos de entrenamiento y rendimiento general. El resultado es un modelo de detección de deepfake extremadamente sólido y preciso que logra un nivel notable de rendimiento cuando se evalúa contra un conjunto de datos masivo de clips de audio reales y falsos», dijo la empresa en una publicación de blog. Según Resemble, los submodelos de Detect-2B «consisten en un modelo de representación de audio congelado con un módulo de adaptación insertado en sus capas clave». El módulo de adaptación desplaza el enfoque de los modelos hacia los artefactos (o los sonidos accidentales que quedan en una grabación) que a menudo distinguen el audio real del falso. La mayoría de los clips de audio generados por IA pueden sonar «demasiado limpios». Detect-2B puede predecir qué parte del audio es creado por IA sin tener que volver a entrenar el modelo cada vez que escucha un nuevo clip. Los submodelos también se entrenan con grandes conjuntos de datos. Cuenta regresiva para VB Transform 2024 Únase a los líderes empresariales en San Francisco del 9 al 11 de julio para nuestro evento insignia de IA. Conéctese con colegas, explore las oportunidades y los desafíos de la IA generativa y aprenda a integrar aplicaciones de IA en su industria. Regístrese ahora Detect-2B agrega sus puntajes de predicción y los compara con «un umbral cuidadosamente ajustado» antes de determinar si una grabación es real o falsa. Resemble dijo que la forma en que sus investigadores estructuraron Detect-2B hace que sea rápido de entrenar sin necesidad de tanta potencia informática para implementar. Las arquitecturas estocásticas facilitan el trabajo con señales de audio La arquitectura del modelo se basa en Mamba-SSM o modelos de espacio de estados, que no dependen de datos estáticos o patrones recurrentes. En su lugar, utiliza un modelo estocástico, o probabilístico aleatorio, que responde mejor a diferentes variables. Resemble dijo que este tipo de arquitectura funciona bien con la detección de audio porque captura diferentes dinámicas en un clip de audio, se adapta entre estados de una señal de audio y continúa funcionando incluso si la grabación es de mala calidad. Para evaluar el modelo, Resemble dijo que sometió a Detect-2B a un conjunto de pruebas que incluía hablantes invisibles, audio generado por deepfake y diferentes idiomas. La compañía dijo que el modelo detectó audio deepfake correctamente para seis idiomas diferentes con una precisión de al menos el 93%. Detect-2B obtuvo una puntuación alta en la predicción de audio deepfake en seis idiomas. Fuente: Resemble AI Resemble lanzó su plataforma de voz de IA Rapid Voice Cloning en abril. Detect-2B estará disponible a través de una API y se puede integrar en diferentes aplicaciones. La identificación de deepfakes se ha vuelto más importante La identificación de voces o videos generados por IA está adquiriendo nueva importancia en el período previo a las elecciones presidenciales estadounidenses de 2024. Las voces de IA podrían facilitar el engaño a los votantes y la difusión de información errónea. Las preocupaciones sobre los deepfakes de IA, ya sea falsificar la voz de un político, fingir ser una celebridad en una canción o simplemente usar IA para ilustrar algo, han erosionado la confianza en las marcas. Herramientas como Detect-2B podrían ser de gran ayuda para identificar y probar deepfakes antes de que lleguen al público. Por supuesto, Resemble no es el único que trabaja para detectar clones de IA. McAfee lanzó el Proyecto Mockingbird en enero para detectar audio de IA. Meta, por otro lado, está desarrollando una forma de agregar marcas de agua al audio generado por IA. «Pero nuestro trabajo está lejos de terminar. A medida que las capacidades de IA generativa continúan avanzando, también deben avanzar nuestras capacidades de detección. «Tenemos varias direcciones de investigación interesantes planificadas para mejorar aún más DETECT-2B, centrándonos en áreas como el aprendizaje de la representación, las arquitecturas de modelos avanzadas y la expansión de datos», dijo Resemble. VB Daily ¡Manténgase informado! Reciba las últimas noticias en su bandeja de entrada todos los días Al suscribirse, acepta los Términos de servicio de VentureBeat. Gracias por suscribirse. Consulte más boletines de VB aquí. Se produjo un error.

Todo lo que necesitas saber sobre tecnología

El modelo de detección de audio con inteligencia artificial de próxima generación de Resemble AI, Detect-2B, tiene una precisión del 94 %

Deja una respuesta Cancelar la respuesta

El modelo de detección de audio con inteligencia artificial de próxima generación de Resemble AI, Detect-2B, tiene una precisión del 94 %

watchOS 11 soluciona mi última queja sobre el Apple Watch y no podría estar más feliz

Google aparentemente confirma que el Pixel 9 se presentará el 13 de agosto

Deja una respuesta Cancelar la respuesta