OpenAI presenta el modelo de IA de clonación de voz Voice Engine

Únase a nosotros en Atlanta el 10 de abril y explore el panorama de la fuerza laboral de seguridad. Exploraremos la visión, los beneficios y los casos de uso de la IA para los equipos de seguridad. Solicite una invitación aquí. No contento con interrumpir simplemente la generación de texto, imágenes y videos con sus diversos modelos de IA, OpenAI, creador de ChatGPT, también se está adentrando en la última forma importante de medios digitales heredados: el audio. En concreto, la clonación de voz. La compañía anuncia hoy su modelo de inteligencia artificial más nuevo, “Voice Engine”, que, según dice, ha estado en desarrollo desde 2022 y actualmente impulsa la API de texto a voz de OpenAI y las nuevas funciones ChatGPT Voice y Read Aloud presentadas a principios de este mes. Resulta que el modelo también puede realizar clonación de voz. Así es como funciona: un hablante humano graba un clip de 15 segundos de su voz a través de un teléfono o un micrófono de computadora, y el motor de voz de OpenAI genera «un discurso con sonido natural que se parece mucho al hablante original» y puede usarse de ahora en adelante. hablar en voz alta cualquier texto que escriba un usuario humano. Enormes implicaciones para el mercado del audio hablado La tecnología obviamente tiene enormes implicaciones para aquellos que se graban a sí mismos hablando con frecuencia, ya sean podcasters, locutores, intérpretes de palabra hablada, narradores de audiolibros y publicidad, jugadores. , streamers, agentes de atención al cliente, vendedores y muchas otras ocupaciones y disciplinas. Evento VB The AI Impact Tour – Atlanta Continuando con nuestro recorrido, nos dirigimos a Atlanta para la parada del AI Impact Tour el 10 de abril. Este evento exclusivo al que solo se puede acceder por invitación, en asociación con Microsoft, incluirá debates sobre cómo la IA generativa está transformando la fuerza laboral de seguridad. El espacio es limitado, así que solicite una invitación hoy. Solicitar una invitación también ejerce presión sobre otras empresas dedicadas a este tipo de tecnología, como la startup de inteligencia artificial bien financiada ElevenLabs, Captions, Meta, WellSaid Labs, MyShell y otras. OpenAI destaca aún más la capacidad de Voice Engine para ofrecer apoyo a personas no verbales, proporcionándoles voces únicas y no robóticas, y ayuda en programas terapéuticos y educativos para personas con discapacidades del habla o necesidades de aprendizaje. Casos de uso iniciales OpenAI dijo en su blog anunciando Voice Engine hoy que hasta ahora solo ha puesto la tecnología a disposición de un «pequeño grupo de socios confiables». Entre los destacados y nombrados se encuentra Age of Learning, una empresa de tecnología educativa que utiliza Voice Engine y GPT-4 para generar contenido de voz preguionado y personalizado en tiempo real, ampliando la asistencia de lectura y la interactividad para una audiencia estudiantil diversa. HeyGen, una plataforma de narración visual de IA que permite a creadores y empresas traducir su contenido a varios idiomas, emplea Voice Engine para la traducción de videos, creando avatares personalizados con apariencia humana con voces multilingües, preservando el acento del hablante original para llegar a una audiencia global. Dimagi, una empresa de software que fabrica herramientas para trabajadores de salud comunitarios, utiliza Voice Engine y GPT-4 para proporcionar comentarios interactivos en varios idiomas a dichos trabajadores, mejorando la prestación de servicios esenciales en entornos remotos. Livox, una aplicación de inteligencia artificial para dispositivos de comunicación aumentativa y alternativa (AAC) utilizados por personas con dificultades del habla y la audición, integra Voice Engine para proporcionar voces únicas y no robóticas en todos los idiomas para personas no verbales. El Instituto de Neurociencias Norman Prince de Lifespan, una organización médica y docente sin fines de lucro de la Universidad de Brown, dedicada a ayudar a quienes padecen enfermedades y trastornos neurológicos, está utilizando Voice Engine para ayudar a quienes tienen problemas del habla a utilizar la versión de inteligencia artificial de su voz. Dos médicos allí, Rohaid Ali y la neurocirujana pediátrica Konstantina Svokos, ya han logrado restaurar el habla de una paciente con tumor cerebral utilizando una muestra de audio de uno de los videos de su proyecto escolar. La compañía subió a su blog y envió por correo electrónico a VentureBeat bajo embargo varias muestras de audio que muestran las capacidades de habla humana de la tecnología. Por ejemplo, aquí está la “voz fuente” original del paciente de Lifespan: Y aquí está la voz clonada usando OpenAI Voice Engine: Base de usuarios limitada por diseño Sin embargo, por ahora, la tecnología es limitada. Al igual que con su potente, increíblemente realista y vívido modelo de IA de generación de vídeo Sora, OpenAI actualmente no permite que el público utilice Voice Engine. En cambio, hoy OpenAI simplemente comparte la existencia de la herramienta y “información preliminar y resultados de una vista previa a pequeña escala” con “un pequeño grupo de socios confiables” a quienes se les ha dado acceso. Como afirma OpenAI en su blog de hoy anunciando la tecnología: “Estamos adoptando un enfoque cauteloso e informado para un lanzamiento más amplio debido al potencial de uso indebido de la voz sintética. Esperamos iniciar un diálogo sobre el despliegue responsable de voces sintéticas y cómo la sociedad puede adaptarse a estas nuevas capacidades. Con base en estas conversaciones y los resultados de estas pruebas a pequeña escala, tomaremos una decisión más informada sobre si implementar esta tecnología a escala y cómo hacerlo”. El enfoque cauteloso, lento y constante y de acceso limitado para lanzar Voice Engine tiene sentido, especialmente a la luz del reciente llamado del presidente estadounidense Joseph R. Biden para «prohibir la suplantación de voz por IA». Un elemento central de la estrategia de implementación de OpenAI es el estricto cumplimiento de las pautas éticas y de seguridad. Los socios involucrados en las pruebas de Voice Engine están sujetos a políticas de uso que prohíben la suplantación de identidad no autorizada y requieren el consentimiento informado de los donantes de voz. Además, OpenAI ha implementado medidas de seguridad como marcas de agua y monitoreo proactivo para garantizar el uso responsable de la tecnología. VB Daily ¡Manténgase informado! Reciba las últimas noticias en su bandeja de entrada diariamente. Al suscribirse, acepta los Términos de servicio de VentureBeat. Gracias por suscribirte. Consulte más boletines de VB aquí. Ocurrió un error.

Source link

Todo lo que necesitas saber sobre tecnología

OpenAI presenta el modelo de IA de clonación de voz Voice Engine

Deja una respuesta Cancelar la respuesta

OpenAI presenta el modelo de IA de clonación de voz Voice Engine

HONOR presenta el HONOR Pad 9 repleto de funciones

Su éxito en el comercio electrónico con las soluciones de desarrollo de AleaIT

Deja una respuesta Cancelar la respuesta