Luna de Galileo redefine la evaluación GenAI, con costos 97% más bajos y velocidades 11 veces más rápidas

¡VB Transform 2024 regresa este julio! Más de 400 líderes empresariales se reunirán en San Francisco del 9 al 11 de julio para profundizar en el avance de las estrategias GenAI y participar en debates que invitan a la reflexión dentro de la comunidad. Descubre aquí cómo puedes asistir. Galileo, pionero en IA generativa empresarial, ha presentado Galileo Luna, un conjunto innovador de modelos básicos de evaluación (EFM) que promete transformar la forma en que las empresas evalúan sus sistemas GenAI. Con Luna, Galileo pretende abordar los desafíos críticos de velocidad, costo y precisión que han obstaculizado la adopción generalizada de la IA generativa en entornos de producción. «Galileo creó Luna para abordar las limitaciones de los métodos de evaluación GenAI actuales, que eran lentos, costosos y a menudo inexactos», dijo Vikram Chatterji, cofundador y director ejecutivo de Galileo, en una entrevista con VentureBeat. «La motivación surgió de la necesidad de evaluaciones de latencia ultrabaja, rentables y de alta precisión en entornos de producción». El desarrollo de Luna marca un hito importante para Galileo, que ha estado a la vanguardia de la GenAI empresarial desde su creación a principios de 2021. La dedicación de la empresa para ampliar los límites de la evaluación de la IA es evidente en el intensivo proceso de I+D de casi un año de duración que condujo a la creación de Luna. Luna, el innovador conjunto de modelos básicos de evaluación de Galileo, supera a las principales metodologías de evaluación de IA en una comparación comparativa de las puntuaciones del área bajo la curva característica operativa del receptor (AUROC). Los valores AUROC más altos, que alcanzan 0,78, demuestran la precisión superior de Luna en la evaluación de sistemas de IA generativa empresariales, superando a competidores como GPT-3.5, Trulens Groundedness y RAGAS Faithfulness. (Crédito de la imagen: Galileo) Los modelos diseñados específicamente redefinen la velocidad, el costo y la precisión. En el corazón de la innovación de Luna se encuentran sus pequeños modelos de lenguaje diseñados específicamente, meticulosamente diseñados para tareas de evaluación específicas, como la detección de alucinaciones, la evaluación de la calidad del contexto y la prevención de fuga de datos. y pronta identificación maliciosa. Este diseño especializado permite a Luna ofrecer un rendimiento incomparable en tres métricas clave: velocidad, costo y precisión. La inscripción para VB Transform 2024 está abierta Únase a los líderes empresariales en San Francisco del 9 al 11 de julio para nuestro evento emblemático de IA. Conéctese con pares, explore las oportunidades y desafíos de la IA generativa y aprenda cómo integrar aplicaciones de IA en su industria. Regístrese ahora “Luna supera a GPT-3.5 en velocidad, costo y precisión a través de varias innovaciones”, explicó Chatterji. “Luna utiliza pequeños modelos de lenguaje especialmente diseñados para tareas de evaluación específicas, lo que reduce significativamente los costos y la sobrecarga computacional. Esta elección de diseño permite evaluaciones que son un 97 % más económicas y 11 veces más rápidas que las realizadas con GPT-3.5”. Pero no se trata sólo de velocidad y costo. Luna también cuenta con una precisión líder en la industria, superando a los métodos anteriores hasta en un 20% en la detección de alucinaciones, inyecciones rápidas, información de identificación personal (PII) y más. «Los modelos de lenguaje pequeño de múltiples cabezas y las técnicas avanzadas como la fragmentación inteligente garantizan que los modelos Luna mantengan mejor el contexto y proporcionen evaluaciones más precisas», agregó Chatterji. En una comparación de los costos mensuales para evaluar 1 millón de consultas, Luna de Galileo rebaja significativamente otras metodologías, con un costo de sólo 175 dólares al mes. Los modelos de lenguaje pequeño especialmente diseñados de Luna permiten evaluaciones de costo ultrabajo, lo que los hace hasta un 97% más rentables que alternativas como GPT-3.5 a $6248 por mes, RAGAS Faithfulness a $7994 por mes y Trulens Groundedness a $16,641 por mes. . (Crédito de la imagen: Galileo) Revolucionando la evaluación sin conjuntos de datos reales terrestres Uno de los aspectos más notables de Luna es su capacidad para operar sin la necesidad de conjuntos de datos reales reales tradicionales. Al aprovechar modelos de evaluación previamente entrenados y ajustados en diversos conjuntos de datos específicos de dominio, Luna elimina el proceso costoso y lento de crear conjuntos de pruebas personalizados. Esta innovación agiliza el proceso de evaluación y reduce la dependencia de una gran cantidad de datos generados por humanos. Las aplicaciones potenciales de Luna son enormes, y Chatterji destaca su relevancia en industrias que exigen alta confiabilidad y velocidad en las evaluaciones de IA. “Luna es especialmente poderosa en aplicaciones empresariales a gran escala donde el volumen y el rendimiento son necesarios (es decir, millones de consultas por mes). «Estamos viendo que las empresas Fortune 100 en los sectores de salud, finanzas y telecomunicaciones encuentran a Luna particularmente útil», dijo. Luna de Galileo ofrece una velocidad inigualable en la evaluación de IA, con una latencia de solo 0,232 segundos para procesar una sola consulta. Esto marca una mejora significativa con respecto a otras metodologías, como GPT-3.5 con 2,5 segundos, Galileo Chainpoll con 3,0 segundos, Trulens Groundedness con 3,4 segundos y RAGAS Faithfulness con 5,4 segundos. Los modelos de lenguaje pequeño especialmente diseñados de Luna permiten evaluaciones de latencia ultrabaja, lo que los hace hasta 11 veces más rápidos que los enfoques de la competencia. (Crédito de la imagen: Galileo) Personalización y evolución continua frente a los rápidos avances de GenAI. Los casos de uso van desde el monitoreo en tiempo real de los resultados de la IA y la detección de alucinaciones en el contenido generado por la IA hasta garantizar la seguridad y la calidad de las interacciones del chatbot. Y con el producto Fine Tune de Galileo, Luna se puede personalizar para satisfacer los requisitos específicos del cliente, logrando niveles de precisión del 95% o más para tareas críticas en industrias como la farmacéutica y los servicios financieros. A medida que el panorama de la IA generativa continúa evolucionando rápidamente, Galileo sigue comprometido a mantenerse a la vanguardia de la innovación. Chatterji enfatizó que Luna escalará de tres maneras clave: ampliando el soporte para más tipos de tareas de evaluación, mejorando continuamente la precisión y reduciendo aún más los costos y la latencia. «Galileo se compromete a ampliar los límites de lo que es posible en la evaluación de la IA y ayudar a las organizaciones a llevar la IA confiable a la producción», dijo Chatterji. «A medida que el panorama de la IA generativa continúa evolucionando, Galileo sigue dedicado a brindar a sus clientes capacidades de evaluación de vanguardia que hagan que la IA sea práctica para que las empresas la implementen e inspiren confianza entre los consumidores». Con el lanzamiento de Luna, Galileo ha solidificado su posición como líder en evaluación de GenAI empresarial. A medida que más organizaciones busquen aprovechar el poder de la IA generativa, la capacidad de Luna para ofrecer evaluaciones rápidas, rentables y precisas será un factor crítico para impulsar la adopción generalizada y desbloquear todo el potencial de esta tecnología transformadora. VB Daily ¡Manténgase informado! Reciba las últimas noticias en su bandeja de entrada diariamente. Al suscribirse, acepta los Términos de servicio de VentureBeat. Gracias por suscribirte. Consulte más boletines de VB aquí. Ocurrió un error.

Todo lo que necesitas saber sobre tecnología

Luna de Galileo redefine la evaluación GenAI, con costos 97% más bajos y velocidades 11 veces más rápidas

Deja una respuesta Cancelar la respuesta

Luna de Galileo redefine la evaluación GenAI, con costos 97% más bajos y velocidades 11 veces más rápidas

El peligro invisible de los administradores poco capacitados en los grupos Meta Suite

Visual Studio Code agrega selección de múltiples pestañas

Deja una respuesta Cancelar la respuesta