¿Quieres ideas más inteligentes en tu bandeja de entrada? Regístrese en nuestros boletines semanales para obtener solo lo que importa a los líderes de IA, datos y seguridad empresariales. Suscríbete ahora Google ha trasladado oficialmente su nuevo modelo de incrustación de Gemini de alto rendimiento a la disponibilidad general, actualmente clasificando el número uno en general en el texto de referencia masivo de texto masivo (MTEB). El modelo (Gemini Embedding-001) es ahora una parte central de la API de Gemini y el Vertex AI, lo que permite a los desarrolladores construir aplicaciones como la búsqueda semántica y la generación de recuperación acuática (RAG). Si bien una clasificación número uno es un debut fuerte, el panorama de los modelos de incrustación es muy competitivo. El modelo patentado de Google está siendo desafiado directamente por poderosas alternativas de código abierto. Esto establece una nueva opción estratégica para las empresas: adoptar el modelo patentado mejor clasificado o un Challenger de código abierto casi bueno que ofrece más control. Lo que está debajo del capó del modelo de incrustación de Géminis de Google en su núcleo, los incrustaciones convierten el texto (u otros tipos de datos) en listas numéricas que capturan las características clave de la entrada. Los datos con un significado semántico similar tienen valores de incrustación que están más juntos en este espacio numérico. Esto permite aplicaciones poderosas que van mucho más allá de la simple coincidencia de palabras clave, como la construcción de sistemas de generación de recuperación inteligente (RAG) que alimentan la información relevante a los LLM. Los incrustaciones también se pueden aplicar a otras modalidades, como imágenes, video y audio. Por ejemplo, una compañía de comercio electrónico podría utilizar un modelo de incrustación multimodal para generar una representación numérica unificada para un producto que incorpore descripciones textuales e imágenes. La serie AI Impact regresa a San Francisco – 5 de agosto La próxima fase de IA está aquí – ¿Estás listo? Únase a los líderes de Block, GSK y SAP para una visión exclusiva de cómo los agentes autónomos están remodelando los flujos de trabajo empresariales, desde la toma de decisiones en tiempo real hasta la automatización de extremo a extremo. Asegure su lugar ahora: el espacio es limitado: https://bit.ly/3Guuplf para empresas, los modelos de incrustación pueden alimentar motores de búsqueda internos más precisos, agrupación sofisticada de documentos, tareas de clasificación, análisis de sentimientos y detección de anomalías. Los incrustaciones también se están convirtiendo en una parte importante de las aplicaciones de agente, donde los agentes de IA deben recuperar y coincidir con diferentes tipos de documentos y indicaciones. Una de las características clave de la incrustación de Géminis es su flexibilidad incorporada. Se ha entrenado a través de una técnica conocida como Matryoshka Representing Learning (MRL), que permite a los desarrolladores obtener una incrustación altamente detallada de 3072 dimensiones, pero también la truncar a tamaños más pequeños como 1536 o 768 al tiempo que preservan sus características más relevantes. Esta flexibilidad permite a una empresa lograr un equilibrio entre la precisión del modelo, el rendimiento y los costos de almacenamiento, lo cual es crucial para escalar las aplicaciones de manera eficiente. Google posiciona a Gemini incrustando como un modelo unificado diseñado para funcionar efectivamente «fuera de la caja» en diversos dominios como finanzas, legales e ingeniería sin la necesidad de ajustar. Esto simplifica el desarrollo para equipos que necesitan una solución de propósito general. Apoyando más de 100 idiomas y con un precio competitivo a $ 0.15 por millón de tokens de entrada, está diseñado para una amplia accesibilidad. Un panorama competitivo de los retadores de código abierto y de código abierto Fuente: el blog de Google La tabla de clasificación MTEB muestra que, si bien Gemini lidera, la brecha es estrecha. Se enfrenta a modelos establecidos de OpenAI, cuyos modelos de incrustación son ampliamente utilizados, y retadores especializados como Mistral, que ofrece un modelo específicamente para la recuperación de códigos. La aparición de estos modelos especializados sugiere que para ciertas tareas, una herramienta específica puede superar a una generalista. Otro jugador clave, Cohere, se dirige a la empresa directamente con su modelo InSquiador 4. Mientras que otros modelos compiten en puntos de referencia generales, Cohere enfatiza la capacidad de su modelo para manejar los «datos ruidosos del mundo real» que a menudo se encuentran en documentos empresariales, como errores de ortografía, problemas de formateo e incluso escritura a mano escaneada. También ofrece implementación en nubes privadas virtuales o locales, proporcionando un nivel de seguridad de datos que apela directamente a industrias reguladas como las finanzas y la atención médica. La amenaza más directa para el dominio propietario proviene de la comunidad de código abierto. El modelo de incrustación QWEN3 de Alibaba se ubica justo detrás de Gemini en MTEB y está disponible bajo una licencia permisiva de Apache 2.0 (disponible para fines comerciales). Para las empresas centradas en el desarrollo de software, Qodo-Embed-1-1.5b presenta otra alternativa de código abierto convincente, diseñada específicamente para el código y afirma superar modelos más grandes en puntos de referencia específicos de dominio. Para las empresas que ya se basan en Google Cloud y la familia de modelos Gemini, la adopción del modelo de incrustación nativa puede tener varios beneficios, incluida la integración perfecta, una tubería de MLOPS simplificada y la garantía de usar un modelo de propósito general mejor clasificado. Sin embargo, Géminis es un modelo cerrado y solo API. Las empresas que priorizan la soberanía de los datos, el control de costos o la capacidad de ejecutar modelos en su propia infraestructura ahora tienen una opción creíble de código abierto de nivel superior en QWEN3 o pueden usar uno de los modelos de incrustación específicos de tareas. Insights diarias sobre casos de uso de negocios con VB diariamente Si desea impresionar a su jefe, VB Daily lo tiene cubierto. Le damos la cuenta interior de lo que las empresas están haciendo con la IA generativa, desde cambios regulatorios hasta implementaciones prácticas, por lo que puede compartir ideas para el ROI máximo. Lea nuestra Política de privacidad Gracias por suscribirse. Mira más boletines de VB aquí. Ocurrió un error.
Deja una respuesta