Google Cloud dijo el jueves que está agregando soporte vectorial e integrando LangChain con todas sus ofertas de bases de datos en un esfuerzo por superar a los proveedores de servicios en la nube rivales, como Amazon Web Services (AWS), Microsoft y Oracle. una carrera para agregar IA generativa y capacidades relacionadas con la IA a sus ofertas de bases de datos para tener la ventaja de ser el primero en moverse y obtener una porción más grande del creciente mercado de IA y IA generativa. Las nuevas actualizaciones de las ofertas de bases de datos incluyen la adición de soporte vectorial para Bases de datos relacionales, de valores clave, de documentos y en memoria, como CloudSQL, Spanner, Firestore, Bigtable y Memorystore para Redis. La búsqueda del vecino más cercano es un diferenciador clave. Las capacidades vectoriales agregadas a las bases de datos incluyen capacidades de búsqueda, incluida la búsqueda aproximada del vecino más cercano ( ANN) y la búsqueda exacta del vecino más cercano (KNN). Mientras que ANN se utiliza para optimizar la búsqueda, en otras palabras, reducir la latencia, para conjuntos de datos grandes, KNN se utiliza para devolver resultados de búsqueda más específicos o precisos en conjuntos de datos más pequeños, dijo David Menninger, ejecutivo director de Ventana Research de ISG. «El soporte para ANN y KNN refleja que no existe un enfoque único para la búsqueda de vectores y que diferentes casos de uso requieren diferentes algoritmos de indexación para proporcionar el nivel requerido de precisión y rendimiento». Menninger explicó y agregó que esto resalta que corresponde a los desarrolladores comprender la naturaleza de sus datos y aplicaciones, y experimentar con varias bases de datos para identificar las capacidades que mejor se adaptan a los requisitos de un proyecto individual. La otra ventaja desde el punto de vista de Google, según el analista principal de Forrester, Noel Yuhanna, es que la mayoría de los proveedores de bases de datos no ofrecen tanto ANN como KNN. “Algunos proveedores admiten KNN, mientras que otros apoyan el enfoque ANN. ANN es más popular porque es escalable y funciona bien para grandes conjuntos de datos y vectores de alta dimensión”, dijo Yuhanna. Todas las capacidades vectoriales agregadas a las ofertas de bases de datos se encuentran actualmente en versión preliminar. En julio del año pasado, Google lanzó soporte para la popular extensión pgvector en AlloyDB y Cloud SQL para respaldar la creación de aplicaciones de IA generativa. La incorporación de capacidades vectoriales en múltiples ofertas de bases de datos desde julio del año pasado a intervalos regulares, aparentemente hace que Google Cloud sea «más agresivo» que los hiperescaladores rivales, según Menninger. Sin embargo, señaló que casi todos los proveedores de bases de datos están agregando soporte para vectores. y capacidades de búsqueda de vectores. Microsoft, AWS y Oracle, según Yuhanna, tienen cierto nivel de capacidades de soporte de vectores en proceso en sus respectivas ofertas de bases de datos. Los anuncios de Google Cloud podrían darle una ventaja sobre sus rivales, ya que parece estar un poco más adelante que otros en términos de hacer que estas capacidades estén generalmente disponibles para las empresas, dijo Yuhanna. Ambos analistas también señalaron que agregar soporte Las capacidades vectoriales pronto se convertirán en algo en juego para que los proveedores de plataformas de datos respalden el desarrollo de aplicaciones de IA generativa complementando grandes modelos de lenguaje (LLM) con datos empresariales aprobados para mejorar la precisión y la confianza. ISG, según Menninger, cree que casi todas las empresas que desarrollan Las aplicaciones basadas en IA generativa explorarán el uso de la generación aumentada de búsqueda y recuperación de vectores para complementar los modelos básicos con datos y contenido patentados para fines de 2026. La rivalidad entre las bases de datos vectoriales y las bases de datos tradicionales La adición de capacidades vectoriales por parte de hiperescaladores y otros proveedores de bases de datos a Según los analistas, sus ofertas han resultado en una creciente rivalidad entre las bases de datos vectoriales y las bases de datos tradicionales. Si bien las bases de datos tradicionales han agregado capacidades vectoriales para presentar sus argumentos a las empresas, las bases de datos vectoriales han sido capaces de hacer que sus productos sean más fácilmente consumibles por los no expertos, agregaron. Sin embargo, Menninger de ISG cree que más del 50% de las empresas utilizarán las tradicionales. ofertas de bases de datos con soporte vectorial para 2026, dada su dependencia de estas bases de datos tradicionales. Las bases de datos vectoriales especializadas seguirán existiendo, aunque solo para casos de uso más complejos y sofisticados, dijo Menninger. Pinecone, Chroma, Weaviate, Milvus y Qdrant son ejemplos de bases de datos especializadas. Menninger explicó además que si la búsqueda de vectores se realiza mejor utilizando una base de datos de vectores especializada o una base de datos de propósito general dependerá de una variedad de factores, incluido el relativo dependencia de una empresa de una base de datos existente, habilidades de desarrollador, tamaño del conjunto de datos y requisitos de aplicación específicos. Integración de LangChain con todas las ofertas de bases de datos de GoogleGoogle Cloud está agregando integraciones de LangChain para todas sus bases de datos. «Admitiremos tres integraciones de LangChain que incluyen almacenes de vectores, cargadores de documentos y memoria de mensajes de chat», dijo Andi Gutmans, vicepresidente de ingeniería de la división de bases de datos de Google Cloud. LangChain es un marco para desarrollar aplicaciones impulsadas por LLM y la integración en bases de datos. permitirá a los desarrolladores flujos de trabajo integrados de generación aumentada de recuperación (RAG) en su fuente de datos preferida, agregó Gutmans. Si bien la integración de tiendas de vectores LangChain está disponible para AlloyDB, Cloud SQL para PostgreSQL, Cloud SQL para MySQL, Memorystore para Redis y Spanner, La integración de la memoria de los cargadores de documentos y los mensajes de chat está disponible para todas las bases de datos, incluidas Firestore, Bigtable y SQL Server. Los analistas ven la incorporación de integraciones de LangChain como un movimiento «asertivo» de Google. «LangChain es actualmente el marco más popular para conectar LLM a fuentes privadas de datos empresariales, proporcionando integración neutral del proveedor con bases de datos empresariales, así como entornos comerciales de desarrollo e implementación de aprendizaje automático, como SageMaker Studio y Vertex AI Studio”, explicó Menninger. AlloyDB AI disponible de forma generalizadaGoogle ha hecho que su oferta AlloyDB AI esté disponible de forma generalizada. Se puede utilizar a través de AlloyDB y AlloyDB Omni.AlloyDB AI, que pasó a la versión preliminar en agosto del año pasado, es un conjunto de capacidades integradas que permiten a los desarrolladores crear aplicaciones generativas basadas en IA utilizando datos en tiempo real. Se basa en el soporte vectorial básico disponible con PostgreSQL estándar y puede introducir una función PostgreSQL simple para generar incrustaciones de datos. AlloyDB AI es una parte integral de AlloyDB y AlloyDB Omni, y está disponible sin costo adicional, dijo la compañía. Copyright © 2024 IDG Communications, Inc.

Source link