Zilliz Cloud aumenta el rendimiento de las bases de datos vectoriales

Zilliz, con sede en San Francisco, ha lanzado una nueva versión de su oferta de base de datos como servicio (DBaaS), Zilliz Cloud. La compañía afirma que la nueva versión ofrece un mejor rendimiento y reduce el costo de propiedad en comparación con su versión anterior. Zilliz Cloud está construido sobre el sistema de gestión de bases de datos vectoriales Milvus de código abierto. Zilliz fue fundada por ingenieros que ayudaron a desarrollar la base de datos vectorial Milvus. La nueva versión de Zilliz Cloud, según la empresa, ofrece un rendimiento 10 veces mejor que la base de datos vectorial Milvus original. Esto se logra utilizando el índice gráfico Hierarchical Navigable Small World (HNSW) en combinación con una búsqueda filtrada mejorada. HNSW, sin embargo, es algo en juego para la mayoría de las bases de datos vectoriales, incluidas las de sus rivales Weaviate y Pinecone. Es uno de los índices gráficos más populares para crear bases de datos vectoriales. «HNSW es cada vez más una capacidad imprescindible, por lo que Zilliz estaría en desventaja sin el soporte de su DBMS», dijo Doug Henschen, analista principal de Constellation Research. La razón detrás de la popularidad de los índices basados en gráficos se puede atribuir a su cualidad fundamental de poder encontrar los vecinos más cercanos aproximados en datos de alta dimensión y al mismo tiempo ser eficiente en memoria. Esta cualidad da como resultado un aumento del rendimiento y una reducción del coste de propiedad. Otro ejemplo de índice basado en gráficos es Vamana. Otros tipos de índices utilizados en bases de datos vectoriales incluyen el índice de archivos invertidos (IVF). Las características adicionales de la actualización de Zilliz Cloud incluyen la métrica de similitud de coseno, búsqueda de rango y upsert. La métrica de similitud del coseno se usa a menudo para el procesamiento de texto, donde la dirección de los vectores de incrustación es importante pero la distancia entre ellos no. Se usa una búsqueda de rango en una base de datos de vectores para limitar los resultados de la búsqueda según la distancia entre un vector de consulta y vectores de base de datos. La función upsert, en una base de datos de vectores, se utiliza para agregar un nuevo vector al índice o actualizar uno si existe un vector con la misma ID. Además de proporcionar un cliente Milvus unificado que, según Zilliz, mejorará el desarrollador experiencia, la nueva versión de Zilliz Cloud se puede integrar con análisis de datos, aprendizaje automático y plataformas de transmisión como Apache Spark, Apache Kafka y Airbyte. A pesar de las ventajas de la nueva versión, Henschen de Constellation Research cree que muchas empresas recurrirán a las bases de datos convencionales que ya utilizan para capacidades como la incorporación y la búsqueda de vectores. “El desafío para proveedores como Zilliz es que no tienen los datos transaccionales «O tienen que proporcionar la facilidad de uso para obtener datos transaccionales en ellos o necesitan tener una solución que ayude a las empresas a actualizar los vectores de su sistema», dijo Holger Mueller, otro analista principal de Constellation Research. de registro. No hacerlo obligará a las empresas a mirar sus bases de datos existentes, como las de Oracle, AWS, IBM y Microsoft”, añadió Mueller. La competencia es aún más dura para Zilliz ya que rivales como Pinecone también ofrecen sus productos como nube. servicios basados en, agregó Henschen. Sin embargo, el analista dijo que los equipos y desarrolladores de IA dedicados pueden encontrar ventajas de rendimiento y costos al utilizar un producto o servicio de base de datos vectorial dedicado, suponiendo que proporcione todas las características que necesitan para respaldar sus casos de uso. Copyright © 2024 IDG Communications, Inc.

Source link

Todo lo que necesitas saber sobre tecnología

Zilliz Cloud aumenta el rendimiento de las bases de datos vectoriales

Deja una respuesta Cancelar la respuesta

Zilliz Cloud aumenta el rendimiento de las bases de datos vectoriales

El informe Sysdig expone un 91% de fallas en los análisis en tiempo de ejecución

IA en todas partes al mismo tiempo

Deja una respuesta Cancelar la respuesta