El proveedor de bases de datos vectoriales de código abierto Qdrant ha lanzado BM42, un algoritmo de búsqueda híbrido basado en vectores destinado a proporcionar una recuperación más precisa y eficiente para aplicaciones de generación aumentada por recuperación (RAG). BM42 combina lo mejor de la búsqueda tradicional basada en texto y la búsqueda basada en vectores para reducir los costos de las aplicaciones RAG e IA, dijo Qdrant. BM42 de Qdrant se anunció el 2 de julio. Los motores de búsqueda de palabras clave tradicionales, que utilizan algoritmos como BM25, existen desde hace más de 50 años y no están optimizados para la recuperación precisa que necesitan las aplicaciones modernas, según Qdrant. Como resultado, tienen dificultades con las demandas específicas de RAG, en particular con segmentos cortos que requieren un mayor contexto para informar una búsqueda y recuperación exitosas. Según Qdrant, el cambio de una búsqueda basada en palabras clave a una completamente vectorizada ofrece un nuevo estándar en la industria. “BM42, para textos cortos que son más prominentes en escenarios RAG, proporciona la eficiencia de los enfoques de búsqueda de texto tradicionales, además del contexto de los vectores, por lo que es más flexible, preciso y eficiente”, afirmó Andrey Vasnetsov, director de tecnología y cofundador de Qdrant. Esto ayuda a que la búsqueda vectorial sea más universalmente aplicable, agregó. A diferencia de la búsqueda tradicional basada en palabras clave, adecuada para contenido de formato largo, BM42 integra vectores dispersos y densos para identificar información relevante dentro de un documento. Un vector disperso maneja la coincidencia exacta de términos, mientras que los vectores densos manejan la relevancia semántica y el significado profundo, según la empresa. Copyright © 2024 IDG Communications, Inc.