Microsoft ha actualizado su servicio Azure AI Search para aumentar la capacidad de almacenamiento y el tamaño del índice vectorial sin costo adicional, una medida que, según dijo, hará más económico para las empresas ejecutar aplicaciones generativas basadas en IA. Anteriormente conocida como Azure Cognitive Search, Azure AI El servicio de búsqueda conecta almacenes de datos externos que contienen datos no indexados con una aplicación que envía consultas o solicitudes a un índice de búsqueda. Consta de tres componentes (un motor de consultas, índices y el motor de indexación) y se utiliza principalmente para recuperar información para mejorar el rendimiento de la IA generativa, un proceso conocido como generación aumentada de recuperación (RAG). Los límites ampliados gratuitos solo se aplicarán a los nuevos servicios desarrollados después del 3 de abril de 2024, dijo la compañía, y agregó que no hay forma de actualizar los servicios existentes, por lo que las empresas necesitarán crear otros nuevos para beneficiarse del aumento de capacidades. A diferencia de los servicios desarrollados antes de esa fecha , los nuevos servicios obtendrán un aumento de 3 a 6 veces en el almacenamiento total por partición, un aumento de 5 a 11 veces en el tamaño del índice vectorial por partición y el respaldo informático adicional del servicio admite más vectores con alto rendimiento y una mejora de hasta el doble en indexación y consulta. rendimiento. La actualización, en promedio, reduce el costo por vector en un 85% y ahorra hasta un 75% en los costos totales de almacenamiento, escribió Pablo Castro, ingeniero de Azure AI, en una publicación de blog. El nivel básico del servicio, según Castro, obtendrá 13 GB de almacenamiento adicional por partición después de la actualización, en comparación con solo 2 GB por partición antes. Los niveles S1, S2 y S3 del servicio obtendrán 135 GB, 250 GB y 500 GB de almacenamiento adicional por partición respectivamente. Los niveles L1 y L2 no verán cambios, dijo la compañía. En el tamaño del índice vectorial, los niveles básico, S1, S2 y S3 tendrán una capacidad de tamaño adicional de 4 GB, 32 GB, 88 GB y 164 GB por partición, respectivamente. Nuevamente, los niveles L1 y L2 no verán cambios. La oferta actualizada estará disponible en la mayoría de las regiones de EE. UU. y el Reino Unido, junto con otras regiones como Suiza Occidental, Suecia Central, Polonia Central, Noruega Este, Corea del Sur, Corea Central y Japón Este. , Oeste de Japón, Norte de Italia, India central, Oeste de India Jio, Centro de Francia, Norte de Europa, Centro de Canadá, Este de Canadá, Sur de Brasil, Asia oriental y Sudeste de Asia. Más funciones para optimizar el almacenamiento de vectores Además de actualizar el almacenamiento y los tamaños de índice de vectores , la compañía está trabajando para incorporar más funciones para optimizar el almacenamiento de vectores. Estas funciones, que actualmente se encuentran en versión preliminar, incluyen cuantificación y tipos numéricos limitados para vectores, entre otros ajustes. Microsoft está utilizando la cuantificación y el sobremuestreo para comprimir y optimizar el almacenamiento de datos vectoriales, dijo Castro, y agregó que esto reduce el tamaño del índice vectorial en un 75% y el almacenamiento vectorial en disco hasta en un 25%. Además, el ingeniero dijo que las empresas podrían utilizar campos vectoriales estrechos. tipos primitivos como int8, int16 o float16, para reducir el tamaño del índice vectorial y el almacenamiento de vectores en disco hasta en un 75%. Otras técnicas para una mayor optimización incluyen establecer la propiedad almacenada en campos vectoriales para reducir la sobrecarga de almacenamiento. Copyright © 2024 IDG Communications, Inc.

Source link