Si hay algo que una empresa moderna necesita son datos, la mayor cantidad posible. Comenzando con los almacenes de datos y ahora con los lagos de datos, utilizamos herramientas locales y en la nube para administrar y analizar esos datos, dándoles forma para brindar los conocimientos empresariales necesarios. Los datos son cada vez más importantes hoy en día, ya que ahora se utilizan para capacitar y ajustar modelos de IA personalizados o proporcionar una base esencial para aplicaciones de IA existentes. Fabric de Microsoft es una plataforma de análisis alojada que se basa en herramientas de datos existentes como Azure Synapse, por lo que no sorprende que Microsoft haya utilizado su evento BUILD 2024 centrado en IA para revelar nuevas características destinadas a respaldar los requisitos de datos y análisis a escala. de aplicaciones modernas de IA. Microsoft ha estado describiendo Fabric como una plataforma que elimina la complejidad de trabajar con cantidades sustanciales de datos, permitiéndole centrarse en el análisis y obtener valor de esos datos. Esto puede ser mediante el uso de herramientas como Power BI para crear y compartir paneles basados ​​en datos, o el uso de esos datos para entrenar, probar y operar IA personalizadas o para cimentar modelos básicos de IA generativa existentes. Envolver icebergs en tela Una de las características nuevas más importantes estaba agregando soporte para más formatos de datos para ayudar a integrar Microsoft Fabric con otras plataformas de datos a gran escala. Hasta ahora, Fabric se construyó sobre el formato de datos Delta Parquet, administrado por la Fundación Linux y utilizado por muchas plataformas diferentes basadas en Lakehouse. Su tecnología de almacenamiento de datos de código abierto le permite combinar registros de transacciones con almacenes de objetos en la nube a escala. No es necesario utilizar almacenes de datos especializados; en su lugar, el motor de datos que elija puede funcionar simplemente con un archivo Delta Lake almacenado en Azure Blob Storage. Es un formato de datos importante, pero no es el único que se utiliza para administrar grandes cantidades de datos. Una plataforma popular es la plataforma de datos en la nube administrada de Snowflake, que utiliza el formato de tabla abierta Iceberg de Apache. Esto utiliza herramientas similares a SQL para administrar su big data, lo que le permite editar rápidamente tablas grandes y editar su esquema actual. Si Microsoft Fabric va a ser el centro de datos de IA en Azure, entonces debe admitir tantas fuentes de datos como sea posible. . Entonces, uno de los anuncios de plataformas de datos más importantes en BUILD fue el soporte para Iceberg en el entorno de datos OneLake de Microsoft Fabric junto con Delta Parquet, así como herramientas para un vínculo bidireccional entre Microsoft Fabric y Snowflake, lo que le permitirá trabajar con las herramientas que necesita. preferir. Un aspecto clave del soporte de Fabric para Iceberg es el uso de atajos para traducir metadatos entre los dos formatos y permitir que las consultas y herramientas analíticas los traten como una única fuente, sin importar dónde estén alojados. Esto debería permitir a las organizaciones con grandes conjuntos de datos existentes alojados en Snowflake u otros entornos Iceberg aprovechar Microsoft Fabric y su integración con herramientas como Azure AI Studio. Esto debería simplificar el proceso de entrenamiento de modelos de IA con datos almacenados en la nube de Snowflake, sin tener que almacenarlos en dos lugares separados. Ese mismo enfoque se está adoptando tanto con las herramientas de marketing basadas en la nube de Adobe como con Azure Databricks. Dado que utilizan las herramientas de acceso directo de Microsoft Fabric, podrá incorporar catálogos de Databricks existentes a Fabric y, al mismo tiempo, sus datos de OneLake serán visibles como un catálogo en Azure Databricks. Esto le permite utilizar la mejor herramienta para la tarea que necesita, con flujos de trabajo que cruzan diferentes conjuntos de herramientas sin comprometer sus datos. Compatibilidad mejorada con datos en tiempo realAunque Microsoft Fabric tenía soporte básico para un tipo de datos clave (datos transmitidos en tiempo real), se necesitaban dos herramientas diferentes para utilizar esos datos de manera eficaz. Ejecutar análisis sobre datos en vivo desde sus sistemas empresariales y desde sistemas industriales de Internet de las cosas puede proporcionar información rápida que le ayudará a detectar problemas antes de que afecten a su negocio, especialmente cuando está vinculado a herramientas que pueden activar alertas y acciones cuando sus datos indican problemas. La herramienta de inteligencia en tiempo real proporciona un centro para trabajar con datos transmitidos. Puede considerarlo como el equivalente a un lago de datos para sus datos en tiempo real, que los obtiene de múltiples fuentes y proporciona un conjunto de herramientas para administrar y transformar esos datos. El resultado es un entorno de desarrollo sin código que utiliza la conocida metáfora del conector para ayudar a construir rutas para sus datos, extrayendo información y enrutando los datos transmitidos a un lago de datos para su posterior análisis. Los datos transmitidos pueden provenir de Azure y de otras fuentes de datos externas. Este enfoque le ayuda a extraer el máximo valor de sus datos transmitidos. Al activar eventos periféricos, puede responder rápidamente, atrapando el fraude en una plataforma de comercio electrónico o detectando fallas incipientes en la maquinaria instrumentada. Los datos se convierten en una herramienta para entrenar nuevos modelos de IA que pueden automatizar esos procesos. Consultas en lenguaje natural con Copilots Microsoft ha estado agregando una interfaz de lenguaje natural a Fabric en la forma de su propio Copilot. Esto tiene como objetivo permitir a los usuarios hacer preguntas rápidas sobre sus datos de series temporales, generando el lenguaje de consulta Kusto (KQL) subyacente necesario para repetir o refinar la consulta. De manera útil, este enfoque le ayudará a aprender a utilizar KQL. Puede ver rápidamente cómo se relaciona una consulta KQL con su pregunta inicial, lo que permite a los usuarios sin experiencia adquirir las habilidades de análisis de datos necesarias. Ese mismo Copilot subyacente se utiliza para crear la nueva función de habilidades de inteligencia artificial de Microsoft Fabric. Aquí se comienza seleccionando una fuente de datos y, mediante el uso de preguntas en lenguaje natural y sin configuración adicional, se crean rápidamente consultas complejas, agregando fuentes y tablas adicionales, según sea necesario. Nuevamente, la herramienta de inteligencia artificial le mostrará la consulta que creó, lo que le permitirá realizar ediciones y compartir el resultado con colegas. Microsoft tiene la intención de poner estas habilidades a disposición de Copilot Studio, brindándole un entorno de desarrollo sin código de extremo a extremo para datos y flujos de trabajo. Agregar API de aplicaciones a los análisis de Microsoft FabricMicrosoft Fabric es una herramienta analítica importante y también ofrece un centro para gestionar y controlar su big data, listo para usar en otras aplicaciones. Lo que se necesita es una forma de adjuntar API a esos datos para que los puntos finales de Fabric se puedan integrar en su código. Hasta ahora, todas las API de Fabric eran API de gestión RESTful, para crear sus propias herramientas administrativas. Este último conjunto de actualizaciones le permite agregar sus propias API de GraphQL a sus datos. Los lagos de datos y las casas de lagos pueden contener muchos esquemas diferentes, por lo que el uso de las definiciones de API basadas en tipos de GraphQL hace posible construir API que funcionen en todos sus datos de Fabric y devuelvan datos. de todas sus fuentes en un solo objeto JSON. No es necesario que su código tenga conocimiento de los datos en su entorno Fabric; el motor de consulta Fabric proporciona toda la abstracción necesaria. Crear una API es un proceso sencillo. Dentro del entorno de administración de Microsoft Fabric, comience por nombrar su API. Luego elige tus fuentes y las tablas que deseas exponer. Esto crea el esquema GraphQL y puede trabajar en el explorador de esquemas integrado para definir las consultas y las relaciones necesarias entre tablas. No todas las fuentes de datos de Fabric son compatibles en este momento, pero debería poder comenzar con el conjunto actual de puntos finales de análisis, que le permite brindar acceso a los datos de análisis existentes. Esto permite a Microsoft Fabric almacenar datos, ejecutar consultas de análisis, almacenar resultados en tablas y luego ofrecer acceso API a esos resultados. Una vez que su API esté lista, todo lo que necesita hacer es copiar el punto final resultante y pasárselo a los desarrolladores de su aplicación. Deberán incluir las autorizaciones adecuadas, garantizando que solo los usuarios aprobados obtengan acceso (especialmente importante si su API permite modificar los datos). Estas últimas actualizaciones de Microsoft Fabric llenan muchos de los vacíos obvios de la plataforma. Al facilitar el trabajo con formatos de datos alternativos, incluidos los datos transmitidos, ahora puede aprovechar las inversiones existentes, mientras que la compatibilidad con las API GraphQL ofrece la oportunidad de crear aplicaciones que puedan funcionar con big data mientras Fabric maneja las consultas subyacentes detrás de escena. Al ofrecer una forma de abstraerse de la complejidad asociada con los datos a escala y al proporcionar agentes de inteligencia artificial, Microsoft Fabric está demostrando cómo una plataforma de datos administrados puede permitirle pasar de datos sin procesar a aplicaciones analíticas sin importar sus habilidades. Todo lo que necesitas hacer es hacer preguntas. Copyright © 2024 IDG Communications, Inc.