Desmitificante de telas de datos: cerrar la brecha entre fuentes de datos y cargas de trabajo

El término «tejido de datos» se utiliza en toda la industria tecnológica, pero su definición e implementación pueden variar. He visto esto en todos los proveedores: en otoño del año pasado, British Telecom (BT) habló sobre su tejido de datos en un evento de analistas; Mientras tanto, en el almacenamiento, NetApp ha estado reorientando su marca a una infraestructura inteligente, pero previamente estaba usando el término. El proveedor de la plataforma de aplicaciones Appian tiene un producto de tela de datos, y el proveedor de bases de datos MongoDB también ha estado hablando de telas de datos e ideas similares. En esencia, un tejido de datos es una arquitectura unificada que abstrae e integra fuentes de datos dispares para crear una capa de datos sin problemas. El principio es crear una capa unificada y sincronizada entre fuentes dispares de datos y las cargas de trabajo que necesitan acceso a los datos: sus aplicaciones, cargas de trabajo y, cada vez más, sus algoritmos de IA o motores de aprendizaje. Hay muchas razones para querer tal superposición. El tejido de datos actúa como una capa de integración generalizada, conectando a diferentes fuentes de datos o agregando capacidades avanzadas para facilitar el acceso para aplicaciones, cargas de trabajo y modelos, como permitir el acceso a esas fuentes mientras las mantiene sincronizadas. Hasta ahora, todo bien. El desafío, sin embargo, es que tenemos una brecha entre el principio de un tejido de datos y su implementación real. La gente está usando el término para representar cosas diferentes. Para volver a nuestros cuatro ejemplos: BT define el tejido de datos como una superposición a nivel de red diseñada para optimizar la transmisión de datos a través de largas distancias. La interpretación de NetApp (incluso con el término infraestructura de datos inteligentes) enfatiza la eficiencia de almacenamiento y la gestión centralizada. Appian posiciona su producto de tela de datos como una herramienta para unificar datos en la capa de aplicación, lo que permite un desarrollo más rápido y la personalización de las herramientas orientadas al usuario. MongoDB (y otros proveedores de soluciones de datos estructurados) consideran los principios de los tejidos de datos en el contexto de la infraestructura de gestión de datos. ¿Cómo cortamos todo esto? Una respuesta es aceptar que podemos abordarlo desde múltiples ángulos. Puede hablar sobre el tejido de datos conceptualmente, reconociendo la necesidad de reunir fuentes de datos, pero sin exaltar. No necesitas un «Uber-Fabric» universal que cubra absolutamente todo. En su lugar, concéntrese en los datos específicos que necesita administrar. Si rebobinamos un par de décadas, podemos ver similitudes con los principios de la arquitectura orientada a los servicios, que buscaban desacoplar la provisión de servicios de los sistemas de bases de datos. En aquel entonces, discutimos la diferencia entre servicios, procesos y datos. Lo mismo se aplica ahora: puede solicitar un servicio o solicitar datos como servicio, centrándose en lo que se necesita para su carga de trabajo. ¡Crear, leer, actualizar y eliminar sigan siendo los servicios de datos más sencillos! También recuerdo los orígenes de la aceleración de la red, que utilizaría el almacenamiento en caché para acelerar las transferencias de datos manteniendo versiones de datos localmente en lugar de acceder repetidamente a la fuente. Akamai construyó su negocio sobre cómo transferir contenido no estructurado como música y películas de manera eficiente y a largas distancias. Eso no es para sugerir que las telas de datos reinventan la rueda. Estamos en un mundo diferente (basado en la nube) tecnológicamente; Además, traen nuevos aspectos, no menos importantes en torno a la gestión de metadatos, el seguimiento de linaje, el cumplimiento y las características de seguridad. Estos son especialmente críticos para las cargas de trabajo de IA, donde la gobernanza de los datos, la calidad y la procedencia afectan directamente el rendimiento del modelo y la confiabilidad. Si está considerando implementar un tejido de datos, el mejor punto de partida es pensar en para qué desea los datos. Esto no solo lo ayudará a orientarlo hacia qué tipo de tela de datos podría ser el más apropiado, sino que este enfoque también ayuda a evitar la trampa de tratar de administrar todos los datos del mundo. En cambio, puede priorizar el subconjunto de datos más valioso y considerar qué nivel de datos de datos funciona mejor para sus necesidades: Nivel de red: para integrar datos en entornos de múltiples nubes, locales y de borde. Nivel de infraestructura: si sus datos están centralizados con un proveedor de almacenamiento, concéntrese en la capa de almacenamiento para servir grupos de datos coherentes. Nivel de aplicación: para reunir conjuntos de datos dispares para aplicaciones o plataformas específicas. Por ejemplo, en el caso de BT, han encontrado un valor interno en el uso de su tejido de datos para consolidar datos de múltiples fuentes. Esto reduce la duplicación y ayuda a optimizar las operaciones, haciendo que la gestión de datos sea más eficiente. Es claramente una herramienta útil para consolidar silos y mejorar la racionalización de la aplicación. Al final, el tejido de datos no es una solución monolítica, única para todos. Es una capa conceptual estratégica, respaldada por productos y características, que puede aplicar donde tiene más sentido para agregar flexibilidad y mejorar la entrega de datos. La tela de implementación no es un ejercicio de «establecerlo y olvidarlo»: requiere un esfuerzo continuo para alcanzar, implementar y mantener, no solo el software en sí sino también la configuración e integración de las fuentes de datos. Si bien un tejido de datos puede existir conceptualmente en múltiples lugares, es importante no replicar los esfuerzos de entrega innecesariamente. Por lo tanto, ya sea que esté uniendo datos a través de la red, dentro de la infraestructura o en el nivel de aplicación, los principios siguen siendo los mismos: úselos donde sea más apropiado para sus necesidades y le permite evolucionar con los datos que sirve.

Todo lo que necesitas saber sobre tecnología

Desmitificante de telas de datos: cerrar la brecha entre fuentes de datos y cargas de trabajo

Deja una respuesta Cancelar la respuesta

Desmitificante de telas de datos: cerrar la brecha entre fuentes de datos y cargas de trabajo

La aplicación Catwatchful Stalkerware derrama secretos de 62,000 usuarios

Resultados de las pruebas de referencia completadas en las máquinas virtuales AVD y Cloud PC – Blog de IT de Ryan Mangan

Deja una respuesta Cancelar la respuesta