La arquitectura de datos sin cabeza es una consecuencia orgánica de la separación del almacenamiento, la gestión, la optimización y el acceso a los datos de los servicios que los escriben, procesan y consultan. Con esta arquitectura, puede gestionar sus datos desde una única ubicación lógica, incluidos los permisos, la evolución del esquema y las optimizaciones de las tablas. Y, por si fuera poco, simplifica mucho el cumplimiento normativo, porque sus datos residen en un solo lugar, en lugar de copiarse en todos los motores de procesamiento que los necesitan. La llamamos arquitectura de datos “sin cabeza” debido a su similitud con un “servidor sin cabeza”, donde tiene que utilizar su propio monitor y teclado para iniciar sesión. Si desea procesar o consultar sus datos en una arquitectura de datos sin cabeza, tendrá que traer su propio “cabezal” de procesamiento o consulta y conectarlo a los datos; por ejemplo, Trino, Presto, Apache Flink o Apache Spark. Una arquitectura de datos sin cabeza puede abarcar múltiples formatos de datos, siendo los flujos de datos y las tablas los dos más comunes. Los flujos proporcionan acceso de baja latencia a datos incrementales, mientras que las tablas proporcionan capacidades eficientes de consulta masiva. Juntos, le brindan la flexibilidad de elegir el formato que sea más adecuado para sus casos de uso, ya sea operativo, analítico o algo intermedio. Primero, echemos un vistazo a la transmisión en la arquitectura de datos sin interfaz gráfica.