La gobernanza de datos juega un papel fundamental para garantizar que los datos estén disponibles, sean consistentes, utilizables, confiables y seguros. Hay muchos desafíos que enfrentar para mantener la gobernanza de datos, y la apuesta ha subido para sistemas como la inteligencia artificial y el aprendizaje automático. Los sistemas AI/ML funcionan de manera diferente a los sistemas tradicionales de registros fijos. El objetivo no es devolver un valor o un estado para una sola transacción. Más bien, un sistema de IA/ML examina petabytes de datos en busca de respuestas a consultas que pueden ser vastas y multifacéticas. Además, los datos pueden provenir de muchas fuentes internas y externas diferentes, cada una con su propia forma de recopilar, curar y almacenar datos, que pueden ajustarse o no a los estándares de gobernanza de su organización. Luego, es cuestión de asegurarse de que los sistemas de IA/ML estén capacitados con datos confiables para garantizar la precisión. Estas son solo algunas de las preocupaciones que enfrentan las empresas y sus auditores mientras se centran en la gobernanza de datos para AI/ML y buscan herramientas que puedan ayudarlos. Saltar a: ¿Por qué es necesaria la gobernanza de datos para los sistemas de IA/ML? Según el Índice global de adopción de IA de IBM 2022, la tasa de adopción global de IA es del 35% y es omnipresente en algunas industrias y países de todo el mundo. Esta rápida adopción de sistemas de IA y ML para impulsar la innovación y la toma de decisiones hace que la integridad y la gestión de los datos subyacentes sean primordiales. VER: Obtenga más información sobre la gobernanza de datos. En comparación con los sistemas informáticos tradicionales, los sistemas de IA y ML tienen más matices, lo que subraya la importancia de la gobernanza de datos. Hay dos razones principales por las que es necesario un marco de gobernanza de datos sólido para los sistemas AI/ML: Estructura dinámica: en comparación con los sistemas de datos tradicionales, los sistemas AI/ML son dinámicos: evolucionan constantemente y aprenden de datos estructurados y no estructurados. Volumen y variedad de datos: la eficacia de un sistema de IA/ML es directamente proporcional al volumen y la variedad de los conjuntos de datos con los que entrena y de los que aprende. Debido a estos factores, sin una gobernanza estricta, los sistemas de IA/ML pueden producir resultados inconsistentes, inexactos e incluso sesgados. ¿Cómo funciona la gobernanza de datos con los sistemas de IA/ML? Los sistemas AI/ML están diseñados para manejar grandes cantidades de datos de forma simultánea y asincrónica. Esto significa que se introducen múltiples subprocesos de datos en el procesador al mismo tiempo, lo que permite un procesamiento de datos más rápido y eficiente. Sin embargo, esto también introduce complejidades. El objetivo principal de un sistema de IA/ML es buscar en conjuntos de datos masivos para encontrar respuestas, que van desde predecir tendencias futuras basadas en datos históricos hasta identificar patrones en datos de comercio electrónico. Si los datos de una fuente están corruptos o sesgados, pueden influir en el resultado general, haciendo que los resultados no sean fiables. Por lo tanto, es de vital importancia incorporar una gobernanza de datos rigurosa en el proceso para garantizar que cada hilo de datos sea preciso, relevante y esté libre de sesgos. El papel de TI en la aceleración del procesamiento de datos Los departamentos de TI desempeñan un papel fundamental en el proceso de gobernanza de datos de IA/ML. Al preprocesar y eliminar datos irrelevantes o redundantes, pueden acelerar significativamente los tiempos de procesamiento de datos para los sistemas AI/ML. Esto garantiza que los modelos AI/ML se ejecuten de manera eficiente y funcionen con los datos más relevantes y de alta calidad. VER: Explore estas principales herramientas de preparación de datos. Además, los equipos de TI pueden implementar herramientas y protocolos para automatizar muchas tareas de gobernanza, como la validación de datos, garantizar la coherencia entre fuentes de datos y monitorear posibles violaciones de seguridad. Desafíos en la implementación de la gobernanza de datos para sistemas AI/ML La integración y gestión de datos para sistemas AI/ML plantean varios desafíos de gobernanza de datos que las organizaciones deben afrontar. Cobertura de big data de lectura obligada Integración de datos de varias fuentes Cuando las organizaciones recopilan datos de múltiples fuentes, cada una con sus propios estándares de gobernanza, garantizar la coherencia se convierte en un obstáculo importante. Esta diversidad puede dar lugar a discrepancias, redundancias e imprecisiones en los datos. Los datos deben armonizarse para proporcionar una visión integral que sea esencial para la eficacia. Integrar los datos en un formato unificado es un proceso complejo que implica limpieza, transformación y normalización. Para evitar modelos defectuosos, es fundamental garantizar que los vastos conjuntos de datos utilizados por los sistemas de IA/ML sean precisos y relevantes. Recomendaciones confiables Los datos de entrenamiento de algunos modelos de IA/ML son secretos, lo que dificulta que las organizaciones confíen y comprendan plenamente las recomendaciones proporcionadas por estos sistemas. Sin una idea de cómo se toman las decisiones, existe el riesgo de una mala interpretación o uso indebido. Por ejemplo, los modelos de IA/ML a veces reflejan o amplifican sesgos en los datos. Según un estudio de Obermeyer et al, un algoritmo que utilizó los costos de salud como indicador de las necesidades de salud, asignó a los pacientes negros, que estaban más enfermos que otros pacientes blancos, el mismo nivel de riesgo para la salud. Saber qué datos de entrenamiento se utilizan para el modelo y que se practica una gobernanza de datos rigurosa puede ayudar a identificar y rectificar estos sesgos, garantizando la equidad en los resultados del modelo. Mantener la calidad de los datos Dado que los sistemas de IA/ML dependen en gran medida de datos de alta calidad, es fundamental garantizar que los datos estén limpios, sean precisos y estén actualizados. La mala calidad de los datos puede dar lugar a predicciones y conocimientos erróneos del modelo. Por ejemplo, la mala calidad de los datos puede provocar sesgos en las predicciones. Un modelo de contratación discontinuo de Amazon es otro gran ejemplo en el que un ML formado con currículums de una década en 2014 desarrolló un sesgo contra las candidatas. La implementación de una gobernanza de datos para los sistemas de IA/ML garantiza que los datos utilizados sean siempre de la más alta calidad, lo que puede ayudar a eliminar cualquier sesgo o imprecisión. Seguridad y privacidad de los datos El manejo de grandes volúmenes de datos procesados ​​requiere una vigilancia constante para proteger la información confidencial y cumplir con las regulaciones. Grandes volúmenes de datos conllevan un mayor riesgo de seguridad y cumplimiento que exige el cumplimiento de muchas leyes diferentes de privacidad y protección de datos que trascienden fronteras. VER: Explore estas herramientas de calidad de datos superiores. Las fallas en la seguridad de los datos pueden tener consecuencias nefastas, como acceso no autorizado, manipulación de datos y violaciones. También puede socavar la confianza en el sistema de IA y tener consecuencias legales que dañen la reputación de una empresa y provoquen pérdidas financieras por disminución de las ventas o multas regulatorias. Una política de gobernanza de datos garantiza de manera proactiva que la seguridad de los datos cumpla con las regulaciones de protección de datos, emplea métodos de encriptación y monitorea el acceso a los datos periódicamente a través de auditorías. Cómo utilizar la gobernanza de datos para sistemas AI/ML El futuro de la gobernanza de datos en AI/ML no se trata solo de administrar datos sino también garantizar que se aproveche de manera responsable y eficaz. A medida que evoluciona el panorama de la IA/ML, también lo hace la importancia de una gobernanza de datos sólida. Las organizaciones deben ser proactivas, adaptables y estar equipadas con las herramientas adecuadas para navegar en este terreno. Asegúrese de que los datos sean consistentes y precisos Al integrar datos de sistemas transaccionales internos y externos, los datos deben estar estandarizados, para que puedan comunicarse y combinarse con datos de otras fuentes. Las interfaces de programación de aplicaciones que están prediseñadas en muchos sistemas facilitan esto, de modo que pueden intercambiar datos con otros sistemas. Si no hay API disponibles, las empresas pueden utilizar herramientas ETL, que transfieren datos de un sistema a un formato que otro sistema puede leer. Al agregar datos no estructurados, como objetos fotográficos, de video y de sonido, existen herramientas de vinculación de objetos que pueden vincular y relacionar estos objetos entre sí. Un buen ejemplo de enlazador de objetos es un sistema de información geográfica, que combina fotografías, esquemas y otros tipos de datos para ofrecer un contexto geográfico completo para un entorno particular. Confirmar que los datos son utilizables A menudo pensamos que los datos utilizables son datos a los que los usuarios pueden acceder, pero es más que eso. Si los datos han perdido su valor porque están obsoletos, deben eliminarse. Dicho esto, los usuarios empresariales y de TI deben ponerse de acuerdo sobre cuándo se deben eliminar los datos. Esto vendrá en forma de políticas de retención de datos. PREMIUM: Benefíciate de esta política de retención de datos electrónicos. Hay otras ocasiones en las que se deben eliminar los datos de IA/ML. Esto sucede cuando se cambia un modelo de datos para IA y los datos ya no se ajustan al modelo. En una auditoría de gobernanza de IA/ML, los examinadores esperarán ver políticas y procedimientos escritos para ambos tipos de depuración de datos. También verificarán que las prácticas de eliminación de datos cumplan con los estándares de la industria. Para mantenerse al día con estos estándares y prácticas, las empresas deberían considerar invertir en herramientas y utilidades de eliminación de datos. Asegúrese de que los datos sean confiables. Las circunstancias cambian. Un sistema de IA/ML que alguna vez funcionó de manera bastante eficiente puede comenzar a perder efectividad. Esto se conoce como deriva del modelo. Esto se puede confirmar comparando periódicamente los resultados de AI/ML con el rendimiento pasado y con lo que está sucediendo en el mundo. Si la precisión del sistema AI/ML se aleja de los datos actuales, es esencial solucionarlo. PREMIUM: asegúrese de que su empresa esté equipada con una política de ética de IA. Existen herramientas de IA/ML que los científicos de datos utilizan para medir la desviación del modelo, pero la forma más directa para que los profesionales de negocios verifiquen la desviación es comparar el rendimiento del sistema de IA/ML con el rendimiento histórico. Para abordar los desafíos de implementar la gobernanza de datos en sistemas de IA/ML, las organizaciones pueden invertir en herramientas de gobernanza de datos. Estas son algunas de las principales herramientas: Collibra: una plataforma holística de gobierno de datos adecuada para la gestión y el gobierno integrales de datos. Informatica: Reconocida por la integración de datos, es ideal para integrar datos de múltiples fuentes. Alation: Automatiza el descubrimiento y la catalogación de datos mediante el aprendizaje automático. Erwin: proporciona capacidades de modelado de datos, lo que ayuda a las empresas a comprender su panorama de datos. OneTrust: enfatiza el cumplimiento de datos, ayudando a las empresas a cumplir con las regulaciones. SAP Master Data Governance: ofrece procesamiento y gobierno de datos sólidos para empresas. Para obtener un análisis más detallado de las herramientas de gobernanza de datos y cómo pueden beneficiar a su organización, lea nuestra revisión de las principales herramientas de gobernanza de datos de 2023.

Source link