Etiqueta: grandes datos

Convertir grandes volúmenes de datos en tiempo real en análisis digeribles se está volviendo fundamental, especialmente con la IA generativa. Informatica sostiene que las partes interesadas exigen conocimientos más visuales y procesables. El crecimiento de la inteligencia artificial generativa ha hecho que los datos sean una moneda más valorada para las organizaciones y agencias privadas en Australia. Para los profesionales de datos locales, esto significa que se les está prestando más atención, desde la calidad y la gobernanza de los datos hasta el análisis y la alfabetización en datos. TechRepublic se reunió con el vicepresidente senior global y gerente general de gobernanza de datos en la nube y operaciones en la nube de Informatica, Brett Roscoe, y Richard Scott, vicepresidente del grupo de Asia Pacífico, para preguntar cómo la empresa de gestión de datos en la nube está viendo cómo se adaptan las organizaciones locales. Informatica afirma que las partes interesadas ahora piden que los conocimientos de los datos en tiempo real sean más claros para generar confianza en las decisiones. Mientras tanto, la IA generativa permitirá realizar tareas relacionadas con datos mucho más rápido y brindará al personal más acceso a información valiosa a través de consultas en lenguaje natural. Saltar a: 1. Las juntas directivas y los ejecutivos quieren darle más sentido a los datos en tiempo real La cantidad de datos en las organizaciones y la velocidad a la que se recopilan y crean en tiempo real están creando grandes desafíos. Las juntas directivas y los ejecutivos quieren obtener información de estos datos en formas más visuales y consumibles, para poder comprenderlos mejor para tomar decisiones. Brett Roscoe de Informatica dijo que las juntas directivas quieren cada vez más poder captar información de datos en tiempo real a través de herramientas como inteligencia empresarial y visualización de datos, que pueden mostrar información importante a través de paneles o extraer datos a través de consultas personalizadas. 2. La alfabetización en datos es un desafío, pero las juntas directivas tienen «curiosidad analítica» En Australia existe un problema importante con la alfabetización en datos a nivel de juntas directivas. Al mismo tiempo, las juntas directivas también se están volviendo “curiosas analíticamente”, dijo Roscoe. La IA generativa, en particular, está impulsando a las juntas directivas a observar más de cerca cómo se utilizan los datos en sus organizaciones. VER: Australia se está adaptando rápidamente a la IA generativa. Informatica está viendo que cada vez más empresas trabajan con juntas directivas para mejorar la educación y la comprensión de los datos y el análisis. Esto les permitirá comprender los factores involucrados en la obtención de esos datos, lo que les ayudará a fundamentar sus decisiones. 3. La democratización de los datos está ayudando a diferentes equipos a obtener valor. Existe una demanda de que los datos lleguen a una variedad de personas en una organización, no solo a las juntas directivas. Ya sea que se trate del departamento de marketing, del servicio de atención al cliente de primera línea o de líneas de negocio que quieran crear modelos de IA, los profesionales de datos deben considerar cómo se necesitarán y consumirán los datos. «En el mundo de la nube y la IA generativa en el que nos encontramos, los datos salen del negocio en tiempo real», dijo Roscoe. “El desafío es cómo hacer llegar datos en tiempo real a los integrantes de toda la organización antes de que se vuelvan obsoletos. Si la entrega demora tres meses, puede que sea en parte irrelevante”. 4. La IA generativa podría acelerar la forma en que se procesan y utilizan los datos Las empresas australianas verán importantes ventajas de productividad gracias a la IA generativa, afirmó Richard Scott de Informatica. Esto incluye acortar la duración de las tareas relacionadas con los datos, como ahorrar semanas o, a veces, meses de esfuerzo en áreas como la comparación y clasificación de datos. PREMIUM: Aprovecha esta política de clasificación de datos. «Esto presenta oportunidades para poner datos en tiempo real en manos de las personas adecuadas», afirmó Scott. “Porque si espera tres meses para comparar y clasificar los datos, los datos en tiempo real no le resultan realmente útiles. Hay muchísimas oportunidades de productividad para el gobierno y las empresas”. 5. La IA generativa también podría permitir que más empleados consulten datos. Las herramientas de IA generativa podrían desempeñar un papel importante en la democratización del acceso a los conocimientos de datos en diferentes niveles. Al utilizar consultas en lenguaje natural, incluso aquellos con menos habilidades en datos podrán hacer preguntas sobre conjuntos de datos, simplificando y ampliando así el acceso a los datos en todas las organizaciones. CLAIRE GPT de Informatica, por ejemplo, es un motor de inteligencia artificial que se utiliza para tareas de gestión de datos como clasificación automática y generación de reglas. Las consultas en lenguaje natural impulsadas por IA generativa están haciendo que los datos y los conocimientos sean más accesibles para una gama más amplia de usuarios empresariales. 6. Los tomadores de decisiones ahora quieren datos procesables, no solo datos. Las herramientas de datos que no empoderan a los ejecutivos y juntas directivas para tomar decisiones han sido descritas por algunos como esencialmente inútiles y no vale la pena invertir en ellas. Roscoe de Informatica está de acuerdo y dice que los datos por sí solos no necesariamente dar a los tomadores de decisiones lo que necesitan. «Además de aumentar la alfabetización en materia de datos, tenemos que proporcionar datos relevantes que sean fáciles de entender y crearlos de una manera que sea procesable», dijo Roscoe. «Si estás proporcionando datos que no pueden respaldar un resultado o un proceso de toma de decisiones, es difícil para cualquier ejecutivo seguir adelante». 7. Continúa la tensión entre el intercambio de datos y los silos de datos A pesar del temor siempre presente de que los datos de alguna manera se filtren fuera de una organización si se comparten demasiado ampliamente, Informatica sostiene que los datos aislados contienen sus propios riesgos, y compartir datos sabiamente puede crear valor. Los servicios proporcionados por agencias gubernamentales australianas son un ejemplo. «Cada agencia tiene sus propios datos sobre los ciudadanos y los analiza de forma ligeramente diferente dependiendo de la relación», dijo Roscoe. «La oportunidad de observar a un solo ciudadano en múltiples agencias ayudaría a los gobiernos a respaldar mejores servicios, como el cuidado de personas mayores o la migración». 8. La confianza en la gestión del acceso a los datos se puede generar con herramientas. Generar confianza en la gestión del acceso será fundamental para garantizar que los datos se puedan compartir de manera útil dentro de las organizaciones. Capacidades como la atención a diferentes niveles de acceso a los datos y la capacidad de limpiar u ocultar datos en función de los niveles de acceso respaldarán la confianza dentro de las organizaciones. Por ejemplo, la reciente adquisición de Privitar por parte de Informatica, una empresa de privacidad y acceso a la gestión de datos en la nube, incorporará controles de acceso más avanzados a su producto en la nube para ayudar a los clientes a equilibrar la necesidad de permanecer ágiles y proporcionar autoservicio con una sólida gestión de datos.

Source link

Revelando los peligros ocultos de descuidar los datos digitales

por Javier Javier Rodriguez

el noviembre 5, 2023

en Computadoras

En el mundo actual impulsado por los datos, la información es la clave del éxito. Sin embargo, un número significativo de organizaciones se enfrentan a un desafío crítico: los silos de datos. Estos depósitos aislados de información, si no se abordan, no sólo obstaculizan la obtención de información valiosa sino que también exponen a las empresas a riesgos sustanciales. Comprensión de los silos de datos Los silos de datos surgen cuando varios equipos, departamentos o sistemas acaparan datos, restringiendo su flujo y accesibilidad en toda la organización. Esta fragmentación genera inconsistencias, duplicaciones y lagunas en el panorama de la información. Sin una perspectiva integral, identificar patrones y oportunidades esenciales se convierte en una batalla cuesta arriba, y las decisiones comerciales críticas se toman basándose en un subconjunto de datos sesgado. Los peligros de gran alcance de los silos de datos 1. Malas experiencias de los clientes En una era en la que los clientes exigen interacciones fluidas y personalizadas, los silos de datos constituyen un obstáculo importante. Estos repositorios de datos desconectados hacen que sea casi imposible brindar experiencias consistentes en diferentes canales. ¿El resultado? Clientes frustrados y disminución de la lealtad de los clientes, mientras las organizaciones luchan por cumplir con las expectativas cambiantes. 2. Vulnerabilidades de seguridad La seguridad de los datos se convierte en un rompecabezas complejo cuando la información está dispersa en sistemas aislados. Hacer cumplir estrictas políticas de seguridad y controles de acceso se vuelve un desafío, lo que allana el camino para posibles violaciones de datos, filtraciones y ciberataques. La naturaleza fragmentada de los silos de datos deja vulnerable la información confidencial, lo que representa una grave amenaza para la integridad de una organización. 3. Ineficiencia y desperdicio La duplicación de esfuerzos y datos dentro de sistemas aislados conduce al desperdicio de tiempo y recursos. La energía vital que podría dirigirse a la innovación y el crecimiento se pierde cuando los equipos trabajan de manera redundante en tareas similares. Esta ineficiencia afecta directamente la productividad y la eficacia operativa, lo que obstaculiza la capacidad de una organización para prosperar. 4. Innovación reprimida La innovación se nutre de la síntesis de ideas y conocimientos, a menudo extraídos de diversas fuentes de datos. Sin embargo, los silos de datos crean barreras a esta síntesis, limitando el potencial de descubrir conexiones valiosas. La ausencia de un panorama de datos integrado sofoca la innovación, dejando a las organizaciones desprovistas de las nuevas perspectivas necesarias para impulsar el progreso. 5. Riesgos de incumplimiento Navegar por los panoramas regulatorios se convierte en una tarea desalentadora cuando los datos están aislados y fragmentados. Muchas regulaciones exigen datos unificados para la gobernanza, la auditabilidad y la gestión de riesgos. La falta de integración de datos entre silos pone a las organizaciones en riesgo de incumplimiento, con posibles repercusiones legales y financieras. Derribar barreras: soluciones para los silos de datos Los desafíos que plantean los silos de datos son sustanciales, pero no insuperables. La combinación correcta de estrategia de datos y tecnología puede allanar el camino hacia un futuro más conectado y eficiente. Estructura de datos holística Una estructura de datos holística sirve como piedra angular para superar los silos de datos. Al conectar sin problemas datos de varias fuentes, ofrece una vista unificada que fomenta conocimientos más profundos y una toma de decisiones informada. Esta integración permite a las organizaciones romper las barreras entre departamentos y sistemas, permitiendo que los datos fluyan libremente. Virtualización y automatización de datos Aprovechar el poder de la virtualización y la automatización de datos agiliza el proceso de acceso y utilización de datos. Estas tecnologías eliminan la necesidad de mover o copiar datos físicamente, lo que reduce la redundancia y garantiza el acceso en tiempo real a información precisa. Análisis unificado Las plataformas de análisis unificados permiten a las organizaciones consolidar los esfuerzos de análisis de datos. Al centralizar herramientas y técnicas, los equipos pueden colaborar de forma eficaz y extraer más valor de sus datos. Este enfoque acelera la identificación de tendencias, patrones y oportunidades. Empoderamiento con servicios e-CTO Aprovechar los servicios e-CTO permite a las organizaciones liberar todo el potencial de sus datos. Podemos ayudar a identificar el acceso a datos en tiempo real, análisis de autoservicio y democratización de conocimientos. Al poner los datos a disposición de quienes los necesitan, las organizaciones pueden impulsar la eficiencia, minimizar los riesgos y fomentar la innovación. Conclusión Los peligros ocultos de los silos de datos son innegables y afectan todo, desde las experiencias de los clientes hasta la seguridad y la innovación. Sin embargo, con el enfoque correcto, las organizaciones pueden desmantelar estas barreras y aprovechar sus datos para impulsar el éxito. Un tejido de datos holístico, junto con tecnologías avanzadas, sirve como clave para desbloquear el verdadero potencial de los datos. Adoptar el poder de los servicios e-CTO permite a las organizaciones prosperar en un mundo interconectado, donde los datos fluyen libremente y funcionan como catalizador del crecimiento. Preguntas frecuentes 1. ¿Qué son exactamente los silos de datos? Los silos de datos se refieren a colecciones aisladas de datos dentro de una organización que dificultan su flujo y accesibilidad fluidos. 2. ¿Cómo afectan los silos de datos a las experiencias de los clientes? Los silos de datos impiden que las organizaciones brinden experiencias consistentes y personalizadas, lo que genera clientes frustrados y pérdida de lealtad. 3. ¿Pueden los silos de datos generar riesgos de seguridad? Sí, los silos de datos aumentan el riesgo de violaciones de seguridad y ataques cibernéticos debido a la naturaleza fragmentada de los datos y a las limitadas políticas de seguridad aplicables. 4. ¿Qué papel juega la virtualización de datos en la superación de los silos de datos? La virtualización de datos facilita el acceso en tiempo real a los datos sin necesidad de duplicación física, rompiendo barreras entre sistemas aislados. 5. ¿Cómo pueden los servicios e-CTO impulsar la innovación? Los servicios e-CTO pueden ayudarle a identificar análisis de autoservicio clave y democratizar los conocimientos, lo que permite que más equipos accedan y aprovechen los datos para fines innovadores. ¡Tomar medidas ahora! Libere todo el potencial de su negocio con nuestros innovadores servicios eCTO en https://www.ilearnfromcloud.com/shop/cto. Descubra las capacidades transformadoras de nuestro e-CTO y cómo puede respaldar eficazmente el crecimiento de su empresa de TI. Obtenga más información: https://bit.ly/IT_Partner Descubra cómo nuestro e-CTO (CTO virtual) impulsa un crecimiento explosivo de las empresas de las PYME | Más información: https://bit.ly/CTO-for-SME

Source link

Por qué las grandes empresas tecnológicas se están aventurando más en el sector financiero

por Javier Javier Rodriguez

el noviembre 4, 2023

en Tecnolgia

Descargo de responsabilidad: las opiniones expresadas en esta historia pertenecen únicamente al autor. En 2007, Amazon lanzó Amazon Pay, una pasarela de pagos en línea que permite a los titulares de cuentas realizar pagos en miles de sitios web. En los años posteriores, el resto de las grandes empresas tecnológicas han seguido su ejemplo: Google Pay se lanzó en 2011, Apple Pay en 2014, Microsoft Pay en 2016 y Facebook (ahora Meta) Pay en 2019. Tras esta entrada inicial en las finanzas, Estas empresas solo han ampliado sus horizontes en la década de 2020. Google se ha asociado con bancos de todo el mundo (DBS y OCBC en Singapur) para ampliar sus servicios Google Pay, Apple ha lanzado una cuenta de ahorros de alto rendimiento en asociación con Goldman Sachs, y la historia continúa. Todo esto plantea la pregunta: ¿por qué? ¿Por qué todas las grandes tecnologías se están trasladando a los servicios financieros y por qué lo están haciendo ahora? La respuesta corta: datos. La respuesta larga es la siguiente. Crecimiento de la recopilación de datos Desde la llegada de Internet, ha habido un crecimiento exponencial en la cantidad de datos producidos cada año. Para dos de las cinco grandes empresas tecnológicas (Alphabet y Meta), aprovechar estos datos ha sido la clave para su modelo de negocio principal. En 2022, al igual que en años anteriores, los servicios publicitarios de Google representaron el 80 por ciento de los ingresos de Alphabet. Como motor de búsqueda más grande del mundo, la plataforma tiene acceso a una gran cantidad de datos de los usuarios, como edad, sexo, ubicación e historial de búsqueda. Utilizando estos datos, Google permite a los anunciantes orientar sus anuncios a aquellos que encajan en un determinado grupo demográfico. Esto incluye la segmentación basada en intereses, pasatiempos e incluso nivel de ingresos. Un ejemplo de las opciones de orientación demográfica que ofrecen Google Ads/Créditos de imagen: KlientBoost Meta utiliza un modelo similar utilizando los datos recopilados de sus plataformas de redes sociales, Facebook e Instagram. A continuación, consideremos a Amazon, Microsoft y Apple, que no dependen de la recopilación de datos para su negocio principal, sino que obtienen beneficios de ella como un flujo terciario o por medios indirectos. La principal fuente de ingresos de Amazon es su negocio minorista con más de 300 millones de usuarios. Con todos los datos que la empresa recopila sobre los hábitos de compra de sus usuarios, tiene la oportunidad perfecta para ofrecer servicios de publicidad dirigida a casi 10 millones de vendedores que utilizan su mercado. El negocio de publicidad de Amazon ha experimentado un rápido crecimiento desde 2021 (cuando la compañía lo informó por primera vez en sus ganancias), generando más de 30 mil millones de dólares en ingresos anuales. Los ingresos por publicidad en búsquedas de Microsoft, derivados del motor de búsqueda Bing, representaron el seis por ciento, o 11.600 millones de dólares, de los ingresos totales de la compañía en 2022. Si bien es una proporción relativamente pequeña, generó un 36 por ciento más que el año anterior. lo que la convierte en la de más rápido crecimiento entre todas las fuentes de ingresos de Microsoft. Finalmente, si bien Apple no ofrece servicios de publicidad, sí cobra a Google por el derecho a ser el motor de búsqueda predeterminado en los dispositivos Apple. En 2014, esto costó mil millones de dólares y hoy, según se informa, cuesta más de 18 mil millones de dólares. Google es el primero en recopilar datos de los usuarios de productos Apple y Apple, consciente del valor creciente de estos datos, cobra una tarifa más alta a medida que pasa el tiempo. La próxima frontera de la recopilación de datos En 2006, el matemático Clive Humby dijo que “los datos son el nuevo petróleo”, y sus observaciones ciertamente han envejecido bien. Entonces, según esa analogía, recopilar más datos sería una forma segura de ganar más dinero. Como han demostrado Meta y Google con sus respectivas plataformas, una forma eficaz de recopilar datos es a cambio del acceso a algo de valor. Por ejemplo, Instagram permite a los usuarios conectarse con amigos y consumir contenido a cambio de datos como lo que les gusta y lo que no, sus intereses y detalles personales. Estas métricas de datos básicos están disponibles para todas las grandes empresas de tecnología en la actualidad. Para obtener una ventaja en el futuro, deben buscar formas de obtener una visión más profunda de la vida de sus consumidores. Aquí es donde entran las finanzas. Los hábitos de gasto pueden resaltar tendencias y ofrecer una imagen clara de métricas como el ingreso disponible, los medios de gasto preferidos y la frecuencia de las compras. Amazon podría introducir anuncios dirigidos más sofisticados al recopilar datos sobre los hábitos de gasto de sus consumidores / Créditos de imagen: Amazon Ads Por ejemplo, si reserva unas vacaciones usando Amazon Pay, el mercado de Amazon podría usar estos datos para seleccionar sus anuncios en consecuencia, dirigiéndose a usted con lo esencial. que puedas necesitar para tu viaje. De manera similar, Google y Meta podrían refinar su segmentación de clientes y ofrecer más valor a los clientes que se anuncian con ellos. Un hotelero podría dirigirse no sólo a los usuarios que tienen «viajar» como uno de sus intereses, sino también a aquellos que han gastado más de 1.000 dólares estadounidenses en viajes en los últimos seis meses. Aprovechar las fortalezas existentes Las finanzas ofrecen una oportunidad ideal para las grandes empresas de tecnología, en la que pueden aumentar los puntos de recopilación de datos mientras aprovechan sus fortalezas existentes y satisfacen una necesidad del consumidor. Las pasarelas de pago son una solución que encaja perfectamente en esta intersección. Los pagos en línea se han vuelto cada vez más populares en los últimos años y, por eso, los consumidores necesitan formas más seguras de realizar transacciones. Es inconveniente y arriesgado almacenar datos de pago en varios comerciantes y terceros. Como tal, las pasarelas de pago actúan como intermediarios confiables, facilitando las transacciones y manteniendo seguros los datos financieros. Los consumidores no necesitan compartir la información de su tarjeta de crédito con cada sitio web desde el que realizan pedidos, solo con la pasarela de pago. Las ofertas de pagos digitales de Apple, Google y Amazon estuvieron entre las mejores en los EE. UU. cuando se clasificaron según el conocimiento de la marca / Créditos de imagen: Enterprise Apps Today Naturalmente, al elegir una pasarela de pago, los consumidores elegirían una que sea confiable y de buena reputación. Las grandes empresas tecnológicas disfrutan aquí de una ventaja competitiva, dada su relación preestablecida con una gran base de consumidores. Millones de usuarios del mercado de Amazon, que ya han compartido los datos de su tarjeta de crédito con la empresa, probablemente recurrirían a Amazon Pay antes de considerar una pasarela de pago lanzada por una empresa con la que no están familiarizados. Por lo tanto, las grandes empresas tecnológicas pueden ingresar al ámbito de las finanzas con una ventaja sobre otros actores y, al hacerlo, mejorar significativamente sus esfuerzos de recopilación de datos. El futuro de la recopilación de datos El papel que desempeñan los datos en el marketing y la publicidad no hará más que crecer a medida que pase el tiempo. Para empresas como Google y Meta, una mejor recopilación de datos será clave para salvaguardar su negocio principal. Para Microsoft, Amazon y Apple, podría representar una oportunidad atractiva para diversificar aún más sus fuentes de ingresos. Junto con la recopilación de datos, el análisis desempeña un papel igualmente importante. Después de todo, los datos son de poca utilidad hasta que se filtran en tendencias e información útil. Lea la siguiente entrevista con el director de ingresos de Crayon Data para conocer el creciente uso de la inteligencia artificial (IA) para maximizar el valor de los datos recopilados. Crédito de la imagen destacada: Amazon / Google / Apple / Meta Lea también: Privacidad de datos en peligro: ¿Debería el mundo tener cuidado con las superaplicaciones?

Source link

Cómo utilizar la gobernanza de datos para sistemas de IA/ML

por Javier Javier Rodriguez

el noviembre 1, 2023

en Computadoras

La gobernanza de datos juega un papel fundamental para garantizar que los datos estén disponibles, sean consistentes, utilizables, confiables y seguros. Hay muchos desafíos que enfrentar para mantener la gobernanza de datos, y la apuesta ha subido para sistemas como la inteligencia artificial y el aprendizaje automático. Los sistemas AI/ML funcionan de manera diferente a los sistemas tradicionales de registros fijos. El objetivo no es devolver un valor o un estado para una sola transacción. Más bien, un sistema de IA/ML examina petabytes de datos en busca de respuestas a consultas que pueden ser vastas y multifacéticas. Además, los datos pueden provenir de muchas fuentes internas y externas diferentes, cada una con su propia forma de recopilar, curar y almacenar datos, que pueden ajustarse o no a los estándares de gobernanza de su organización. Luego, es cuestión de asegurarse de que los sistemas de IA/ML estén capacitados con datos confiables para garantizar la precisión. Estas son solo algunas de las preocupaciones que enfrentan las empresas y sus auditores mientras se centran en la gobernanza de datos para AI/ML y buscan herramientas que puedan ayudarlos. Saltar a: ¿Por qué es necesaria la gobernanza de datos para los sistemas de IA/ML? Según el Índice global de adopción de IA de IBM 2022, la tasa de adopción global de IA es del 35% y es omnipresente en algunas industrias y países de todo el mundo. Esta rápida adopción de sistemas de IA y ML para impulsar la innovación y la toma de decisiones hace que la integridad y la gestión de los datos subyacentes sean primordiales. VER: Obtenga más información sobre la gobernanza de datos. En comparación con los sistemas informáticos tradicionales, los sistemas de IA y ML tienen más matices, lo que subraya la importancia de la gobernanza de datos. Hay dos razones principales por las que es necesario un marco de gobernanza de datos sólido para los sistemas AI/ML: Estructura dinámica: en comparación con los sistemas de datos tradicionales, los sistemas AI/ML son dinámicos: evolucionan constantemente y aprenden de datos estructurados y no estructurados. Volumen y variedad de datos: la eficacia de un sistema de IA/ML es directamente proporcional al volumen y la variedad de los conjuntos de datos con los que entrena y de los que aprende. Debido a estos factores, sin una gobernanza estricta, los sistemas de IA/ML pueden producir resultados inconsistentes, inexactos e incluso sesgados. ¿Cómo funciona la gobernanza de datos con los sistemas de IA/ML? Los sistemas AI/ML están diseñados para manejar grandes cantidades de datos de forma simultánea y asincrónica. Esto significa que se introducen múltiples subprocesos de datos en el procesador al mismo tiempo, lo que permite un procesamiento de datos más rápido y eficiente. Sin embargo, esto también introduce complejidades. El objetivo principal de un sistema de IA/ML es buscar en conjuntos de datos masivos para encontrar respuestas, que van desde predecir tendencias futuras basadas en datos históricos hasta identificar patrones en datos de comercio electrónico. Si los datos de una fuente están corruptos o sesgados, pueden influir en el resultado general, haciendo que los resultados no sean fiables. Por lo tanto, es de vital importancia incorporar una gobernanza de datos rigurosa en el proceso para garantizar que cada hilo de datos sea preciso, relevante y esté libre de sesgos. El papel de TI en la aceleración del procesamiento de datos Los departamentos de TI desempeñan un papel fundamental en el proceso de gobernanza de datos de IA/ML. Al preprocesar y eliminar datos irrelevantes o redundantes, pueden acelerar significativamente los tiempos de procesamiento de datos para los sistemas AI/ML. Esto garantiza que los modelos AI/ML se ejecuten de manera eficiente y funcionen con los datos más relevantes y de alta calidad. VER: Explore estas principales herramientas de preparación de datos. Además, los equipos de TI pueden implementar herramientas y protocolos para automatizar muchas tareas de gobernanza, como la validación de datos, garantizar la coherencia entre fuentes de datos y monitorear posibles violaciones de seguridad. Desafíos en la implementación de la gobernanza de datos para sistemas AI/ML La integración y gestión de datos para sistemas AI/ML plantean varios desafíos de gobernanza de datos que las organizaciones deben afrontar. Cobertura de big data de lectura obligada Integración de datos de varias fuentes Cuando las organizaciones recopilan datos de múltiples fuentes, cada una con sus propios estándares de gobernanza, garantizar la coherencia se convierte en un obstáculo importante. Esta diversidad puede dar lugar a discrepancias, redundancias e imprecisiones en los datos. Los datos deben armonizarse para proporcionar una visión integral que sea esencial para la eficacia. Integrar los datos en un formato unificado es un proceso complejo que implica limpieza, transformación y normalización. Para evitar modelos defectuosos, es fundamental garantizar que los vastos conjuntos de datos utilizados por los sistemas de IA/ML sean precisos y relevantes. Recomendaciones confiables Los datos de entrenamiento de algunos modelos de IA/ML son secretos, lo que dificulta que las organizaciones confíen y comprendan plenamente las recomendaciones proporcionadas por estos sistemas. Sin una idea de cómo se toman las decisiones, existe el riesgo de una mala interpretación o uso indebido. Por ejemplo, los modelos de IA/ML a veces reflejan o amplifican sesgos en los datos. Según un estudio de Obermeyer et al, un algoritmo que utilizó los costos de salud como indicador de las necesidades de salud, asignó a los pacientes negros, que estaban más enfermos que otros pacientes blancos, el mismo nivel de riesgo para la salud. Saber qué datos de entrenamiento se utilizan para el modelo y que se practica una gobernanza de datos rigurosa puede ayudar a identificar y rectificar estos sesgos, garantizando la equidad en los resultados del modelo. Mantener la calidad de los datos Dado que los sistemas de IA/ML dependen en gran medida de datos de alta calidad, es fundamental garantizar que los datos estén limpios, sean precisos y estén actualizados. La mala calidad de los datos puede dar lugar a predicciones y conocimientos erróneos del modelo. Por ejemplo, la mala calidad de los datos puede provocar sesgos en las predicciones. Un modelo de contratación discontinuo de Amazon es otro gran ejemplo en el que un ML formado con currículums de una década en 2014 desarrolló un sesgo contra las candidatas. La implementación de una gobernanza de datos para los sistemas de IA/ML garantiza que los datos utilizados sean siempre de la más alta calidad, lo que puede ayudar a eliminar cualquier sesgo o imprecisión. Seguridad y privacidad de los datos El manejo de grandes volúmenes de datos procesados requiere una vigilancia constante para proteger la información confidencial y cumplir con las regulaciones. Grandes volúmenes de datos conllevan un mayor riesgo de seguridad y cumplimiento que exige el cumplimiento de muchas leyes diferentes de privacidad y protección de datos que trascienden fronteras. VER: Explore estas herramientas de calidad de datos superiores. Las fallas en la seguridad de los datos pueden tener consecuencias nefastas, como acceso no autorizado, manipulación de datos y violaciones. También puede socavar la confianza en el sistema de IA y tener consecuencias legales que dañen la reputación de una empresa y provoquen pérdidas financieras por disminución de las ventas o multas regulatorias. Una política de gobernanza de datos garantiza de manera proactiva que la seguridad de los datos cumpla con las regulaciones de protección de datos, emplea métodos de encriptación y monitorea el acceso a los datos periódicamente a través de auditorías. Cómo utilizar la gobernanza de datos para sistemas AI/ML El futuro de la gobernanza de datos en AI/ML no se trata solo de administrar datos sino también garantizar que se aproveche de manera responsable y eficaz. A medida que evoluciona el panorama de la IA/ML, también lo hace la importancia de una gobernanza de datos sólida. Las organizaciones deben ser proactivas, adaptables y estar equipadas con las herramientas adecuadas para navegar en este terreno. Asegúrese de que los datos sean consistentes y precisos Al integrar datos de sistemas transaccionales internos y externos, los datos deben estar estandarizados, para que puedan comunicarse y combinarse con datos de otras fuentes. Las interfaces de programación de aplicaciones que están prediseñadas en muchos sistemas facilitan esto, de modo que pueden intercambiar datos con otros sistemas. Si no hay API disponibles, las empresas pueden utilizar herramientas ETL, que transfieren datos de un sistema a un formato que otro sistema puede leer. Al agregar datos no estructurados, como objetos fotográficos, de video y de sonido, existen herramientas de vinculación de objetos que pueden vincular y relacionar estos objetos entre sí. Un buen ejemplo de enlazador de objetos es un sistema de información geográfica, que combina fotografías, esquemas y otros tipos de datos para ofrecer un contexto geográfico completo para un entorno particular. Confirmar que los datos son utilizables A menudo pensamos que los datos utilizables son datos a los que los usuarios pueden acceder, pero es más que eso. Si los datos han perdido su valor porque están obsoletos, deben eliminarse. Dicho esto, los usuarios empresariales y de TI deben ponerse de acuerdo sobre cuándo se deben eliminar los datos. Esto vendrá en forma de políticas de retención de datos. PREMIUM: Benefíciate de esta política de retención de datos electrónicos. Hay otras ocasiones en las que se deben eliminar los datos de IA/ML. Esto sucede cuando se cambia un modelo de datos para IA y los datos ya no se ajustan al modelo. En una auditoría de gobernanza de IA/ML, los examinadores esperarán ver políticas y procedimientos escritos para ambos tipos de depuración de datos. También verificarán que las prácticas de eliminación de datos cumplan con los estándares de la industria. Para mantenerse al día con estos estándares y prácticas, las empresas deberían considerar invertir en herramientas y utilidades de eliminación de datos. Asegúrese de que los datos sean confiables. Las circunstancias cambian. Un sistema de IA/ML que alguna vez funcionó de manera bastante eficiente puede comenzar a perder efectividad. Esto se conoce como deriva del modelo. Esto se puede confirmar comparando periódicamente los resultados de AI/ML con el rendimiento pasado y con lo que está sucediendo en el mundo. Si la precisión del sistema AI/ML se aleja de los datos actuales, es esencial solucionarlo. PREMIUM: asegúrese de que su empresa esté equipada con una política de ética de IA. Existen herramientas de IA/ML que los científicos de datos utilizan para medir la desviación del modelo, pero la forma más directa para que los profesionales de negocios verifiquen la desviación es comparar el rendimiento del sistema de IA/ML con el rendimiento histórico. Para abordar los desafíos de implementar la gobernanza de datos en sistemas de IA/ML, las organizaciones pueden invertir en herramientas de gobernanza de datos. Estas son algunas de las principales herramientas: Collibra: una plataforma holística de gobierno de datos adecuada para la gestión y el gobierno integrales de datos. Informatica: Reconocida por la integración de datos, es ideal para integrar datos de múltiples fuentes. Alation: Automatiza el descubrimiento y la catalogación de datos mediante el aprendizaje automático. Erwin: proporciona capacidades de modelado de datos, lo que ayuda a las empresas a comprender su panorama de datos. OneTrust: enfatiza el cumplimiento de datos, ayudando a las empresas a cumplir con las regulaciones. SAP Master Data Governance: ofrece procesamiento y gobierno de datos sólidos para empresas. Para obtener un análisis más detallado de las herramientas de gobernanza de datos y cómo pueden beneficiar a su organización, lea nuestra revisión de las principales herramientas de gobernanza de datos de 2023.

Source link

Todo lo que necesitas saber sobre tecnología

Etiqueta: grandes datos

Ocho tendencias que los profesionales de datos australianos deberían considerar antes de 2024

Revelando los peligros ocultos de descuidar los datos digitales

Por qué las grandes empresas tecnológicas se están aventurando más en el sector financiero

Cómo utilizar la gobernanza de datos para sistemas de IA/ML