Únase a nosotros para regresar a Nueva York el 5 de junio para colaborar con líderes ejecutivos en la exploración de métodos integrales para auditar modelos de IA con respecto al sesgo, el desempeño y el cumplimiento ético en diversas organizaciones. Descubre aquí cómo puedes asistir. En los últimos 10 años, el mundo de las infraestructuras y las herramientas de datos se ha disparado. Como fundador de una empresa de infraestructura de datos en la nube en los primeros días de la computación en la nube en 2009, además de fundador de una comunidad de encuentro para la naciente comunidad de ingeniería de datos en 2013, encontré un lugar en el centro de esta comunidad incluso antes de que «ingeniero de datos ”era un título de trabajo. Es desde este asiento que puedo reflexionar sobre las lecciones aprendidas de nuestro pasado reciente con herramientas de datos y cómo deberían guiar el desarrollo de una nueva era de IA. En antropología tecnológica, 2013 fue un período entre la era del “big data” y la era de la “pila de datos moderna”. En la era del big data, como sugiere el nombre, más datos era mejor. Se suponía que los datos contenían los secretos analíticos para desbloquear nuevo valor en un negocio. Como consultor estratégico para una gran empresa de Internet, una vez me encargaron la tarea de crear un plan para analizar los datos agotados de miles de millones de consultas de DNS por día y encontrar una idea mágica oculta en esto que podría convertirse en una nueva línea de negocio para la empresa. valorado en 100 millones de dólares. ¿Encontramos esta idea? No en el tiempo relativamente corto (meses) que tuvimos que dedicar al proyecto. Resulta que almacenar big data es relativamente fácil, pero generar grandes insights requiere mucho trabajo. Pero no todos se dieron cuenta de esto. Lo único que sabían era que no se podía participar en el juego de las ideas si el centro de datos no estaba en orden. Entonces, empresas de todas las formas y tamaños se apresuraron a reforzar sus pilas de datos, lo que provocó una explosión en la cantidad de herramientas de datos ofrecidas por proveedores que propusieron que su solución era la pieza faltante de una pila de datos verdaderamente holística que podría producir el tipo de magia. información que una empresa estaba buscando. Evento VB The AI ​​Impact Tour: The AI ​​Audit Únase a nosotros mientras regresamos a Nueva York el 5 de junio para interactuar con los principales líderes ejecutivos y profundizar en estrategias para auditar modelos de IA para garantizar la equidad, el rendimiento óptimo y el cumplimiento ético en diversas organizaciones. Asegure su asistencia a este evento exclusivo solo por invitación. Solicite una invitación Tenga en cuenta que no uso el término «explosión» a la ligera: en el reciente panorama MAD (aprendizaje automático, inteligencia artificial y datos) de 2024, el autor Matt Turck señala que la cantidad de empresas que venden herramientas y productos de infraestructura de datos en 2012 (el año en que comenzó a construir su mapa de mercado) había 139 empresas. En la edición de este año, hay 2011, ¡un aumento de 14,5 veces! Sucedieron un par de cosas que ayudaron a dar forma al panorama de datos actual. Las empresas comenzaron a trasladar más cargas de trabajo locales a la nube. Los proveedores de pilas de datos modernos ofrecían servicios gestionados como ofertas de nube componibles que podían ofrecer a los clientes más confiabilidad, mejor flexibilidad de sus sistemas y la conveniencia del escalamiento bajo demanda. Pero a medida que las empresas atravesaron el período de la política de tasa de interés cero (ZIRP) y ampliaron su número de proveedores de herramientas de datos, comenzaron a surgir grietas en la fachada del MDS. Los problemas de complejidad del sistema (provocados por muchas herramientas diferentes), desafíos de integración (numerosas soluciones puntuales diferentes que necesitan comunicarse entre sí) y servicios en la nube subutilizados dejaron a algunos preguntándose si se lograría la promesa de la panacea MDS. Muchas empresas de Fortune 500 habían invertido mucho en infraestructura de datos sin una estrategia clara sobre cómo generar valor a partir de esos datos (¡recuerde, encontrar información es difícil!), lo que generó costos inflados sin valor proporcional. Pero estaba de moda recopilar varias herramientas; a menudo se escuchaban informes de múltiples herramientas superpuestas utilizadas por diferentes equipos en la misma empresa. En materia de inteligencia empresarial (BI), por ejemplo, muchas empresas tendrían instalado Tableau, Looker y quizás incluso una tercera herramienta que esencialmente cumplía el mismo propósito comercial y al mismo tiempo acumulaba facturas tres veces más rápido. Por supuesto, este tipo de exceso terminaría en última instancia con el estallido de la burbuja ZIRP. Sin embargo, el panorama MAD no se ha reducido sino que continúa creciendo. ¿Por qué? ¿Qué es la nueva ‘pila de IA’? Obviamente, muchas de las empresas de herramientas de datos estaban tan bien capitalizadas durante ZIRP que podrán continuar operando a pesar de los difíciles presupuestos empresariales y la disminución de la demanda del mercado por sus servicios. Una razón es que todavía no hay mucha rotación, producida por el fracaso o la consolidación de una startup, que se pueda ver en la cantidad de logotipos. Pero la razón principal es el surgimiento de la próxima ola de herramientas de datos impulsada por el auge del interés en la IA. Lo que es algo único es que esta nueva ola de IA cobró fuerza antes de que se completara cualquier sacudida real del mercado o consolidación de la última ola (MDS), lo que produjo aún más empresas de herramientas de datos nuevas. Sin embargo, si uno cree, como yo, que la “pila de IA” es un paradigma fundamentalmente nuevo, entonces esto es algo comprensible. En un nivel alto, la IA está impulsada por cantidades masivas de datos no estructurados (piense en montones de texto, imágenes y videos del tamaño de Internet), mientras que el MDS se creó para cantidades más pequeñas de datos estructurados (piense en datos tabulares en hojas de cálculo o bases de datos). Además, la naturaleza denominada no determinista o “generativa” de los modelos de IA es completamente diferente del enfoque determinista diseñado en los modelos de aprendizaje automático (ML) más tradicionales. Estos modelos más antiguos a menudo se diseñaron para predecir resultados basándose en un conjunto limitado de datos de entrenamiento. Pero los nuevos modelos de IA generativa están diseñados para sintetizar resúmenes o generar conocimientos, lo que significa que su resultado puede ser diferente cada vez que se ejecuta el modelo, aunque las entradas no hayan cambiado. Para probar esto, observe la diferencia que obtendrá con ChatGPT al hacerle una pregunta idéntica dos o más veces. Dado que la arquitectura y el resultado de los modelos de IA son fundamentalmente diferentes, los desarrolladores deben adoptar nuevos paradigmas para probar y evaluar dichas respuestas de acuerdo con la intención original del usuario o la aplicación. Por no hablar de garantizar la seguridad ética, la gobernanza y el seguimiento de los sistemas de IA. Algunas de las áreas adicionales en torno a la nueva pila de IA que merecen una mayor investigación son la orquestación de agentes (modelos de IA que se comunican con otros modelos); oportunidades en torno a modelos más pequeños y diseñados específicamente para casos de uso verticales que generan disrupción en industrias tradicionales que han sido demasiado costosas y complejas para automatizar; y herramientas de flujo de trabajo que permiten la recopilación y conservación de conjuntos de datos de ajuste que las empresas pueden utilizar para «insertar» sus propios datos privados para crear modelos personalizados. Todas estas oportunidades y más se abordarán como parte de la nueva pila de IA a medida que surjan nuevas plataformas de desarrollo. Cientos de nuevas empresas ya están trabajando en estos desafíos creando (lo has adivinado) un nuevo lote de herramientas de última generación. ¿Cómo podemos construir mejor y más inteligentemente esta vez? A medida que entramos en esta nueva «era de la IA», creo que es importante que reconozcamos de dónde venimos; después de todo, los datos son la madre de la IA y la gran cantidad de herramientas de datos en la historia reciente proporcionaron, como mínimo, una educación sólida para que las empresas en el camino firme de tratar sus datos como un ciudadano de primera. Pero me quedo preguntándome: «¿Cómo podemos evitar los excesos de herramientas del pasado mientras continuamos construyendo hacia nuestro futuro de IA?» Una sugerencia es que las empresas luchen para desarrollar claridad en torno al valor específico que esperan que un dato particular o una herramienta de IA aporte a su negocio. La inversión excesiva en tendencias tecnológicas por razones equivocadas nunca es una buena estrategia de negocios, y si bien la IA actualmente está absorbiendo todo el aire de la habitación (y el dinero de los presupuestos corporativos de TI y software), es importante centrarse en implementar herramientas que puedan demostrar valor claro y retorno de la inversión real. Otro llamado sería a los fundadores para que dejen de crear opciones de herramientas de inteligencia artificial y datos tipo “yo también”. Si ya existen varias herramientas en el mercado en las que está considerando ingresar, tómese el tiempo para preguntarse: «¿Somos el mejor equipo fundador con una experiencia única y diferenciada que genera una visión clave en la forma en que atacamos este problema?». ?” Si la respuesta no es un rotundo sí, no siga creando esa herramienta, sin importar cuánto dinero los capitalistas de riesgo estén dispuestos a gastarle. Por último, se recomendaría a los inversores que piensen detenidamente dónde probablemente se acumulará valor en las distintas capas de la pila de datos y herramientas de inteligencia artificial antes de invertir en empresas en etapa inicial. Con demasiada frecuencia, veo capitalistas de riesgo con un único criterio de casilla de verificación: si el fundador de la creación de herramientas tiene cierto pedigrí o proviene de una empresa de tecnología en particular, les escribe un cheque de inmediato. Esto es perezoso y además produce demasiadas herramientas de datos indiferenciados que abarrotan el mercado. No es de extrañar que necesitemos una lupa para leer MAD 2024. Un orador en una conferencia reciente sugirió que las empresas se pregunten «¿cuál es el costo para su negocio si una sola fila de sus datos es inexacta?» Es decir, ¿puede establecer un método claro para articular un marco sobre cómo cuantificar el valor de los datos, o una herramienta de datos, en su negocio? Si no podemos llegar tan lejos, ninguna cantidad de presupuesto gastado o capital de riesgo invertido en datos y herramientas de inteligencia artificial resolverá nuestra confusión. Pete Soderling es fundador y socio general de Zero Prime Ventures. DataDecisionMakers ¡Bienvenido a la comunidad VentureBeat! DataDecisionMakers es el lugar donde los expertos, incluidos los técnicos que trabajan con datos, pueden compartir conocimientos e innovación relacionados con los datos. Si desea leer sobre ideas de vanguardia e información actualizada, mejores prácticas y el futuro de los datos y la tecnología de datos, únase a nosotros en DataDecisionMakers. ¡Incluso podrías considerar contribuir con un artículo propio! Leer más de DataDecisionMakers