La nube es la forma más sencilla de crear sistemas de IA generativa; es por eso que los ingresos de la nube se están disparando. Sin embargo, muchos de estos sistemas están sobrediseñados, lo que genera complejidad y costos innecesarios. La sobreingeniería es un tema familiar. Hemos estado pensando y construyendo demasiado sistemas, dispositivos, máquinas, vehículos, etc., durante muchos años. ¿Por qué la nube sería diferente? La sobreingeniería consiste en diseñar un producto o una solución innecesariamente compleja incorporando características o funcionalidades que no añaden ningún valor sustancial. Esta práctica conduce al uso ineficiente de tiempo, dinero y materiales y puede conducir a una menor productividad, mayores costos y una menor resiliencia del sistema. La ingeniería excesiva de cualquier sistema, ya sea IA o nube, se logra mediante un fácil acceso a los recursos y sin limitaciones en su uso. recursos. Es fácil encontrar y asignar servicios en la nube, por lo que resulta tentador para un diseñador o ingeniero de IA agregar cosas que puedan considerarse «agradables de tener» más que «necesarias». Tomar un montón de estas decisiones conduce a muchas más bases de datos, capas de middleware, sistemas de seguridad y sistemas de gobernanza de los necesarios. La facilidad con la que las empresas pueden acceder y suministrar servicios en la nube se ha convertido tanto en una bendición como en una pesadilla. Las herramientas avanzadas basadas en la nube simplifican la implementación de sistemas sofisticados de IA, pero también abren la puerta a una ingeniería excesiva. Si los ingenieros tuvieran que pasar por un proceso de adquisición, incluida la compra de hardware especializado para servicios informáticos o de almacenamiento específicos, es probable que se mostraran más comedidos que cuando solo se necesita un simple clic del mouse. Los peligros de un aprovisionamiento sencillo Las plataformas de nube pública cuentan con una impresionante gama de servicios diseñados para satisfacer todas las necesidades posibles de IA generativa. Desde almacenamiento y procesamiento de datos hasta modelos y análisis de aprendizaje automático, estas plataformas ofrecen una atractiva combinación de capacidades. De hecho, mire la lista recomendada de unas pocas docenas de servicios que los proveedores de la nube consideran “necesarios” para diseñar, construir e implementar un sistema de IA generativa. Por supuesto, tenga en cuenta que la empresa que crea la lista también vende los servicios. Las GPU son el mejor ejemplo de esto. A menudo veo servicios informáticos configurados por GPU agregados a una arquitectura de IA generativa. Sin embargo, las GPU no son necesarias para cálculos del tipo “de la servilleta”, y los sistemas impulsados ​​por CPU funcionan bien por una pequeña parte del costo. Por alguna razón, el crecimiento explosivo de las empresas que construyen y venden GPU hace que muchas personas crean que las GPU son un requisito, y no lo son. Las GPU son necesarias cuando se indican procesadores especializados para un problema específico. Este tipo de sobreingeniería cuesta a las empresas más que otros errores de sobreingeniería. Desafortunadamente, recomendar que su empresa se abstenga de utilizar procesadores de gama alta y más caros a menudo le quitará la invitación a reuniones de arquitectura posteriores. Mantener un presupuesto Los costos crecientes están directamente relacionados con la complejidad de las capas y los servicios de nube adicionales, que a menudo se incluyen fuera de un impulso de rigor o de preparación para el futuro. Cuando recomiendo que una empresa utilice menos recursos o recursos menos costosos, a menudo me encuentro con: «Necesitamos tener en cuenta el crecimiento futuro», pero esto a menudo se puede manejar ajustando la arquitectura a medida que evoluciona. Nunca debería significar tirar dinero a los problemas desde el principio. Esta tendencia a incluir demasiados servicios también amplifica la deuda técnica. Mantener y actualizar sistemas complejos se vuelve cada vez más difícil y costoso. Si los datos están fragmentados y aislados en varios servicios en la nube, estos problemas pueden exacerbarse aún más, haciendo que la integración y optimización de los datos sea una tarea desalentadora. Las empresas a menudo se encuentran atrapadas en un ciclo en el que sus soluciones de IA generativa no sólo están sobrediseñadas sino que también necesitan ser más optimizadas, lo que lleva a una disminución del retorno de la inversión. Estrategias para mitigar la sobreingenieríaSe necesita un enfoque disciplinado para evitar estos escollos. Aquí hay algunas estrategias que utilizo: Priorizar las necesidades básicas. Concéntrese en las funcionalidades esenciales necesarias para lograr sus objetivos principales. Resiste la tentación de inflarlos. Planificar y evaluar minuciosamente. Invierta tiempo en la fase de planificación para determinar qué servicios son esenciales. Comience poco a poco y escale gradualmente. Comience con un producto mínimo viable (MVP) centrándose en las funcionalidades principales. Reúna un excelente equipo de arquitectura de IA generativa. Elija ingenieros de IA, científicos de datos, especialistas en seguridad de IA, etc., que compartan el enfoque para aprovechar lo que se necesita pero sin exagerar. Puede enviar los mismos problemas a dos equipos diferentes de arquitectura de IA generativa y obtener planes que difieren en costo por $10 millones. ¿Cuál se equivocó? Generalmente, el equipo que busca gastar más. El poder y la flexibilidad de las plataformas de nube pública son la razón por la que aprovechamos la nube en primer lugar, pero se justifica tener precaución para evitar la trampa de diseñar excesivamente los sistemas de IA generativa. Una planificación cuidadosa, una selección juiciosa de servicios y una optimización continua son clave para crear soluciones de IA rentables. Al adherirse a estos principios, las empresas pueden aprovechar todo el potencial de la IA generativa sin caer presa de las complejidades y costos de un sistema sobrediseñado. Copyright © 2024 IDG Communications, Inc.