S. Soh Resumen de viñetas: • Si bien la IA generativa (GenAI) tiene intereses generalizados y están surgiendo más casos de uso, las empresas deben asegurarse de que la infraestructura no se convierta en un cuello de botella. • GenAI necesitará nuevos enfoques, desde los procesadores hasta los centros de datos y los sistemas de refrigeración, para garantizar que el desarrollo pueda ser eficiente y sostenible. La IA sigue siendo un tema candente de cara a 2024. La tecnología ha evolucionado desde la IA predictiva hasta la GenAI y la GenAI multimodal, en un período de tiempo relativamente corto. Esta tecnología está creando infinitas posibilidades y han comenzado a surgir varios casos de uso. Por ejemplo, GenAI/AI se ha aplicado para el diagnóstico de enfermedades, el desarrollo de aplicaciones (desarrollo de código asistido), la creación de contenidos de marketing y la previsión de la demanda para empresas minoristas. En este contexto, no sorprende que muchos pronosticadores esperen un rápido crecimiento de los ingresos relacionados con GenAI. Sin embargo, en medio del entusiasmo, ha habido preocupaciones, en particular la necesidad de abordar cuestiones éticas y una IA responsable. Un área que los proveedores de tecnología de IA no han destacado es la infraestructura, incluidas las instalaciones físicas necesarias para alojar el hardware para las cargas de trabajo de IA. La potencia de procesamiento necesaria para las cargas de trabajo GenAI ha impulsado a la industria de los semiconductores a desarrollar soluciones optimizadas para IA más rápidas y eficientes. Entrenar un modelo de lenguaje grande (LLM), por ejemplo, con ChatCPT puede llevar mucho tiempo con varias GPU (años con una sola GPU). La industria está trabajando en soluciones como la arquitectura TPU de Google y Infiniband de Nvidia para velocidades de red más rápidas, interconectando servidores GPU. Pero además de lograr la velocidad de procesamiento, el hardware debe ser compacto y consumir menos energía. La mayor parte del desarrollo de LLM y la capacitación de modelos de IA se realizan en centros de datos, y esto está impulsando la demanda de espacio en los centros de datos, así como la forma en que se diseña. Sin embargo, la construcción de nuevas instalaciones en centros de datos clave será más difícil debido a los requisitos de energía. La creciente demanda de energía será una preocupación importante a medida que los países tengan compromisos para cumplir objetivos de emisiones de carbono. Por ejemplo, Singapur tuvo una moratoria de cuatro años que comenzó en 2019 para detener el desarrollo de nuevos centros de datos debido al alto consumo de energía, lo que impedirá los esfuerzos de Singapur por alcanzar sus objetivos de sostenibilidad. Si bien el país levantó la moratoria a mediados de 2023, ha sido más selectivo a la hora de aprobar nuevos centros de datos basándose en criterios como la eficiencia energética, la computación AI/ML y las capacidades de HPC, la expansión de la conectividad internacional y los compromisos económicos con Singapur. En Londres (Inglaterra), también se informó que en algunos distritos al oeste de la ciudad, la falta de suficiente ‘capacidad eléctrica’ –debido a la demanda de los centros de datos– ha impactado las aprobaciones para nuevos desarrollos de viviendas. Las consideraciones sobre el suministro de energía y la sostenibilidad también están impulsando a la industria de los centros de datos a construir instalaciones más sostenibles mediante la autogeneración utilizando pilas de combustible, energías renovables y baterías. Sin embargo, esto también requerirá una nueva estrategia de gestión de energía para cambiar de diferentes fuentes de energía, así como para hacer frente al aumento de la demanda de energía cuando se ejecutan cargas de trabajo GenAI a escala. Los centros de datos repletos de servidores de alta densidad también requerirán nuevos sistemas para eliminar el calor. Existen limitaciones con los sistemas existentes que se basan principalmente en refrigeración por aire. Según Vertiv, las instalaciones heredadas no están equipadas para soportar la implementación generalizada de la informática de alta densidad necesaria para la IA, y muchas carecen de la infraestructura necesaria para la refrigeración líquida. Las empresas necesitarán modernizar sus centros de datos, lo que requiere una inversión adicional. Sin embargo, esta también es una oportunidad para que las empresas sean más sostenibles adoptando un sistema de refrigeración más eficiente. La Agencia Internacional de Energía (AIE) estima que los centros de datos consumen entre el 1% y el 1,3% de la demanda final de electricidad mundial, y se espera que esto aumente con el tiempo debido a la aceleración de la adopción de la nube y el desarrollo de la IA. Si bien las empresas y los formuladores de políticas están interesados ​​en aprovechar el poder de GenAI, necesitan revisar los requisitos de los centros de datos para allanar el camino para que la innovación se produzca a velocidad y escala.

Source link