Todo lo que necesitas saber sobre tecnología

Etiqueta: computación ia

Los chips de silicio personalizados de AWS son una señal de lo que viene a la computación en la nube de APAC

El aumento de la informática con IA ha provocado retrasos en el suministro de chips con capacidad para IA, ya que la demanda ha superado a la oferta. Los gigantes mundiales Microsoft, Google y AWS están aumentando la producción de silicio personalizado para reducir la dependencia de los proveedores dominantes de GPU, NVIDIA y AMD. Como resultado, es posible que las empresas de APAC pronto se encuentren utilizando una gama cada vez mayor de tipos de chips en los centros de datos en la nube. Los chips que elijan dependerán de la potencia informática y la velocidad requeridas para las diferentes cargas de trabajo de aplicaciones, el costo y las relaciones con los proveedores de la nube. Los principales proveedores de nube están invirtiendo en chips de silicio personalizados. Las tareas informáticas intensivas, como entrenar un modelo de lenguaje grande de IA, requieren enormes cantidades de potencia informática. A medida que ha aumentado la demanda de informática con IA, los chips semiconductores súper avanzados de empresas como NVIDIA y AMD se han vuelto muy caros y difíciles de asegurar. Los proveedores dominantes de nube a hiperescala han respondido acelerando la producción de chips de silicio personalizados en 2023 y 2024. Los programas reducirán la dependencia de los proveedores dominantes, para que puedan ofrecer servicios informáticos de IA a clientes en todo el mundo y en APAC. Google Google presentó sus primeras CPU personalizadas basadas en ARM con el lanzamiento del procesador Axion durante su conferencia Cloud Next en abril de 2024. Sobre la base del trabajo de silicio personalizado durante la última década, el paso a la producción de sus propias CPU está diseñado para admitir una variedad de informática de propósito general, incluido el entrenamiento de IA basado en CPU. Para los clientes de la nube de Google en APAC, se espera que el chip mejore las capacidades de inteligencia artificial de Google dentro de su centro de datos y estará disponible para los clientes de Google Cloud más adelante en 2024. Microsoft Microsoft, de la misma manera, ha presentado su primer acelerador interno personalizado optimizado. para tareas de IA e IA generativa, a las que ha denominado Azure Maia 100 AI Accelerator. A esto se une su propia CPU basada en ARM, la Cobalt 100, ambas anunciadas formalmente en Microsoft Ignite en noviembre de 2023. El silicio personalizado para IA de la empresa ya se ha utilizado para tareas como ejecutar el modelo de lenguaje grande ChatGPT 3.5 de OpenAI. El gigante tecnológico mundial dijo que esperaba una implementación más amplia en los centros de datos en la nube de Azure para los clientes a partir de 2024. La inversión de AWS en chips de silicio personalizados se remonta a 2009. La empresa ha lanzado cuatro generaciones de procesadores de CPU Graviton, que ya se han implementado. en centros de datos en todo el mundo, incluso en APAC; Los procesadores fueron diseñados para aumentar el precio y el rendimiento de las cargas de trabajo en la nube. A ellos se han sumado dos generaciones de Inferentia para aprendizaje profundo e inferencia de IA, y dos generaciones de Trainium para entrenar modelos de IA con más de 100 mil millones de parámetros. Lo que está de moda en TechRepublic AWS habla sobre la elección de silicio para los clientes de la nube de APAC En una reciente Cumbre de AWS celebrada en Australia, Dave Brown, vicepresidente de AWS Compute & Networking Services, dijo a TechRepublic que la razón del proveedor de la nube para diseñar silicio personalizado era brindar a los clientes opciones y mejorar el “rendimiento de precios” de la computación disponible. “Ha sido muy importante ofrecer opciones”, dijo Brown. “Nuestros clientes pueden encontrar los procesadores y aceleradores que mejor se adapten a su carga de trabajo. Y al producir nuestro propio silicio personalizado, podemos ofrecerles más computación a un precio más bajo”, añadió. NVIDIA, AMD e Intel entre los proveedores de chips de AWS AWS tiene relaciones de larga data con los principales proveedores de chips semiconductores. Por ejemplo, la relación de AWS con NVIDIA, el actor ahora dominante en IA, se remonta a 13 años, mientras que Intel, que lanzó aceleradores Gaudí para IA, ha sido un proveedor de semiconductores desde los inicios del proveedor de la nube. AWS ha estado ofreciendo chips de AMD en centros de datos desde 2018. La opción de silicio personalizado está en demanda debido a la presión de costos. Brown dijo que la fiebre de optimización de costos que se ha apoderado de las organizaciones durante los últimos dos años a medida que la economía global se ha desacelerado ha hecho que los clientes se trasladen a AWS Graviton. en todas las regiones, incluida APAC. Dijo que los chips han sido ampliamente adoptados por el mercado (por más de 50.000 clientes en todo el mundo), incluidos los 100 principales clientes del hiperescalador. «Las instituciones más grandes se están trasladando a Graviton debido a los beneficios de rendimiento y al ahorro de costos», afirmó. VER: Las herramientas de optimización de costos de la nube no son suficientes para controlar el gasto en la nube. Empresas surcoreanas y australianas entre los usuarios La amplia implementación de silicio AWS personalizado está haciendo que los clientes de APAC utilicen estas opciones. Leonardo.Ai: Leonardo.Ai, la startup de generación de imágenes de hipercrecimiento con sede en Australia, ha utilizado chips Inferentia y Trainium en el entrenamiento y la inferencia de modelos generativos de IA. Brown dijo que habían visto una reducción del 60 % en los costos de inferencia y una mejora de la latencia del 55 %. Kakaopay Securities: La institución financiera surcoreana Kakaopay Securities ha estado «utilizando Graviton a lo grande», dijo Brown. Esto ha permitido al actor bancario lograr una reducción del 20% en los costos operativos y una mejora del 30% en el desempeño, afirmó Brown. Ventajas del silicio personalizado para los clientes empresariales de la nube Los clientes empresariales en APAC podrían beneficiarse de una gama cada vez mayor de opciones informáticas, ya sea que se mida por el rendimiento, el costo o la idoneidad para diferentes cargas de trabajo en la nube. Las opciones de silicio personalizadas también podrían ayudar a las organizaciones a alcanzar los objetivos de sostenibilidad. Resultados mejorados de rendimiento y latencia La competencia proporcionada por los proveedores de la nube, junto con los proveedores de chips, podría impulsar avances en el rendimiento de los chips, ya sea en la categoría de computación de alto rendimiento para el entrenamiento de modelos de IA o en la innovación para la inferencia, donde la latencia es un gran factor. consideración. Potencial para una mayor optimización de los costos de la nube La optimización de los costos de la nube ha sido un problema importante para las empresas, ya que la expansión de las cargas de trabajo en la nube ha llevado a los clientes a aumentar los costos. Más opciones de hardware brindan a los clientes más opciones para reducir los costos generales de la nube, ya que pueden elegir con mayor criterio la computación adecuada. Capacidad de hacer coincidir las cargas de trabajo de computación con las aplicaciones Una gama cada vez mayor de chips de silicio personalizados dentro de los servicios en la nube permitirá a las empresas adaptar mejor sus cargas de trabajo de aplicaciones a las características específicas del hardware subyacente, garantizando que puedan utilizar el silicio más apropiado para los casos de uso que persiguen. . Mejor sostenibilidad mediante menos energía Se prevé que la sostenibilidad se convierta en uno de los cinco factores principales para los clientes que contraten proveedores de nube para 2028. Los proveedores están respondiendo: por ejemplo, AWS dijo que las emisiones de carbono se pueden reducir drásticamente utilizando chips Graviton4, que son un 60 % más eficientes. El silicio personalizado ayudará a mejorar la sostenibilidad general de la nube.

El mercado de centros de datos de Asia y el Pacífico se enfrentará al nuevo y feliz mundo de la IA

Se espera que el mercado de centros de datos de Asia y el Pacífico crezca rápidamente durante el resto de esta década. Esto se deberá en parte al despliegue de la inteligencia artificial, que despegó en 2023, y dará lugar a mayores demandas de potencia informática, en una tendencia similar a la de otras regiones del mundo. Para satisfacer la demanda, los proveedores de centros de datos regionales deberán adaptarse a desafíos que incluyen la disponibilidad y ubicación de los centros de datos, los cambios en los regímenes regulatorios, consideraciones como el poder y la sostenibilidad, y si están diseñados para manejar el crecimiento de las cargas de trabajo de IA. Crecimiento esperado del mercado de centros de datos de Asia-Pacífico Se espera que el mercado de centros de datos de Asia-Pacífico crezca hasta alcanzar un valor de 53.580 millones de dólares (81.100 millones de dólares australianos) en 2028, según datos de Renub Research, con una tasa de crecimiento anual de capital esperada del 12%. un año entre 2023 y 2028 (Figura A). Figura A: Se espera que aumente el número de centros de datos en Asia-Pacífico. Imagen: Investigación y Mercados Con un inventario estimado de 14,27 mil megavatios en 2024, otro informe de MordorIntelligence predice que el mercado de centros de datos de la región se expandirá a 23,2 mil MW para 2029, o una CAGR del 10,21% en capacidad informática durante el período de pronóstico del informe. VER: El aumento de la potencia informática puede poner a los centros de datos australianos en riesgo de sufrir un corte de energía. Según Global Data Center Trends 2023 de CBRE, «el inventario de centros de datos está creciendo rápidamente en toda Asia-Pacífico, alcanzando una escala impresionante». Los mayores puntos calientes de centros de datos en la región de Asia y el Pacífico La ubicación líder de centros de datos por números es China, con un estimado de 449 centros de datos según los últimos datos disponibles de Cloudscene (Figura B). Le siguen Australia con 306, Japón con 219 y la India con 152. Figura B: China tiene la mayor cantidad de centros de datos en la región de Asia y el Pacífico. Imagen: Nikkei Asia Sin embargo, las principales ubicaciones de centros de datos preferidas por las empresas globales para la consolidación de sus operaciones de centros de datos regionales suelen ser Singapur, Australia y Hong Kong. Las recientes medidas de algunas jurisdicciones como China y Vietnam para endurecer las regulaciones sobre las exportaciones de datos por razones de seguridad nacional no harían más que reforzar esta tendencia entre las empresas globales. Singapur Singapur representa el 60% de los centros de datos del sudeste asiático. Después del levantamiento en 2023 de una moratoria sobre la nueva capacidad de los centros de datos, impulsada por las voraces demandas de energía del sector y los problemas de sostenibilidad, Singapur ha sido revelado recientemente como un comprador líder de chips NVIDIA mientras se posiciona para un futuro aumento en la computación con IA. . Australia Sydney ha visto lo que el informe de tendencias 2023 de CBRE llama una “’segunda ola’ de interés por parte de los proveedores globales de servicios en la nube”, que ha aumentado su capacidad en un 30%. Ahora tiene más de medio GW de capacidad de energía viva, lo que la sitúa junto a Tokio y Singapur como líderes regionales. Hong Kong Aunque tradicionalmente ha sido un competidor de Singapur, el mercado de Hong Kong puede volverse menos popular entre las empresas occidentales. Según CBRE, Hong Kong será visto como un lugar más riesgoso para los datos entre las crecientes preocupaciones geopolíticas tras la represión de China. Impulsores del crecimiento del mercado de centros de datos en la región de Asia y el Pacífico Un impulsor clave del crecimiento regional de Asia y el Pacífico y del uso de servicios de centros de datos es la digitalización y la transformación digital de las empresas regionales y globales. A medida que las organizaciones buscan hacer sus operaciones más eficientes a través de la digitalización y utilizar sus datos para impulsar el crecimiento de los servicios digitales y la innovación, la demanda de computación en la nube va en aumento. Más cobertura en Australia Sin embargo, hay una variedad de factores que impulsan el crecimiento de los centros de datos. El liderazgo de China en cifras puras de centros de datos, por ejemplo, se produce después de haber fomentado deliberadamente una tasa de crecimiento del 30% en el sector de “grandes datos” del país durante varios años, impulsado por su despliegue líder mundial de redes 5G. A esto le seguirá el lanzamiento comercial de 6G para 2030. El crecimiento en otros mercados y puntos de acceso de la región se debe a tendencias amplias, como una mayor demanda de servicios digitales entre los 1.200 millones de usuarios de Internet de la región y una expansión de Internet. de cosas. Las crecientes demandas incluyen juegos y streaming, mientras que las nuevas tecnologías incluyen realidad aumentada e inteligencia artificial. La informática con IA desempeñará un papel importante en el futuro La Corporación Internacional de Datos proyecta que el gasto en IA alcanzará los 78.400 millones de dólares para 2027 y el 80% de los CIO de la región aprovecharán los cambios organizacionales para aprovechar la IA, la automatización y el análisis para 2028. VER: AWS predice que la IA generativa seguirá siendo un foco de atención hasta 2024 para Australia. Se espera que el aumento de las aplicaciones impulsadas por la IA, que exigen una mayor capacidad informática en forma de unidades de procesamiento de gráficos, impulse una nueva fase de crecimiento de la industria de los centros de datos. Sin embargo, también generará más preguntas para los proveedores de centros de datos sobre dónde deberían ubicarse e impulsará nuevas opciones en lo que respecta al diseño técnico de los centros de datos. Por ejemplo, la investigación de EY-Parthenon sostiene que la IA generativa puede servir para cambiar el formato y la ubicación de la futura infraestructura de los centros de datos, alejándolas de las grandes ciudades hacia ciudades de segundo nivel y afueras de las ciudades, ya que requerirán acceso a más electricidad y agua. .

Source link

Funciona con WordPress & Tema de Anders Norén