El aumento de la informática con IA ha provocado retrasos en el suministro de chips con capacidad para IA, ya que la demanda ha superado a la oferta. Los gigantes mundiales Microsoft, Google y AWS están aumentando la producción de silicio personalizado para reducir la dependencia de los proveedores dominantes de GPU, NVIDIA y AMD. Como resultado, es posible que las empresas de APAC pronto se encuentren utilizando una gama cada vez mayor de tipos de chips en los centros de datos en la nube. Los chips que elijan dependerán de la potencia informática y la velocidad requeridas para las diferentes cargas de trabajo de aplicaciones, el costo y las relaciones con los proveedores de la nube. Los principales proveedores de nube están invirtiendo en chips de silicio personalizados. Las tareas informáticas intensivas, como entrenar un modelo de lenguaje grande de IA, requieren enormes cantidades de potencia informática. A medida que ha aumentado la demanda de informática con IA, los chips semiconductores súper avanzados de empresas como NVIDIA y AMD se han vuelto muy caros y difíciles de asegurar. Los proveedores dominantes de nube a hiperescala han respondido acelerando la producción de chips de silicio personalizados en 2023 y 2024. Los programas reducirán la dependencia de los proveedores dominantes, para que puedan ofrecer servicios informáticos de IA a clientes en todo el mundo y en APAC. Google Google presentó sus primeras CPU personalizadas basadas en ARM con el lanzamiento del procesador Axion durante su conferencia Cloud Next en abril de 2024. Sobre la base del trabajo de silicio personalizado durante la última década, el paso a la producción de sus propias CPU está diseñado para admitir una variedad de informática de propósito general, incluido el entrenamiento de IA basado en CPU. Para los clientes de la nube de Google en APAC, se espera que el chip mejore las capacidades de inteligencia artificial de Google dentro de su centro de datos y estará disponible para los clientes de Google Cloud más adelante en 2024. Microsoft Microsoft, de la misma manera, ha presentado su primer acelerador interno personalizado optimizado. para tareas de IA e IA generativa, a las que ha denominado Azure Maia 100 AI Accelerator. A esto se une su propia CPU basada en ARM, la Cobalt 100, ambas anunciadas formalmente en Microsoft Ignite en noviembre de 2023. El silicio personalizado para IA de la empresa ya se ha utilizado para tareas como ejecutar el modelo de lenguaje grande ChatGPT 3.5 de OpenAI. El gigante tecnológico mundial dijo que esperaba una implementación más amplia en los centros de datos en la nube de Azure para los clientes a partir de 2024. La inversión de AWS en chips de silicio personalizados se remonta a 2009. La empresa ha lanzado cuatro generaciones de procesadores de CPU Graviton, que ya se han implementado. en centros de datos en todo el mundo, incluso en APAC; Los procesadores fueron diseñados para aumentar el precio y el rendimiento de las cargas de trabajo en la nube. A ellos se han sumado dos generaciones de Inferentia para aprendizaje profundo e inferencia de IA, y dos generaciones de Trainium para entrenar modelos de IA con más de 100 mil millones de parámetros. Lo que está de moda en TechRepublic AWS habla sobre la elección de silicio para los clientes de la nube de APAC En una reciente Cumbre de AWS celebrada en Australia, Dave Brown, vicepresidente de AWS Compute & Networking Services, dijo a TechRepublic que la razón del proveedor de la nube para diseñar silicio personalizado era brindar a los clientes opciones y mejorar el “rendimiento de precios” de la computación disponible. “Ha sido muy importante ofrecer opciones”, dijo Brown. “Nuestros clientes pueden encontrar los procesadores y aceleradores que mejor se adapten a su carga de trabajo. Y al producir nuestro propio silicio personalizado, podemos ofrecerles más computación a un precio más bajo”, añadió. NVIDIA, AMD e Intel entre los proveedores de chips de AWS AWS tiene relaciones de larga data con los principales proveedores de chips semiconductores. Por ejemplo, la relación de AWS con NVIDIA, el actor ahora dominante en IA, se remonta a 13 años, mientras que Intel, que lanzó aceleradores Gaudí para IA, ha sido un proveedor de semiconductores desde los inicios del proveedor de la nube. AWS ha estado ofreciendo chips de AMD en centros de datos desde 2018. La opción de silicio personalizado está en demanda debido a la presión de costos. Brown dijo que la fiebre de optimización de costos que se ha apoderado de las organizaciones durante los últimos dos años a medida que la economía global se ha desacelerado ha hecho que los clientes se trasladen a AWS Graviton. en todas las regiones, incluida APAC. Dijo que los chips han sido ampliamente adoptados por el mercado (por más de 50.000 clientes en todo el mundo), incluidos los 100 principales clientes del hiperescalador. «Las instituciones más grandes se están trasladando a Graviton debido a los beneficios de rendimiento y al ahorro de costos», afirmó. VER: Las herramientas de optimización de costos de la nube no son suficientes para controlar el gasto en la nube. Empresas surcoreanas y australianas entre los usuarios La amplia implementación de silicio AWS personalizado está haciendo que los clientes de APAC utilicen estas opciones. Leonardo.Ai: Leonardo.Ai, la startup de generación de imágenes de hipercrecimiento con sede en Australia, ha utilizado chips Inferentia y Trainium en el entrenamiento y la inferencia de modelos generativos de IA. Brown dijo que habían visto una reducción del 60 % en los costos de inferencia y una mejora de la latencia del 55 %. Kakaopay Securities: La institución financiera surcoreana Kakaopay Securities ha estado «utilizando Graviton a lo grande», dijo Brown. Esto ha permitido al actor bancario lograr una reducción del 20% en los costos operativos y una mejora del 30% en el desempeño, afirmó Brown. Ventajas del silicio personalizado para los clientes empresariales de la nube Los clientes empresariales en APAC podrían beneficiarse de una gama cada vez mayor de opciones informáticas, ya sea que se mida por el rendimiento, el costo o la idoneidad para diferentes cargas de trabajo en la nube. Las opciones de silicio personalizadas también podrían ayudar a las organizaciones a alcanzar los objetivos de sostenibilidad. Resultados mejorados de rendimiento y latencia La competencia proporcionada por los proveedores de la nube, junto con los proveedores de chips, podría impulsar avances en el rendimiento de los chips, ya sea en la categoría de computación de alto rendimiento para el entrenamiento de modelos de IA o en la innovación para la inferencia, donde la latencia es un gran factor. consideración. Potencial para una mayor optimización de los costos de la nube La optimización de los costos de la nube ha sido un problema importante para las empresas, ya que la expansión de las cargas de trabajo en la nube ha llevado a los clientes a aumentar los costos. Más opciones de hardware brindan a los clientes más opciones para reducir los costos generales de la nube, ya que pueden elegir con mayor criterio la computación adecuada. Capacidad de hacer coincidir las cargas de trabajo de computación con las aplicaciones Una gama cada vez mayor de chips de silicio personalizados dentro de los servicios en la nube permitirá a las empresas adaptar mejor sus cargas de trabajo de aplicaciones a las características específicas del hardware subyacente, garantizando que puedan utilizar el silicio más apropiado para los casos de uso que persiguen. . Mejor sostenibilidad mediante menos energía Se prevé que la sostenibilidad se convierta en uno de los cinco factores principales para los clientes que contraten proveedores de nube para 2028. Los proveedores están respondiendo: por ejemplo, AWS dijo que las emisiones de carbono se pueden reducir drásticamente utilizando chips Graviton4, que son un 60 % más eficientes. El silicio personalizado ayudará a mejorar la sostenibilidad general de la nube.