Todo lo que necesitas saber sobre tecnología

Etiqueta: inferencia

Los chips de silicio personalizados de AWS son una señal de lo que viene a la computación en la nube de APAC

El aumento de la informática con IA ha provocado retrasos en el suministro de chips con capacidad para IA, ya que la demanda ha superado a la oferta. Los gigantes mundiales Microsoft, Google y AWS están aumentando la producción de silicio personalizado para reducir la dependencia de los proveedores dominantes de GPU, NVIDIA y AMD. Como resultado, es posible que las empresas de APAC pronto se encuentren utilizando una gama cada vez mayor de tipos de chips en los centros de datos en la nube. Los chips que elijan dependerán de la potencia informática y la velocidad requeridas para las diferentes cargas de trabajo de aplicaciones, el costo y las relaciones con los proveedores de la nube. Los principales proveedores de nube están invirtiendo en chips de silicio personalizados. Las tareas informáticas intensivas, como entrenar un modelo de lenguaje grande de IA, requieren enormes cantidades de potencia informática. A medida que ha aumentado la demanda de informática con IA, los chips semiconductores súper avanzados de empresas como NVIDIA y AMD se han vuelto muy caros y difíciles de asegurar. Los proveedores dominantes de nube a hiperescala han respondido acelerando la producción de chips de silicio personalizados en 2023 y 2024. Los programas reducirán la dependencia de los proveedores dominantes, para que puedan ofrecer servicios informáticos de IA a clientes en todo el mundo y en APAC. Google Google presentó sus primeras CPU personalizadas basadas en ARM con el lanzamiento del procesador Axion durante su conferencia Cloud Next en abril de 2024. Sobre la base del trabajo de silicio personalizado durante la última década, el paso a la producción de sus propias CPU está diseñado para admitir una variedad de informática de propósito general, incluido el entrenamiento de IA basado en CPU. Para los clientes de la nube de Google en APAC, se espera que el chip mejore las capacidades de inteligencia artificial de Google dentro de su centro de datos y estará disponible para los clientes de Google Cloud más adelante en 2024. Microsoft Microsoft, de la misma manera, ha presentado su primer acelerador interno personalizado optimizado. para tareas de IA e IA generativa, a las que ha denominado Azure Maia 100 AI Accelerator. A esto se une su propia CPU basada en ARM, la Cobalt 100, ambas anunciadas formalmente en Microsoft Ignite en noviembre de 2023. El silicio personalizado para IA de la empresa ya se ha utilizado para tareas como ejecutar el modelo de lenguaje grande ChatGPT 3.5 de OpenAI. El gigante tecnológico mundial dijo que esperaba una implementación más amplia en los centros de datos en la nube de Azure para los clientes a partir de 2024. La inversión de AWS en chips de silicio personalizados se remonta a 2009. La empresa ha lanzado cuatro generaciones de procesadores de CPU Graviton, que ya se han implementado. en centros de datos en todo el mundo, incluso en APAC; Los procesadores fueron diseñados para aumentar el precio y el rendimiento de las cargas de trabajo en la nube. A ellos se han sumado dos generaciones de Inferentia para aprendizaje profundo e inferencia de IA, y dos generaciones de Trainium para entrenar modelos de IA con más de 100 mil millones de parámetros. Lo que está de moda en TechRepublic AWS habla sobre la elección de silicio para los clientes de la nube de APAC En una reciente Cumbre de AWS celebrada en Australia, Dave Brown, vicepresidente de AWS Compute & Networking Services, dijo a TechRepublic que la razón del proveedor de la nube para diseñar silicio personalizado era brindar a los clientes opciones y mejorar el “rendimiento de precios” de la computación disponible. “Ha sido muy importante ofrecer opciones”, dijo Brown. “Nuestros clientes pueden encontrar los procesadores y aceleradores que mejor se adapten a su carga de trabajo. Y al producir nuestro propio silicio personalizado, podemos ofrecerles más computación a un precio más bajo”, añadió. NVIDIA, AMD e Intel entre los proveedores de chips de AWS AWS tiene relaciones de larga data con los principales proveedores de chips semiconductores. Por ejemplo, la relación de AWS con NVIDIA, el actor ahora dominante en IA, se remonta a 13 años, mientras que Intel, que lanzó aceleradores Gaudí para IA, ha sido un proveedor de semiconductores desde los inicios del proveedor de la nube. AWS ha estado ofreciendo chips de AMD en centros de datos desde 2018. La opción de silicio personalizado está en demanda debido a la presión de costos. Brown dijo que la fiebre de optimización de costos que se ha apoderado de las organizaciones durante los últimos dos años a medida que la economía global se ha desacelerado ha hecho que los clientes se trasladen a AWS Graviton. en todas las regiones, incluida APAC. Dijo que los chips han sido ampliamente adoptados por el mercado (por más de 50.000 clientes en todo el mundo), incluidos los 100 principales clientes del hiperescalador. «Las instituciones más grandes se están trasladando a Graviton debido a los beneficios de rendimiento y al ahorro de costos», afirmó. VER: Las herramientas de optimización de costos de la nube no son suficientes para controlar el gasto en la nube. Empresas surcoreanas y australianas entre los usuarios La amplia implementación de silicio AWS personalizado está haciendo que los clientes de APAC utilicen estas opciones. Leonardo.Ai: Leonardo.Ai, la startup de generación de imágenes de hipercrecimiento con sede en Australia, ha utilizado chips Inferentia y Trainium en el entrenamiento y la inferencia de modelos generativos de IA. Brown dijo que habían visto una reducción del 60 % en los costos de inferencia y una mejora de la latencia del 55 %. Kakaopay Securities: La institución financiera surcoreana Kakaopay Securities ha estado «utilizando Graviton a lo grande», dijo Brown. Esto ha permitido al actor bancario lograr una reducción del 20% en los costos operativos y una mejora del 30% en el desempeño, afirmó Brown. Ventajas del silicio personalizado para los clientes empresariales de la nube Los clientes empresariales en APAC podrían beneficiarse de una gama cada vez mayor de opciones informáticas, ya sea que se mida por el rendimiento, el costo o la idoneidad para diferentes cargas de trabajo en la nube. Las opciones de silicio personalizadas también podrían ayudar a las organizaciones a alcanzar los objetivos de sostenibilidad. Resultados mejorados de rendimiento y latencia La competencia proporcionada por los proveedores de la nube, junto con los proveedores de chips, podría impulsar avances en el rendimiento de los chips, ya sea en la categoría de computación de alto rendimiento para el entrenamiento de modelos de IA o en la innovación para la inferencia, donde la latencia es un gran factor. consideración. Potencial para una mayor optimización de los costos de la nube La optimización de los costos de la nube ha sido un problema importante para las empresas, ya que la expansión de las cargas de trabajo en la nube ha llevado a los clientes a aumentar los costos. Más opciones de hardware brindan a los clientes más opciones para reducir los costos generales de la nube, ya que pueden elegir con mayor criterio la computación adecuada. Capacidad de hacer coincidir las cargas de trabajo de computación con las aplicaciones Una gama cada vez mayor de chips de silicio personalizados dentro de los servicios en la nube permitirá a las empresas adaptar mejor sus cargas de trabajo de aplicaciones a las características específicas del hardware subyacente, garantizando que puedan utilizar el silicio más apropiado para los casos de uso que persiguen. . Mejor sostenibilidad mediante menos energía Se prevé que la sostenibilidad se convierta en uno de los cinco factores principales para los clientes que contraten proveedores de nube para 2028. Los proveedores están respondiendo: por ejemplo, AWS dijo que las emisiones de carbono se pueden reducir drásticamente utilizando chips Graviton4, que son un 60 % más eficientes. El silicio personalizado ayudará a mejorar la sostenibilidad general de la nube.

Raspberry Pi adopta la IA con la colaboración de Hailo

El fabricante de PC de placa única Raspberry Pi Ltd cotizará su filial comercial en la Bolsa de Valores de Londres a partir de una fecha no revelada de junio, un cambio importante para la empresa, que opera parcialmente como una organización educativa sin fines de lucro. Poco después de la confirmación de la oferta pública inicial (aunque no relacionada), Raspberry Pi presentó su último producto, una placa de inteligencia artificial para capacidades de visión, en colaboración con Hailo. La Bolsa de Valores de Londres recibirá un impulso de la IPO, que ha caído a su proporción más baja de fondos de IPO en décadas, según una investigación de Bloomberg. Aunque las computadoras Raspberry Pi a menudo se conocen como herramientas educativas, también se utilizan en automatización industrial, hogares inteligentes, pruebas de otras computadoras y otras aplicaciones profesionales. «La oferta pública inicial propuesta tiene como objetivo asegurar la siguiente etapa de crecimiento e impacto tanto para la Fundación como para la empresa comercial», escribió el director ejecutivo de la Fundación Raspberry Pi, Philip Colligan, en una publicación de blog el 28 de mayo. La fundación y la rama comercial seguirán siendo entidades independientes. . La oferta pública inicial de Raspberry Pi Ltd beneficiará a la Fundación Educativa, dice la compañía Se rumorea desde hace mucho tiempo que Raspberry Pi se hará pública. Ahora, ha declarado oficialmente su intención de incluir Raspberry Pi Ltd. en el mercado principal de la Bolsa de Valores de Londres y recaudar £157 millones (USD $200 millones). Con el dinero de la IPO, Raspberry Pi planea ampliar su línea de productos y contratar más ingenieros. Cuando se confirmó la intención de la compañía de hacer una oferta pública inicial en enero, algunos entusiastas de la informática temieron que Raspberry Pi cambiara a productos e iniciativas más comerciales a instancias de los accionistas. VER: ¿Cómo deberían los líderes empresariales decidir cuándo llega el momento de realizar una oferta pública inicial? La Fundación seguirá siendo beneficiaria de una parte de los beneficios de la empresa comercial. «Desde la perspectiva de la Fundación, una IPO nos brinda la posibilidad de vender algunas de nuestras acciones para recaudar dinero para financiar una expansión sostenible de nuestras actividades educativas», escribió Colligan en mayo. Más sobre innovación El kit Hailo lleva IA a Raspberry Pi En noticias relacionadas, Raspberry Pi anunció el 4 de junio su primera computadora para inferencia de IA en asociación con la empresa de procesadores de IA de vanguardia Hailo. El kit Raspberry Pi AI es una computadora Raspberry Pi 5 de $70 con un conector M.2 HAT+ a un módulo acelerador Hailo-8L AI. Al desmontar el kit Raspberry Pi AI se muestran las piezas que lo componen, incluido el procesador Hailo. Imagen: Raspberry Pi “Nuestra colaboración con Hailo permite a los clientes industriales de Raspberry Pi integrar IA en soluciones de alto rendimiento que son extremadamente rentables y energéticamente eficientes. Para los entusiastas, el AI Kit proporciona una forma accesible de mejorar sus proyectos creativos con IA”, dijo Eben Upton, CEO de Raspberry Pi, en un comunicado de prensa. El kit Raspberry Pi AI puede ejecutar redes neuronales capaces de detectar objetos, reconocer rostros y realizar otras tareas relacionadas con la visión. Puede realizar inferencias en archivos de vídeo, interpretando imágenes pregrabadas; esto podría permitir una mayor personalización para configuraciones o fabricación de hogares inteligentes. Además, es compatible con cámaras propias o de terceros. «Un obstáculo importante en la creación de aplicaciones de visión basadas en IA del mundo real es la complejidad del software para integrar el subsistema de la cámara con el marco de IA», escribió el ingeniero principal senior de Raspberry Pi, Naush Patuck, en un comunicado de prensa. «Hemos trabajado duro para simplificar esto tanto como sea posible». El resultado son “aplicaciones avanzadas basadas en IA en sólo unos pocos cientos de líneas de código C++”, escribió Raspberry Pi. El kit Raspberry Pi AI está disponible en los revendedores aprobados de Raspberry Pi a nivel internacional. TechRepublic se ha puesto en contacto con Raspberry Pi para obtener más información sobre el kit de IA y la IPO.

Funciona con WordPress & Tema de Anders Norén