A menudo, me doy cuenta de las tendencias buscando patrones comunes en las preguntas que me hacen los periodistas. En muchos casos, están mucho más en contacto con el mercado que yo y son un buen dato. Atiende las llamadas que he estado recibiendo sobre los problemas que pueden surgir si hay escasez de unidades de procesamiento de gráficos (GPU). En primer lugar, si eso sucede, probablemente no durará mucho. En segundo lugar, deberían considerarse otras opciones viables. Por supuesto, el panorama es pesimista, con el temor de que las empresas no puedan aprovechar la revolución de la IA generativa si no pueden conseguir estos procesadores, ya sea para su uso con sistemas locales o en la nube y a pedido.¿Problema falso?Soy el primero en admitir que los sistemas de IA generativa son complejos y requieren un uso intensivo de procesadores. Por lo tanto, se supone que deben depender de hardware altamente especializado para realizar tareas que alguna vez fueron dominio exclusivo de la imaginación humana. La gente cree que la IA generativa necesita GPU o incluso procesamiento más especializado, como la computación cuántica. ¿Son siempre correctas esas suposiciones? ¿Es este otro sistema especializado en el que se necesitan componentes especializados a precios muy especializados? Las GPU se desarrollaron inicialmente para representar gráficos en videojuegos, pero se han vuelto fundamentales para la IA debido a su estructura altamente paralela. Pueden realizar miles de operaciones simultáneamente. Esto se alinea perfectamente con las tareas requeridas por las redes neuronales, la tecnología crítica en la IA generativa. Ese es un hecho técnico que las personas que diseñan y construyen sistemas de IA generativa (como un servidor) deberían considerar cuidadosamente. Las Unidades de Procesamiento Tensor (TPU), por otro lado, son circuitos integrados desarrollados a medida y específicos de aplicaciones de Google diseñados explícitamente para TensorFlow. TensorFlow es un marco de aprendizaje automático de código abierto que existe desde hace algún tiempo. Los TPU ayudan en los procesos de aprendizaje automático, ya que están diseñados para la propagación hacia adelante y hacia atrás. Estos son procesos aprovechados para entrenar redes neuronales. No considero que las TPU sean un problema tan grande como las GPU en lo que respecta al costo. Sin embargo, a menudo están unidos, por lo que vale la pena mencionarlos aquí. Aquellos de ustedes que construyen e implementan estos sistemas saben que no importa qué marco de IA estén utilizando, la mayor parte del procesamiento y el tiempo se dedica a entrenar los modelos a partir de montones y montones de datos. Por ejemplo, considere los modelos GPT-4 de OpenAI o BERT de Google, que tienen miles de millones de parámetros. Entrenar estos modelos sin procesadores especializados podría llevar una cantidad de tiempo poco práctica. ¿Se necesitan siempre procesadores especializados? Las GPU mejoran enormemente el rendimiento, pero lo hacen a un costo significativo. Además, para aquellos que rastrean los puntos de carbono, las GPU consumen cantidades notables de electricidad y generan un calor considerable. ¿Las ganancias de rendimiento justifican el costo? Las CPU son el tipo más común de procesadores en las computadoras. Están en todas partes, incluso en cualquier elemento que utilices para leer este artículo. Las CPU pueden realizar una amplia variedad de tareas y tienen una cantidad menor de núcleos en comparación con las GPU. Sin embargo, tienen unidades de control sofisticadas y pueden ejecutar una amplia gama de instrucciones. Esta versatilidad significa que pueden manejar cargas de trabajo de IA, como casos de uso que necesitan aprovechar cualquier tipo de IA, incluida la IA generativa. Las CPU pueden crear prototipos de nuevas arquitecturas de redes neuronales o probar algoritmos. Pueden ser adecuados para ejecutar modelos más pequeños o menos complejos. Esto es lo que muchas empresas están construyendo en este momento (y lo serán durante algún tiempo) y las CPU son suficientes para los casos de uso de los que estoy escuchando actualmente. ¿Cuánto necesitas pagar realmente? Las CPU son más rentables en términos de inversión inicial y consumo de energía para organizaciones más pequeñas o individuos que tienen recursos limitados. Sin embargo, incluso para empresas con muchos recursos, pueden seguir siendo la opción más rentable. Además, la IA está evolucionando. Con los avances recientes en los algoritmos de IA, existen nuevos desarrollos como SLIDE (Sub-Linear Deep Learning Engine). Esta tecnología pretende entrenar redes neuronales profundas más rápido en CPU que en GPU bajo ciertas condiciones. Están utilizando técnicas de hash y reduciendo los costos de acceso a la memoria. Además, considere los arreglos de puertas programables en campo (FPGA). Estos procesadores se pueden programar después de su fabricación para realizar tareas específicas, como la IA, de manera mucho más eficiente. Además, las unidades de procesamiento asociativo (APU) se especializan en el reconocimiento de patrones y pueden manejar tareas de memoria asociativa, lo que hace que ciertos tipos de aplicaciones de redes neuronales se ejecuten más rápido. Hay muchos casos en los que los procesadores que no son GPU son mucho más rentables. Entonces, ¿por qué la respuesta es siempre GPU cuando se trata de IA generativa o simplemente IA en general? No estoy seguro de que sea necesario. Sospecho que las empresas gastarán millones de dólares más de lo necesario porque consideran que el costo justifica las mejoras en el rendimiento. Esto será tanto el consumo de procesamiento de GPU dentro de una nube pública, en las instalaciones y algunos dentro de las computadoras perimetrales. El llamado aquí no es limitar el uso de GPU, sino considerar lo que realmente necesita para su caso de uso específico. La mayoría de las aplicaciones de IA generativa serán pequeñas implementaciones tácticas y realmente no necesitarán el costo ni el impacto de carbono de las GPU. El trabajo principal de los arquitectos de sistemas, los arquitectos de la nube y, ahora, los arquitectos de IA generativa es encontrar la solución con mayor optimización de costos. ¿Qué configuración de tecnología costará menos y proporcionará el mayor valor empresarial al mismo tiempo? Quizás la IA generativa sea un área de próximo desarrollo en la que podamos tomar decisiones mejores y más pragmáticas. No te limites a seguir las exageraciones. Copyright © 2024 IDG Communications, Inc.

Source link