Análisis En los últimos años hemos visto a varios OEM, incluidos Dell, HPE y otros, intentar hacer que los centros de datos locales se vean y se sientan más como la nube pública. Sin embargo, al final del día, el hardware real detrás de estas ofertas suele ser solo un conjunto de servidores y conmutadores normales vendidos en un modelo basado en el consumo, no los tipos de sistemas estilo OCP que encontrará en una nube moderna o Centro de datos a hiperescala. Sin embargo, uno de los enfoques más extraños del concepto que hemos visto en los últimos tiempos es el de Oxide Computer, una empresa fundada por un grupo de antiguos empleados de Joyent y Sun Microsystems, que están intentando replantear el bastidor, no el servidor, como unidad. de cómputo para el centro de datos. Comenzando desde cero Si observa el hardware a escala de rack de Oxide, honestamente se le perdonará pensar que es simplemente otro gabinete lleno de sistemas 2U. Pero al sacar uno de los trineos informáticos inspirados en hiperescala, se hace evidente que esto es algo diferente. El sistema de 3000 libras mide 2,74 metros (9 pies de altura), consume 15 kW bajo carga y conecta hasta 32 nodos de cómputo y 12,8 Tbps de capacidad de conmutación mediante una pila de software completamente personalizada. Si bien puede parecerse a cualquier otro bastidor, los sistemas a escala de bastidor de Oxide se parecen más a servidores blade gigantes… Fuente: Oxide Computer En muchos aspectos, la plataforma responde a la pregunta: ¿qué pasaría si simplemente se construyera un servidor blade del tamaño de un bastidor? Por extraño que parezca, eso no está muy lejos de lo que Oxide realmente ha hecho. En lugar de agrupar un montón de servidores, redes, almacenamiento y todas las diferentes plataformas de software necesarias para usarlos y administrarlos, Oxide dice que sus sistemas a escala de rack pueden manejar todo eso usando una interfaz de software consistente. Como es de esperar, hacer eso no es tan simple como podría parecer. Según el CTO Bryan Cantrill, lograr este objetivo significó construir la mayor parte del hardware y software desde cero. Llevar la comodidad a hiperescala a casa En términos de factor de forma, esto tenía un par de ventajas, ya que Cantrill dice que Oxide pudo integrar varias sutilezas a hiperescala, como un backplane ciego para la entrega de energía de corriente continua (CC), que no es el tipo de algo que se encuentra comúnmente en los sistemas empresariales. «Es simplemente cómico que todos los que implementan a escala tengan una barra colectora de CC y, sin embargo, no se pueda comprar un sistema basado en barras colectoras de CC de Dell, HP o Supermicro porque, entre comillas, nadie lo quiere», bromeó Cantrill. Debido a que el bastidor en sí funciona como chasis, Oxide también pudo salirse con la suya con factores de forma no estándar para sus nodos de cómputo. Esto permitió a la empresa utilizar ventiladores más grandes, más silenciosos y que consumen menos energía. Como hemos comentado en el pasado, los ventiladores pueden representar hasta el 20 por ciento del consumo de energía de un servidor. Pero en el rack de Oxide, Cantrill afirma que esa cifra se acerca al 2 por ciento durante el funcionamiento normal. Lo que realmente se pone interesante es cómo Oxide gestiona el hardware informático. Cada bastidor puede equiparse con hasta 32 sleds de computación, cada uno equipado con un procesador Epyc 3 de 64 núcleos, su elección de 512 GB o 1 TB de DDR4 y hasta 10 unidades NVMe U.2 de 2,5 pulgadas. Nos dijeron que Oxide planea actualizar a DDR5 con el lanzamiento de la plataforma Turín de AMD a finales de este año, y esos blades serán compatibles con los racks existentes. Estos recursos se dividen en cosas como máquinas virtuales que utilizan un hipervisor personalizado basado en Bhyve e Illumos Unix. Esto puede parecer una elección extraña frente a KVM o Xen, que son ampliamente utilizados por los proveedores de nube, pero seguir con un hipervisor basado en Unix tiene sentido considerando la historia de Cantrill en Sun Microsystems. Para una gestión sencilla del hardware subyacente, Oxide fue un paso más allá y desarrolló un chip de gestión de placa base (BMC) de cosecha propia. «No hay ningún ASpeed ​​BMC en el sistema. Ya no está», dijo Cantrill. «Lo hemos reemplazado con un procesador de servicio reducido que ejecuta y opera un sistema operativo de novo de nuestro diseño llamado Hubris. Es un sistema completamente Rust que tiene una latencia realmente baja y está en su propia red dedicada». «Debido a que tenemos una latencia súper baja en el rack, podemos realizar una administración de energía significativa», agregó, explicando que esto significa que la plataforma de software de Oxide puede aprovechar las funciones de administración de energía integradas en los procesadores de AMD de una manera que no es posible sin realizar un seguimiento de las cosas. como consumo de energía en tiempo real. Esto, afirma, significa que un cliente puede tomar un bastidor de 15 kW y configurarlo para que funcione en una envolvente de 8 kW, obligando a la CPU a funcionar con menos energía. Además del ahorro de energía, Oxide afirma que la integración entre el procesador de servicios y el hipervisor le permite gestionar las cargas de trabajo de forma proactiva. Por ejemplo, si uno de los nodos comienza a generar un error (imaginamos que podría ser algo tan simple como una falla de un ventilador), podría migrar automáticamente cualquier carga de trabajo que se esté ejecutando en ese nodo a otro sistema antes de que falle. Este espíritu de codiseño también se extiende al enfoque de la empresa hacia la creación de redes. Donde se podría esperar ver un conmutador de caja blanca estándar de Broadcom o Marvell, Oxide ha construido el suyo propio basado en los ASIC Tofino 2 de Intel y con una capacidad combinada de 12,8 Tbps de rendimiento. Y como habrás adivinado en este punto, esto también ejecuta un sistema operativo de red personalizado (NOS), que irónicamente se ejecuta en un procesador AMD. Notaremos que la decisión de Oxide de optar por la línea Tofino es interesante ya que, a partir del año pasado, Intel efectivamente la abandonó. Pero ni Cantrill ni el CEO Steve Tuck parecen demasiado preocupados y el analista de Dell’Oro, Sameh Boujelbene, nos dijo anteriormente que 12,8 Tbps todavía es bastante para un conmutador de rack superior. Al igual que la alimentación de CC, la conexión en red de los sistemas está preconectada en el backplane, lo que proporciona 100 Gbps de conectividad a cada uno de los sistemas. «Una vez que esto se hace correctamente en la fabricación, se valida, se verifica y se envía, nunca será necesario volver a cablear el sistema», explicó Cantrill. Dicho esto, no nos gustaría ser los técnicos encargados de desmontar el backplane si algo saliera mal. Opciones limitadas Obviamente, la plataforma a escala de bastidor de Oxide viene con un par de limitaciones: a saber, estás atascado trabajando con el hardware que admite. Por el momento, no hay tantas opciones. Tiene un nodo informático de uso general con NVMe integrado para almacenamiento. En la configuración básica, estás viendo un sistema de medio rack con un mínimo de 16 nodos con un total de 1024 núcleos y 8 TB de RAM, el doble que para la configuración completa. Dependiendo de sus necesidades, podemos imaginar que habrá un buen número de personas para quienes incluso la configuración mínima podría resultar excesiva. Por el momento, si necesita soporte para almacenamiento, computación o redes alternativas, todavía no lo colocará en un bastidor Oxide. La red de Oxide sigue siendo Ethernet, por lo que no hay nada que le impida colocar un chasis estándar de 19 pulgadas junto a una de estas cosas y llenarlo de nodos GPU, servidores de almacenamiento o cualquier otro componente estándar de montaje en bastidor que pueda necesitar. Como mencionamos anteriormente, Oxide lanzará nuevos nodos de computación basados ​​en la familia de procesadores Turín de AMD, que saldrán a finales de este año, por lo que es posible que veamos más variedad en términos de computación y almacenamiento en ese momento. ¿Todas las CPU y ninguna GPU? ¿Qué pasa con la IA? Con todo el revuelo en torno a la IA, la importancia de la computación acelerada no ha pasado desapercibida para Cantrill o Tuck. Sin embargo, señala que si bien Oxide ha analizado la compatibilidad con GPU, en realidad está mucho más interesado en APU como la recientemente lanzada MI300A de AMD. La APU, que exploramos detalladamente en diciembre, combina 24 núcleos Zen 4, seis núcleos CDNA 3 y 128 GB de memoria HBM3 en un solo zócalo. «Para mí, la APU es la incorporación de esta computadora acelerada donde ya no tenemos que tener estas islas de aceleración», dijo Cantrill. En otras palabras, al hacer que la CPU y la GPU compartan memoria, se puede reducir una gran cantidad de movimiento de datos, lo que hace que las APU sean más eficientes. Probablemente no esté de más que las APU también reduzcan la complejidad del soporte de sistemas de múltiples enchufes en el tipo de espacio y factor de forma térmicamente limitado con el que trabaja Oxide. Si bien el hardware puede ser exclusivo de Oxide, su pila de software al menos se está desarrollando abiertamente en GitHub. Por lo tanto, si compra una de estas cosas y la empresa se retira o es adquirida, al menos debería poder conseguir el software necesario para evitar que un hardware que de otro modo sería bueno se convierta en un ladrillo muy caro. ®

Source link