¿Quieres ideas más inteligentes en tu bandeja de entrada? Regístrese en nuestros boletines semanales para obtener solo lo que importa a los líderes de IA, datos y seguridad empresariales. Suscríbete ahora la investigación de Nous, una startup secreta de inteligencia artificial que se ha convertido en una voz líder en el movimiento de IA de código abierto, lanzó en silencio Hermes 4 el lunes, una familia de grandes modelos de idiomas que la compañía afirma puede igualar el rendimiento de los sistemas de propiedad líderes al tiempo que ofrece control de usuarios sin precedentes y restricciones de contenido mínimo. El lanzamiento representa una escalada significativa en la batalla entre los defensores de la IA de código abierto y las principales compañías de tecnología sobre las que deberían controlar el acceso a capacidades avanzadas de inteligencia artificial. A diferencia de los modelos de OpenAI, Google o Anthrope, Hermes 4 está diseñado para responder a casi cualquier solicitud sin las barandillas de seguridad que se han convertido en estándar en los sistemas comerciales de IA. Nous Research presenta a Hermes 4, nuestra última línea de modelos de razonamiento híbrido.https: //t.co/e5ew9hburbhermes 4 se basa en nuestro legado de modelos alineados por los usuarios con capacidades de cómputo de tiempo de prueba expandidos. Se prestó especial atención a hacer que los modelos sean creativos e interesantes para … pic.twitter.com/52vjnvrdwm— Nous Research (@nousResearch) 26 de agosto de 2025 «Hermes 4 se basa en nuestro legado de modelos alineados con los usuarios con capacidades de cómputo de tiempo de prueba expandidos», anunció Nous Research en X (anteriormente Twitter). «Se prestó especial atención a hacer que los modelos creativos e interesantes para interactuar, sin gastarse por la censura, y alineados neutralmente mientras se mantiene el rendimiento de las matemáticas, codificación y razonamiento de nivel de arte para modelos de peso abierto». Cómo el modo de ‘razonamiento híbrido’ de Hermes 4 supera a ChatGPT y Claude en puntos de referencia de matemáticas Hermes 4 presenta lo que Nous Research llama «razonamiento híbrido», lo que permite a los usuarios alternar entre respuestas rápidas y procesos de pensamiento paso a paso más profundos. Cuando se activan, los modelos generan su razonamiento interno en especial Etiquetas antes de proporcionar una respuesta final, similar a los modelos de razonamiento O1 de OpenAI, pero con plena transparencia en el proceso de pensamiento de la IA. AI Scaling alcanza sus límites de potencia de límites, el aumento de los costos de los tokens y los retrasos de inferencia están remodelando Enterprise AI. Únase a nuestro salón exclusivo para descubrir cómo son los mejores equipos: convertir la energía en una ventaja estratégica arquitectando una inferencia eficiente para las ganancias de rendimiento real que desbloquean el ROI competitivo con sistemas de IA sostenibles asegura su lugar para mantenerse a la vanguardia: https://bit.ly/4mwgngo El logro técnico es sustancial. En las pruebas, el modelo de parámetros de 405 mil millones de 405 mil millones de Hermes 4 obtuvo un 96.3% en el punto de referencia Math-500 en modo de razonamiento y 81.9% en la desafiante competencia de matemáticas AIME’24: rendimiento que rivaliza o excede muchos sistemas de propiedad que costan millones más para desarrollar. «El desafío es hacer que los rastros de pensamiento sean útiles y verificables sin razonamiento fugitivo», señaló el investigador de IA Rohan Paul en X, destacando uno de los avances técnicos en el lanzamiento. Quizás lo más notable, Hermes 4 logró el puntaje más alto entre todos los modelos probados en «Refusalbench», una nueva investigación de referencia creada para medir con qué frecuencia los sistemas de IA se niegan a responder preguntas. El modelo obtuvo un puntaje de 57.1%en el modo de razonamiento, superando significativamente a GPT-4O (17.67%) y Claude Sonnet 4 (17%). Los modelos Hermes 4 de Nous Research respondieron significativamente más preguntas que los sistemas de IA competidores en Refusalbench, una prueba que mide con qué frecuencia los modelos se niegan a responder a las solicitudes de los usuarios. (Crédito: Investigación Nous) Inside DataForge y Atropos: los sistemas de entrenamiento innovador detrás de las capacidades de Hermes 4 detrás de las capacidades de Hermes 4 se encuentran una infraestructura de capacitación sofisticada que Nous Research ha desarrollado durante varios años. Los modelos fueron entrenados utilizando dos sistemas novedosos: DataForge, un generador de datos sintético basado en gráficos y Atropos, un marco de aprendizaje de refuerzo de código abierto. DataForge crea datos de capacitación a través de lo que la compañía describe como «caminatas aleatorias» a través de gráficos dirigidos, transformando datos simples de pre-entrenamiento en ejemplos complejos de seguimiento de instrucciones. El sistema puede, por ejemplo, tomar un artículo de Wikipedia y transformarlo en una canción de rap, luego generar preguntas y respuestas basadas en esa transformación. Mientras tanto, Atropos funciona como cientos de entornos de capacitación especializados donde los modelos de IA practican habilidades específicas (matemáticas, codificación, uso de herramientas y escritura creativa) recurriendo los comentarios solo cuando producen soluciones correctas. Este enfoque de «muestreo de rechazo» asegura que solo las respuestas verificadas de alta calidad lleguen a los datos de entrenamiento. Atropos es Nous ‘Reflor Learning FrameWorkatropos es un entorno de aprendizaje de refuerzo de código abierto de Nous que tiene cientos de «gimnasios» (como matemáticas, codificación, juegos, uso de herramientas, visión) para entrenar y evaluar las trayectorías de LLM a través de escalables, async rl loops.in otras palabras … Pic.twitter.com/fjxxaqkclez— ¡Estos entornos para generar el conjunto de datos para Hermes 4! Explicó Tommy Shaughnessy, un capitalista de riesgo de Delphi Ventures que ha invertido en investigaciones de Nous. «¡Todos en el conjunto de datos contienen 3.5 millones de muestras de razonamiento y 1.6 millones de muestras no de condición! Hermes fue entrenado en datos RL, ¡no solo conjuntos de datos estáticos de preguntas y respuestas!» El proceso de capacitación requirió 192 GPU NVIDIA B200 y 71,616 horas de GPU para el modelo más grande, una inversión computacional significativa pero no sin precedentes que demuestra cómo las técnicas especializadas pueden competir con la escala masiva de los gigantes tecnológicos. Por qué Nous Research cree que las barandillas de seguridad de IA son «molestas como el infierno» y la innovación de la investigación de Nous ha creado su reputación en una filosofía que pone el control del usuario por encima de las políticas de contenido corporativo. Los modelos de la compañía están diseñados para ser «orientables», lo que significa que pueden ser ajustados o obligados a comportarse de manera específica sin las restricciones de seguridad rígidas que caracterizan los sistemas de IA comerciales. «Hermes 4 no está encadenada por renuncias, reglas y ser demasiado cauteloso, lo cual es molesto como el infierno y duele la innovación y la usabilidad», escribió Shaughnessy en un hilo detallado que analiza el lanzamiento. «Si su código abierto, pero rechaza todas las solicitudes. No tiene sentido. No es un problema con Hermes 4.» Hermes 4 no está encadenado por descargo de responsabilidad, reglas y ser demasiado cauteloso, lo cual es molesto como el infierno y duele la innovación y la usabilidad. Hermes 4 70b está en el modelo de código abierto de Spectrum vs OpenAI. También es ~ 4x más abierto vs chatgpt 4o! Si está abierto … pic.twitter.com/q5rpx1oozo— Tommy (@shaughnessy119) 26 de agosto de 2025 Este enfoque ha hecho popular a los investigadores de IA y los desarrolladores que desean la máxima flexibilidad, pero también coloca la compañía en el centro de los debates continuos sobre la seguridad de la IA y la modificación de contenido. Si bien los modelos se pueden utilizar teóricamente para fines dañinos, Nous Research argumenta que la transparencia y el control del usuario son preferibles a la guardia corporativa. El informe técnico de la compañía, publicado junto con los modelos, proporciona detalles sin precedentes sobre el proceso de capacitación, los resultados de la evaluación e incluso los resultados de texto reales de las pruebas de referencia. «Creemos que este informe establece un nuevo estándar para la transparencia en la evaluación comparativa», declaró la compañía. Cómo una pequeña startup con 192 GPU está compitiendo contra el lanzamiento de los presupuestos de IA de IA de Big Big Tech, el lanzamiento de Hermes 4 llega en un momento fundamental en la industria de la IA. Si bien las principales empresas de tecnología han invertido miles de millones en el desarrollo de sistemas de IA cada vez más potentes, un creciente movimiento de código abierto argumenta que estas capacidades no deben ser controladas por un puñado de corporaciones. Los últimos meses han visto avances significativos en la IA de código abierto, con modelos como Meta’s Llama 3.1, Deepseek’s R1 y la serie Qwen de Alibaba alcanzando el rendimiento que rivaliza con los sistemas propietarios. Hermes 4 representa otro paso en esta progresión, particularmente en el área del razonamiento, considerando una fortaleza de los sistemas cerrados como OpenAi’s O1. «Primero, Nous es una startup con docenas de personas extremadamente talentosas», señaló Shaughnessy. «No tienen el gasto de CAPEX anual de $ 100B+ de un hiperscalador ni 1,000 de empleados y, a pesar de que continúan sacando modelos e investigaciones innovadores a un ritmo loco». La startup, que recaudó $ 65 millones en fondos a principios de este año dirigido por Paradigm, también ha estado desarrollando Psyte Network, un sistema de capacitación distribuido que tiene como objetivo coordinar la capacitación de IA en computadoras conectadas a Internet utilizando tecnología blockchain. La solución técnica que impidió que Hermes 4 piense en los bucles interminables Una de las contribuciones técnicas más importantes de Hermes 4 aborda un problema que afecta a los modelos de razonamiento: procesos de pensamiento demasiado largos. Los investigadores encontraron que su modelo de parámetros más pequeño de 14 mil millones alcanzaría la máxima longitud del contexto del 60% del tiempo al razonar, esencialmente quedarse atascado en infinitos bucles de pensamiento. Su solución implicó una segunda etapa de entrenamiento que enseña a los modelos a dejar de razonar exactamente a 30,000 tokens, reduciendo la generación demasiado larga en un 65-79% mientras mantiene la mayor parte del rendimiento del razonamiento. Esta técnica de «control de longitud» podría resultar valiosa para la comunidad de investigación de IA más amplia. «Los modelos más pequeños (<14b) tienden a pensar demasiado cuando se destilan, pero los modelos más grandes no", observó el investigador de IA Muyu HE en X, destacando las ideas del informe técnico. Sin embargo, Hermes 4 todavía enfrenta limitaciones comunes a los modelos de código abierto. A pesar del impresionante rendimiento de referencia, los modelos requieren recursos computacionales significativos para ejecutar y pueden no coincidir con la facilidad de uso o confiabilidad de los servicios comerciales de IA para muchas aplicaciones. Dónde probar Hermes 4 y lo que cuesta en comparación con ChatGPT y Claude Nous Research ha hecho que Hermes 4 esté disponible a través de múltiples canales, lo que refleja la filosofía de código abierto. Los pesos del modelo se pueden descargar libremente en abrazar la cara, mientras que la compañía también ofrece acceso a API a través de su interfaz de chat renovada y sus asociaciones con proveedores de inferencia como Chutes, Nebius y Luminal. "Puedes probar Hermes 4 en la nueva interfaz de usuario de chat Nous renovada", anunció la compañía, destacando características como interacciones paralelas y un sistema de memoria. Para los usuarios e investigadores empresariales, los modelos representan una alternativa potencialmente atractiva para pagar el acceso de API a sistemas propietarios, especialmente para aplicaciones que requieren altos niveles de personalización o manejo de contenido sensible. La imagen más grande: lo que significa Hermes 4 para el futuro del desarrollo de la IA, el lanzamiento de Hermes 4 representa más que un lanzamiento modelo de AI: es una declaración sobre quién debería controlar el futuro de la inteligencia artificial. En una industria cada vez más dominada por un puñado de gigantes tecnológicos con recursos prácticamente ilimitados, Nous Research ha demostrado que la innovación aún puede provenir de lugares inesperados. El enfoque de la Compañía plantea preguntas fundamentales sobre las compensaciones entre la seguridad y la capacidad, entre el control corporativo y la libertad del usuario. Si bien las principales compañías de tecnología argumentan que la moderación cuidadosa de contenido y las barandillas de seguridad son esenciales para el despliegue responsable de la IA, la investigación de Nous sostiene que la transparencia y la agencia de usuarios son más importantes que las restricciones impuestas por las corporaciones. Queda por ver si esta filosofía será beneficiosa o problemática. Pero una cosa es segura: Hermes 4 ha demostrado que el futuro de la IA no será determinado únicamente por las compañías con los bolsillos más profundos. En un campo donde las imposibilidades de ayer se convierten en las mercancías del mañana, Nous Research demostró que lo único más peligroso que una IA que dice que no podría ser una que esté dispuesta a decir que sí. Insights diarias sobre casos de uso de negocios con VB diariamente Si desea impresionar a su jefe, VB Daily lo tiene cubierto. Le damos la cuenta interior de lo que las empresas están haciendo con la IA generativa, desde cambios regulatorios hasta implementaciones prácticas, por lo que puede compartir ideas para el ROI máximo. Lea nuestra Política de privacidad Gracias por suscribirse. Mira más boletines de VB aquí. Ocurrió un error.