Elon Musk presentó a Grok 4 anoche, llamándolo la 'IA más inteligente del mundo', lo que las empresas necesitan saber

¿Quieres ideas más inteligentes en tu bandeja de entrada? Regístrese en nuestros boletines semanales para obtener solo lo que importa a los líderes de IA, datos y seguridad empresariales. Suscríbase ahora después de días de controversia en torno a una oleada de respuestas antisemitas hechas recientemente por su chatbot con alimentación de Grok Ai en su red social X (anteriormente Twitter), un aparentemente poco arrepentido y no coincidente Elon Musk lanzó la última versión de su familia Model de AI, Grok 4, durante un evento Livestreamed On X Last Night, llamando a «The Smartest Ai in the Worlds in the Worlds in the Worly» «.» «». «». «». «». «». «». Como Musk publicó en X: «Grok 4 es la primera vez, en mi experiencia, que una IA ha podido resolver preguntas difíciles de ingeniería del mundo real donde las respuestas no se pueden encontrar en Internet o en los libros. Y mejorará mucho». La nueva versión en realidad incluye dos modelos distintos: Grok 4, un modelo de razonamiento de un solo agente y Grok 4 Heavy, un sistema de múltiples agentes diseñado para resolver problemas complejos a través de la colaboración y síntesis interna. Ambos modelos están optimizados para tareas de razonamiento y vienen con integración de herramientas nativas, habilitando capacidades como búsqueda web, ejecución de código y análisis multimodal. Musk y su equipo en XAI exhibieron puntos de referencia que sugieren que Grok 4 supera a todos los competidores actuales en una gama de evaluaciones académicas y de codificación, incluso en comparación con los rivales del modelo de razonamiento de IA, como Openai O3 y Google Gemini. Sin embargo, Xai aún no ha publicado una tarjeta modelo o ninguna documentación oficial de notas de versión para Grok 4 al público, lo que hace que sea difícil evaluar independientemente su desempeño y las afirmaciones hechas durante la transmisión. Actualizaremos si/cuando estos estén disponibles. Tampoco Musk y sus miembros del equipo de XAI participaron en la transmisión en vivo de la controversia evidente que enfrenta Grok durante la semana pasada, incluidos muchos incidentes de Grok haciendo comentarios antisemitas o referiéndose a sí mismo como «Mechahitler», y sugiriendo que las personas con apellidos judíos deben ser manejados decisivamente por Adolf Hitler, una referencia aparentemente revocada de Holocausto y Genocidio de 6 millones de Jews World Wars. fue cuando él declaró: «Lo que creo que es más importante para la seguridad de la IA, al menos mi red neuronal biológica me dice lo más importante, es ser la búsqueda de la verdad al máximo», y «Necesitamos asegurarnos de que la IA sea una buena AI. Buen grok», así como «es importante inculcar los valores que quieres en un niño que creceran para ser increíblemente poderoso». Sin embargo, Musk no se disculpó, ni aceptó la responsabilidad de los comentarios antisemíticos, sexualmente ofensivos y conspirativos de Grok. Aquí hay una copia de la transmisión completa: a lo largo de la transmisión en vivo, el equipo enfatizó la capacidad de Grok 4 para razonar desde los primeros principios, corregir sus propios errores y potencialmente inventar nuevas tecnologías o descubrir nuevas ideas científicas. La presentación también incluyó demostraciones de Grok 4 Heavy, que aplica una colaboración de agentes múltiples para abordar los problemas a nivel de investigación en todas las disciplinas. La disponibilidad y los precios Grok 4 están disponibles ahora a través de varios canales, dependiendo del tipo de usuario y el nivel de suscripción: Acceso de API (para desarrolladores y empresas): Grok 4 y Grok 4 Heavy están en vivo a través de la API XAI. El precio se estructura de la siguiente manera: $ 3 por 1 millón de tokens de entrada $ 15 por 1 millón de tokens de salida $ 0.75 por 1 millón de tokens de entrada en caché Los precios del doble después de 128,000 tokens en una sola ventana de contexto, la API admite texto e entradas de imágenes, llamadas de funciones, salidas estructuradas y ofrece una ventana de contexto de 256,000 de la prueba. Acceso al consumidor (a través de Grok Chatbot y aplicaciones): los usuarios individuales pueden acceder a Grok 4 a través del Grok Chatbot en X, la aplicación Grok (iOS y Android) y X.com, pero solo con una de las siguientes suscripciones: PremiumPlus: $ 16/mes Supergrok: $ 300/mes A New «Supergrok Heavy», también en un nivel de $ 300/mes, proporciona acceso a Tanto Grok 4 y Grok 4 Heavy, el Multi Heavy, el Multi Heavy, el Multi Agent, el Multi Beat. Variante. (Nota: los niveles de Supergrok y Premiumplus pueden diferir en cuotas de disponibilidad y uso en plataformas X y Grok. Los límites de acceso temporales estuvieron en su lugar durante la demostración, pero el despliegue completo para los suscriptores comenzó poco después. Expansión de la plataforma: XAI ha indicado planes para hacer que Grok 4 esté disponible a través de Microsoft Azure Ai Foundry, donde actualmente se enumeran Grok 3 y Grok 3 Mini. Para los detalles de la suscripción, los usuarios están dirigidos a soporte X.AI/Grok y X Premium. Así es como se compara con otros modelos de IA líderes en términos de precios por millón de tokens. Proveedor y modelcontext WindowInput ($/mtok) InputOutput ($/mtok) adicionales Notasxai-Grok 4/4 Heavy256 K (2 × Precio> 128 K) $ 3.00 $ 0.75 $ 15.0000Image Input, Función Llamada, JSON (APIDOG) Openi de Openi-O3200 K $ 2.00 $ 0.50 $ 8.0050 % Batch-CaPi Calling (APIDOI APIDO APRE APARIO (APIDOG) Openi-Openi (O3200 K $ 2.00 $ 0.50 $ 8.0050 % Batch-cobat Centro) GPT-4O128 K $ 5.00 $ 2.50 $ 20.00 Vision, audio, herramientas (OpenAI) Anthrope-Claude Sonnet 4200 K $ 3.00 $ 0.30 $ 15.0050 % Descuento de salida por lotes (Anthrope) Claude Opus 4200 K $ 15.00 $ 1.50 $ 75.0000high-Accuracy Flaghip (Anthrope) Google-GOUD-GEMINI 2.5 K $ 15.00 $ 1.50 $ 75.000000. K) $ 1.25 $ 0.31 $ 10.0075 % Descuento de éxito de caché (Google AI para desarrolladores, Google Cloud) Gemini 2.5 Flash200 K $ 0.30 $ 0.075 $ 2.50 RASTA, TIER PREVISTO BARATO (Google Cloud) DeepSeek-Deepseek-Routserer64 K $ 0.55 (Miss) / $ 0.14 (HIT) $ 0.14 $ 2.1950-75 % Fuera de los últimos tiempos (DeepSeek) Su predecesor Grok 3, lanzado en febrero, que separó las respuestas acuáticas de herramientas del razonamiento general, Grok 4 fue entrenado con herramientas desde el principio. El modelo integra capacidades como la ejecución del código, la búsqueda web y el análisis de documentos. También presenta Grok 4 Heavy, un sistema de múltiples agentes donde varios modelos internos funcionan en paralelo para generar y validar las respuestas. Grok 4 también incluye un nuevo modo de voz con salidas expresivas con latencia reducida, así como soporte para la entrada de texto e imagen, salidas estructuradas y llamadas de funciones. El rendimiento destaca el análisis del modelo de IA independiente y el análisis artificial del grupo de evaluación comparativa establecida en X que XAI le proporcionó una versión de Grok 4 (no pesado) antes del lanzamiento público para la puntuación. En puntos de referencia técnicos, Grok 4 lidera el índice de inteligencia de análisis artificial con una puntuación de 73, por delante de competidores como O3 (70) y Gemini 2.5 Pro de Google (70). También registró los puntajes principales en: GPQA Diamond: 88% ARC-AGI 2: 15.9%, el doble de la segunda mejor puntuación de las humanidades del último examen: 24% en la versión de solo texto y 44% con herramientas MMLU-Pro y AIME 2024: 87% y 94%, codificación respectivamente y evaluaciones de matemáticas: más altas hasta que date LivecodeBench, scicode, un tiempo de codificación respectivamente y matemáticas y matemáticas, y matemáticas, y más altas en LivecodeBench, scicode, un tiempo de codificación respectivamente y matemáticas y matemáticas y matemáticas y matemáticas y matemáticas y matemáticas y matemáticas y matemá El éxito de referencia, la velocidad de salida de Grok 4 se encuentra en 75 tokens por segundo: más lavado que modelos como Gemini 2.5 Flash (353) o O3 (187) de OpenAI, pero aún más rápido que Claude 4 Opus de Anthrope (66). El modelo presenta una ventana de contexto de 256,000 token, que se encuentra por encima de los límites de contexto de 200k del soneto O3 y Claude 4 pero por debajo de los 1 millón de tokens ofrecidos por Gemini 2.5 Pro y GPT-4.1. Los casos de uso del mundo real XAI proporcionaron varias demostraciones del rendimiento de Grok 4 en escenarios aplicados: en una tarea comercial simulada llamada VendingBench, Grok 4 superó significativamente a otros modelos en la planificación financiera de larga duración. En el Instituto ARC, los investigadores usaron Grok 4 para analizar los registros de CRISPR y descubrir hipótesis novedosas. En radiología, el modelo interpretó las radiografías de tórax con mayor precisión que los compañeros principales. En el sector financiero, su combinación de acceso a datos en tiempo real y razonamiento lo hizo adecuado para pronósticos y análisis. El modelo también puede crear videojuegos en 3D con una entrada mínima mediante activos e integración de forma autónoma. Además, demostró capacidades para simular eventos astrofísicos utilizando aproximaciones fundamentadas de la investigación publicada. Recepción y discusión La respuesta de la industria al lanzamiento de Grok 4 se ha dividido, con entusiasmo por su desempeño compensado por las críticas a la entrega del evento y los problemas de confianza más amplios. David Shapiro, un usuario y escritor de AI Power, señaló: «Grok 4 ahora toma su lugar como» lo suficientemente inteligente como para ayudar con la investigación fronteriza «… pero simplemente ha alcanzado el avance». Ethan Mollick, profesor de Wharton, comentó en X: «Por lo tanto, Grok 3 ha tenido tres incidentes separados en los que aparentemente los cambios no vettidos en el sistema implementado causaron un problema ético a gran escala y un retroceso de emergencia. son muchos modelos realmente buenos por ahí. Ben Hyak, cofundador y CTO de la Startup de Observabilidad del producto de IA, Rain Drop (él mismo, un ex empleado de Musk) criticó la transmisión en vivo: «Esta transmisión en vivo de Xai es una de las peores cosas que he visto en mi vida. Amo a todos, pero es malo». A pesar de las críticas, el análisis artificial de la empresa de evaluación comparativa señaló: «Grok 4 es ahora el modelo de IA líder». Problemas de confianza continua El lanzamiento de Grok 4 se produce en medio de una renovada crítica sobre el comportamiento previo de Grok en las implementaciones de los consumidores, particularmente a medida que un chatbot integrado en la red social de Musk, X. Durante las vacaciones del 4 de julio y en los días posteriores, Grok generó respuestas antisemíticas y conspiradoras que reiniciaron escrutinalmente sobre el diseño y las prácticas de gobernanza del sistema. Según lo informado por mi colega de VentureBeat, Michael F. Nuñez, Grok respondió a las preguntas sobre la influencia judía en Hollywood afirmando que los ejecutivos judíos «dominan el liderazgo» en los principales estudios e influyen en el contenido a través de «ideologías progresivas», y continuó que despotricaban sobre las personas de las personas de los derechos judíos como el «patrón» de «la participación de la» actividad extrema de izquierda «y sugería a Hitler», sabía «, sabía». tiempo «, una aparente referencia al Holocausto. La publicación conspiradora y antisemita fue tan prolífica, la Liga Anti-Defamación (ADL), una preeminente que combate el antisemitismo y el odio sin fines de lucro con sede en los Estados Unidos, publicado el 8 de julio: «Lo que estamos viendo de Grok LLM en este momento es irreponible, peligroso y antisemítico, simple y simple. Este supercarectivo de la extrema remo será solo que el Rhetoric extremo y fomente el Amplio y el Amplifique el Amplifique el Amplio Amplio Amplio Amplio Amplifique el Amsememismo. X y muchas otras plataformas «. Este incidente sigue un historial de resultados problemáticos de GROK, incluido un caso de mayo de 2025 en el que el BOT Grok integrado en X insertó X al azar referencias a un «genocidio blanco» completamente no sensible en Sudáfrica en consultas no relacionadas, y un caso anterior en el que se descubrió el Sistema de su Sistema para el Sistema J. de información errónea. En ambos casos, Xai culpó a los comportamientos a los empleados no identificados y declaró que estaban siendo abordados. Hoy, hoy, los usuarios de Grok 4 en la aplicación de consumo han observado que una vez más está generando comentarios antisionistas y antisemitas: como señalé anteriormente, Musk ha declarado abiertamente en varias ocasiones que quería alterar a Grok para reflejar mejor sus creencias personales y desconfianza en los principales medios de comunicación y fuentes acreditadas. Esto lo convierte en una fuente pobre en los contextos empresariales donde tales puntos de vista podrían afectar negativamente a los usuarios y a las empresas que se construyen sobre la familia de modelos Grok. Mi recomendación previa sigue siendo: para aquellos en la empresa que intentan garantizar que los productos de IA de su negocio funcionen correctamente y con precisión … Lamentablemente, Grok es mejor evitado. Afortunadamente, hay muchas otras alternativas para elegir. Insights diarias sobre casos de uso de negocios con VB diariamente Si desea impresionar a su jefe, VB Daily lo tiene cubierto. Le damos la cuenta interior de lo que las empresas están haciendo con la IA generativa, desde cambios regulatorios hasta implementaciones prácticas, por lo que puede compartir ideas para el ROI máximo. Lea nuestra Política de privacidad Gracias por suscribirse. Mira más boletines de VB aquí. Ocurrió un error.

Todo lo que necesitas saber sobre tecnología

Elon Musk presentó a Grok 4 anoche, llamándolo la ‘IA más inteligente del mundo’, lo que las empresas necesitan saber

Deja una respuesta Cancelar la respuesta

Elon Musk presentó a Grok 4 anoche, llamándolo la ‘IA más inteligente del mundo’, lo que las empresas necesitan saber

Huawei Pura 80 Ultra anunció con una cámara de teleobjetivo conmutable

Las mejores ofertas de Prime Day 3 2025: nuestras más de 130 ventas favoritas viven ahora

Deja una respuesta Cancelar la respuesta