¿IA de nivel doctoral? Musk XAI lanza Grok 4: razonamiento multiagente y funciones de mercado de predicción todo en uno.

Question

La empresa de inteligencia artificial xAI, liderada por Musk, presentó hace unas horas su última generación de modelos de IA, Grok 4, que se autodenomina como "la IA más Satoshi del mundo". Este modelo combina una capacidad de razonamiento sin precedentes, un nivel académico de doctorado y la integración de múltiples herramientas, y ha establecido récords en varias pruebas de indicadores de referencia. Se espera que Grok 4 aporte invenciones tecnológicas o significados académicos sustanciales en un año.

Presentamos Grok 4, el modelo de IA más poderoso del mundo. Mira la transmisión en vivo ahora:

— xAI (@xai) 10 de julio de 2025

Dos versiones: Grok 4 y Grok 4 Heavy

Primero, Grok 4 se divide en la versión de agente único (Single-Agent Version) de Grok 4, y la versión de múltiples agentes (Multi-Agent Version) de Grok 4 Heavy.

Grok 4: Versión básica, que utiliza un único agente de IA para resolver problemas.

Grok 4 Heavy: Adoptando un modo de colaboración multiagente (multi-agent collaboration), permitiendo que múltiples agentes resuelvan problemas individualmente, luego compartan soluciones y comparen resultados entre sí como un "grupo de aprendizaje", para finalmente llegar a la respuesta final.

Actualmente, la empresa también ha lanzado el plan de suscripción más caro hasta la fecha, "SuperGrok Heavy", a 300 dólares al mes. Los suscriptores del plan podrán experimentar primero el servicio Grok 4 Heavy y tendrán prioridad en el uso de las funciones que se lancen en el futuro.

Nivel de inteligencia de doctorado: de la puntuación perfecta en SAT a genio en todos los campos

Además, xAI afirma que Grok 4 tiene capacidades académicas y lógicas que superan a las humanas, convirtiéndose en uno de los modelos más cercanos a la inteligencia artificial general (AGI) en esta etapa. Puede obtener casi la máxima puntuación en exámenes de nivel superior como el SAT y el GRE en Estados Unidos, y muestra un conocimiento equivalente al de un doctorado en todas las disciplinas.

Además, Grok 4 ha establecido nuevos máximos en múltiples pruebas de indicadores de referencia, mostrando límites de capacidad sin precedentes. Específicamente incluye:

Los desafíos de lógica matemática de alta dificultad, como el problema de posgrado difícil (GPQA), el examen de matemáticas estadounidense (AIME 2025) y la competencia de matemáticas olímpica estadounidense (USAMO), se clasifican como los primeros en los modelos de IA existentes.

En la simulación de operaciones comerciales de la máquina expendedora Vending-Bench, se logró duplicar los ingresos de activos, demostrando una capacidad de formulación de estrategias estable y consistente.

El ARC Institute del Centro de Investigación Biomédica utiliza Grok 4 para automatizar sus procesos de investigación, promoviendo de manera eficiente la realización de experimentos.

Otros campos como la exploración de imágenes médicas, la formulación de estrategias financieras y el desarrollo de juegos ya tienen aplicaciones prácticas.

Al mismo tiempo, en el examen final de la humanidad (Humanity’s Last Exam, HLE), Grok 4 puede resolver el 25.4% de los problemas sin asistencia, mientras que la versión Grok 4 Heavy puede resolver el 44.4% de los problemas, ocupando el primer lugar entre los modelos de IA existentes.

Usar la supercomputadora Colossus para entrenar Grok 4, mejora significativa en la eficiencia de cálculo.

xAI reveló que el lanzamiento de Grok 4 se debe a un doble salto en hardware y estrategias de entrenamiento: "El volumen de entrenamiento de Grok 4 es 100 veces el de Grok 2."

A través de nuestra supercomputadora Colossus con aproximadamente 200,000 GPUs H100, desde el preentrenamiento hasta el aprendizaje por refuerzo (RLHF), Grok 4 ha mejorado la concentración y precisión del modelo en tareas de inferencia.

El equipo enfatiza que, dado que la dificultad de las preguntas formuladas por humanos ya no puede "entrenar efectivamente" a Grok 4, el mundo real se convertirá en el lugar de prueba final, como si realmente se pudiera crear invenciones o tecnologías útiles, para juzgar si son efectivas en la práctica.

Integración de herramientas e interacción con la realidad: Grok 4 hacia una IA operativa

Al mismo tiempo, Grok 4 no solo pensará, sino que también aprenderá a resolver problemas del mundo real. xAI ha indicado que, a diferencia de otros modelos, Grok 4 incorpora la capacidad de uso de herramientas en su proceso de entrenamiento, mejorando así la capacidad de implementación y respuesta:

En los próximos meses, Grok 4 se integrará con las herramientas de análisis de ingeniería utilizadas por Tesla y SpaceX, ingresando a un entorno de ingeniería más preciso. También planeamos ofrecer herramientas empresariales potentes y simuladores físicos de alta precisión a las grandes empresas antes de finales de este año.

El equipo complementa: "El objetivo actual es permitir que Grok controle el robot humanoide Optimus y valide en el mundo físico la verdad y efectividad de su lógica y creatividad."

(Jensen Huang de NVIDIA: los chips de Huawei ya han alcanzado a NVIDIA H20, el robot Optimus de Musk abre oportunidades de negocio de billones )

¿Superar la capacidad de razonamiento humano: ¿Grok 4 puede crear nuevas invenciones?

A continuación, la función de razonamiento de la que xAI se enorgullece, Grok 4, no solo puede extraer conocimiento de los datos de entrenamiento, sino que también posee la capacidad de pensar lógicamente cultivada a través del entrenamiento reforzado, lo que le permite construir soluciones a problemas en situaciones desconocidas y realizar una verificación colectiva de razonamiento multi-agente, llegando finalmente a deducir sus propias conclusiones como un científico humano:

Grok 4 fue diseñado como un enfoque de pensamiento que parte de los "primeros principios", capaz de descubrir problemas por sí mismo, construir lógica y completar deducciones complejas, un ámbito de razonamiento que otras IA anteriores difícilmente podían alcanzar.

xAI espera que Grok 4 invente una nueva tecnología realmente útil a más tardar este año, y que en los próximos dos años pueda descubrir principios científicos que actualmente son desconocidos para la humanidad.

(Entrevista a Musk: La superinteligencia AI estallará, los emprendedores deben perseguir una vida "útil" en lugar de "grandiosa" )

Desde la predicción del mercado hasta la creación de juegos: la capa de aplicación de Grok 4 se expande una vez más.

Finalmente, xAI también mostró el potencial de aplicación práctica de Grok 4 en múltiples campos como la interacción de voz y los negocios financieros. Tomando como ejemplo la interpretación de tendencias de eventos, Grok 4 Heavy puede consultar el mercado de predicciones Polymarket, utilizando cálculos estadísticos y habilidades de razonamiento, y en solo unos minutos predecir que la probabilidad de victoria de los Dodgers en la Serie Mundial es del 21.6%, demostrando su poder de cálculo en tiempo real que supera a las herramientas de análisis cuantitativo tradicionales.

Grok 4 a través de datos de Polymarket estima la probabilidad de victoria de los Dodgers en la Serie Mundial de MLB.

(X anuncia una colaboración con Polymarket, como socio oficial del mercado de predicciones )

La visión futura de Grok también es impresionante. xAI ha declarado que las futuras versiones incluirán la comprensión de videos y la capacidad de interactuar con juegos, pudiendo jugar juegos y juzgar lo que se considera "diversión", e incluso integrar motores de juegos para crear contenido interactivo y artístico por sí mismos. Esto incluye programas de televisión, películas y videojuegos.

En el aspecto de la voz, Grok 4 también ha tenido una actualización significativa en su rendimiento. El nuevo modelo introduce varios estilos de voz y acentos, haciendo que las conversaciones sean más naturales y fluidas. Durante la presentación, se hizo una comparación deliberada con GPT, destacando que Grok 4 no solo no interrumpe a los usuarios, sino que también reduce considerablemente el tiempo de reflexión y respuesta, convirtiéndose en un gran punto destacado de su interfaz.

Grok 4 no es solo una herramienta, sino un impulsor de la civilización humana.

El nacimiento de Grok 4 no solo representa una etapa más profunda de pensamiento y aplicación de la IA, según Musk, también se espera que desencadene una revolución inteligente que abarque la educación, la ciencia, los negocios y las industrias creativas, y Grok realmente participará en ello, en lugar de ser solo un modelo de lenguaje o herramienta auxiliar.

El futuro visión del equipo de desarrollo de xAI es grandiosa y radical, enfatizan: "La IA ya no solo nos ayuda a pensar, sino que crea el mundo junto a nosotros."

Este artículo ¿AI de nivel doctoral? Elon Musk xAI lanza Grok 4: razonamiento multiagente, funciones de predicción del mercado, todo en uno. Apareció por primera vez en Chain News ABMedia.