Los empleados de OpenAI acusan públicamente a Grok3 de tener resultados de prueba engañosos

GoldenOctober2024

2025-02-23 02:44:46

Generación de resúmenes en curso

El 23 de febrero, según los datos de Jinshi, recientemente, un empleado de OpenAI acusó públicamente a xAI, una empresa subsidiaria de Elon Musk, de publicar resultados engañosos de las pruebas de referencia del último modelo de IA, Grok3. Igor Babushkin, cofundador de xAI, afirmó firmemente que la empresa no hizo nada indebido. Los gráficos de xAI muestran que las dos versiones de Grok3, Grok3 Reasoning Beta y Grok3 mini Reasoning, superaron el rendimiento del modelo más potente actualmente disponible de OpenAI, o3-mini-high, en AIME 2025. Sin embargo, los empleados de OpenAI señalaron rápidamente en la plataforma X que los gráficos de xAI no incluían la puntuación de AIME 2025 de o3-mini-high bajo la condición de "cons@64". Babushkin argumentó en la plataforma X que OpenAI también había publicado en el pasado gráficos de pruebas de referencia engañosos similares, aunque estos gráficos se usaron para comparar el rendimiento de sus propios modelos.

GROK5.15%

XAI5.27%

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

3 me gusta