Gold Financial reported that a contractor named 'Meemi' from Epoch AI revealed on the LessWrong forum that not only did OpenAI provide financial support for the FrontierMath Benchmark test, but they also obtained privileged access to the test question bank. This may also be an important reason for the significant improvement in o3's performance in a short period of time.
o3, ileri matematik çıkarımları konusunda önemli bir yeteneğe sahip olduğunu gösteriyor. Stanford Üniversitesi matematik doktora öğrencisi Carina Hong, Epoch AI'nin düzenlemesiyle OpenAI'nın FrontierMath'e ayrıcalıklı erişim hakkına sahip olduğunu iddia ediyor. Ancak bu gelişme, yüklenicinin sızdırması sonrasında itibar kaybına uğradı. Tamay Besiroglu, Epoch AI Başkan Yardımcısı ve kuruculardan biri, konuya ilişkin X platformunda hızlıca kabul etti.
Raporlara göre, FrontierMath, 60'tan fazla üst düzey matematikçinin yanı sıra Fields ödülü sahipleri ve uluslararası matematik olimpiyatı soru hazırlayıcıları da dahil olmak üzere Epoch AI işbirliğiyle oluşturulan yüksek düzeyli bir matematik çıkarım yetenekleri değerlendirme Benchmark'ıdır.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
OpenAI'nin en güçlü o3 modelinin sahtekarlık yaptığı, FrontierMath test soru bankasına önceden erişim ayrıcalığı elde ettiği ortaya çıktı.
Gold Financial reported that a contractor named 'Meemi' from Epoch AI revealed on the LessWrong forum that not only did OpenAI provide financial support for the FrontierMath Benchmark test, but they also obtained privileged access to the test question bank. This may also be an important reason for the significant improvement in o3's performance in a short period of time. o3, ileri matematik çıkarımları konusunda önemli bir yeteneğe sahip olduğunu gösteriyor. Stanford Üniversitesi matematik doktora öğrencisi Carina Hong, Epoch AI'nin düzenlemesiyle OpenAI'nın FrontierMath'e ayrıcalıklı erişim hakkına sahip olduğunu iddia ediyor. Ancak bu gelişme, yüklenicinin sızdırması sonrasında itibar kaybına uğradı. Tamay Besiroglu, Epoch AI Başkan Yardımcısı ve kuruculardan biri, konuya ilişkin X platformunda hızlıca kabul etti. Raporlara göre, FrontierMath, 60'tan fazla üst düzey matematikçinin yanı sıra Fields ödülü sahipleri ve uluslararası matematik olimpiyatı soru hazırlayıcıları da dahil olmak üzere Epoch AI işbirliğiyle oluşturulan yüksek düzeyli bir matematik çıkarım yetenekleri değerlendirme Benchmark'ıdır.