Doktora seviyesi AI? Musk'ın XAI'si Grok 4'ü tanıttı: Çoklu ajan akıl yürütme, tahmin pazarı işlevi bir arada.

Question

Musk'ın liderliğindeki yapay zeka şirketi xAI, birkaç saat önce en son nesil AI modeli Grok 4'ü tanıttı ve bunu "dünyanın en zeki AI'sı" olarak adlandırdı. Bu model, eşi benzeri görülmemiş bir akıl yürütme kapasitesini, doktora seviyesinde akademik standartları ve çoklu araçların entegrasyonunu bir araya getiriyor ve birçok benchmark testinde rekorlar kırdı. Grok 4'ün bir yıl içinde somut teknolojik icatlar veya akademik anlamlar getirmesini bekliyor.

Dünyanın en güçlü AI modeli Grok 4'ü tanıtıyoruz. Şimdi canlı yayını izleyin:

— xAI (@xai) 10 Temmuz 2025

İki versiyon: Grok 4 ve Grok 4 Heavy

Öncelikle, Grok 4, basit bir tek ajan versiyonu (Single-Agent Version) olan Grok 4 ve çok ajan versiyonu (Multi-Agent Version) olan Grok 4 Heavy olarak ikiye ayrılır.

Grok 4: Temel versiyon, tek bir AI ajanı ile sorunları işleme.

Grok 4 Heavy: Çoklu ajan işbirliği modeli (multi-agent collaboration) kullanarak, birden fazla ajan önce kendi başına problemleri çözmekte, ardından bir "öğrenme grubu" gibi birbirleriyle çözüm önerilerini paylaşmakta ve sonuçlarını karşılaştırmakta, en sonunda nihai cevabı elde etmektedir.

Şu anda, şirket en pahalı abonelik planı olan "SuperGrok Heavy"'i aylık 300 dolara sunuyor. Plan aboneleri, Grok 4 Heavy hizmetini önceden deneyimleyebilir ve gelecekte sunulacak özelliklere öncelikli erişim hakkına sahip olacak.

Doktora Seviyesi Zeka: SAT Tam Puanından Tüm Alanlarda Dahiye

Ayrıca, xAI, Grok 4'ün insanı aşan akademik ve mantıksal yeteneklere sahip olduğunu iddia ederek, şu anda genel yapay zekaya (AGI) en yakın modellerden biri olduğunu öne sürüyor. ABD'deki SAT, GRE gibi yüksek lisans sınavlarında neredeyse tam puan alabiliyor ve tüm disiplinlerde doktora seviyesinde bilgi birikimi sergiliyor.

Ayrıca, Grok 4 birçok gösterge benchmark testinde yeni zirveler kaydederek daha önce görülmemiş yetenek sınırlarını sergiledi. Bunlar arasında şunlar yer alıyor:

Zor lisansüstü sorunlar (GPQA), Amerikan matematik sınavı (AIME 2025), Amerikan Matematik Olimpiyatı (USAMO) gibi yüksek zorlukta matematiksel mantık zorlukları mevcut AI modelleri arasında birinci sıradadır.

Vending-Bench otomatik satış makinesi işletim simülasyon testinde, varlık gelirinin iki katına çıkmasını başardı, istikrarlı ve sürekli bir strateji geliştirme yeteneğini gösterdi.

Biyomedikal Araştırma Merkezi ARC Institute, araştırma süreçlerini otomatikleştirmek için Grok 4 kullanarak deneylerin ilerlemesini yüksek verimlilikle teşvik etmektedir.

Diğer yandan, tıbbi görüntüleme, finansal strateji geliştirme ve oyun geliştirme gibi alanlarda da pratik uygulamalar mevcuttur.

Aynı zamanda, insanlığın son sınavı (Humanity’s Last Exam, HLE)'da, Grok 4, yardımcı olmadan %25.4'lük bir soruyu çözebiliyor; Grok 4 Heavy versiyonu ise %44.4'lük bir soruyu çözebiliyor ve mevcut AI modelleri arasında birinci sırada yer alıyor.

Colossus süper bilgisayarını Grok 4'ü eğitmek için kullanarak hesaplama verimliliğini büyük ölçüde artırın.

xAI, Grok 4'ün piyasaya sürülmesinin arkasında donanım ve eğitim stratejilerinde iki katına çıkan bir sıçrama olduğunu açıkladı: "Grok 4'ün eğitim miktarı Grok 2'nin 100 katı."

Yaklaşık 200,000 H100 GPU'ya sahip Colossus süper bilgisayarımız sayesinde, ön eğitimden pekiştirmeli öğrenme (RLHF)'e kadar, Grok 4 modelin çıkarım görevlerine odaklanma ve doğruluğunu artırdı.

Ekip, insan tarafından yazılan sınavların zorluk seviyesinin artık Grok 4'ü "etkili bir şekilde eğitemediğini" vurguladı; gerçek dünya, gerçekten faydalı icatlar veya teknolojiler yaratıp yaratamayacakları gibi, bunların gerçekten etkili olup olmadığını belirlemek için nihai test alanı olacak.

Araç entegrasyonu ve gerçek dünya etkileşimi: Grok 4, uygulanabilir AI'ya doğru

Aynı zamanda, Grok 4 sadece düşünmekle kalmayacak, gerçek dünya problemlerini çözmeyi de öğrenecek. xAI, diğer modellerden farklı olarak, Grok 4'ün araç kullanma yeteneğini eğitim sürecine dahil ettiğini, uygulama ve tepki yeteneklerini artırdığını belirtti:

Önümüzdeki birkaç ay içinde, Grok 4, Tesla ve SpaceX tarafından kullanılan mühendislik analiz araçlarına entegre olacak ve daha hassas mühendislik ortamlarına girecek. Ayrıca, bu yılın sonuna kadar büyük şirketlere güçlü kurumsal araçlar ve yüksek hassasiyetli fiziksel simülatörler sunmayı planlıyoruz.

Ekip, "Mevcut hedef, Grok'ın Optimus humanoid robotunu kontrol etmesini sağlamak ve fiziksel dünyada mantığının ve yaratıcılığının gerçekliğini ve geçerliliğini doğrulamaktır."

( Huang Renxun: Huawei çipleri NVIDIA H20'yi yakaladı, Musk'ın Optimus robotu trilyon dolarlık fırsatları açıyor )

İnsanın akıl yürütme yeteneğini aşmak: Grok 4 yeni icatlar mı yaratabilir?

Son olarak, xAI'nin en çok övündüğü çıkarım yeteneği Grok 4, yalnızca eğitim verilerinden bilgi çıkarmakla kalmayıp, aynı zamanda pekiştirme eğitimi ile geliştirilmiş mantıksal düşünme yeteneğine de sahip. Bilinmeyen durumlarda kendi başına problem çözme yöntemleri geliştirebilir ve çoklu ajanlarla toplu düşünce doğrulaması yapabilir. Sonunda insan bilim insanları gibi kendi sonuçlarını çıkarabilir:

Grok 4, "ilk ilkeler"e dayalı bir düşünme biçimi olarak tasarlanmıştır; sorunları kendi başına keşfetme, mantık kurma ve karmaşık çıkarımları tamamlama yeteneğine sahiptir. Bu, diğer AI sistemlerinin ulaşmakta zorlandığı bir akıl yürütme alanıdır.

xAI, Grok 4'ün bu yılın en erken döneminde, en geç gelecek yıl gerçek anlamda pratik yeni teknolojiler icat edeceğini ve önümüzdeki iki yıl içinde insanların henüz bilmediği bilimsel ilkeleri keşfedebileceğini öngörüyor.

( Elon Musk ile Röportaj: AI Süper Zekası Patlayacak, Girişimciler "Faydalı" Olmayı "Büyük" Olmaktan Daha Fazla Takip Etmeli )

Piyasa tahminlerinden oyun yaratımına: Grok 4 uygulama alanları yeniden genişliyor

Son olarak, xAI, Grok 4'ün ses etkileşimi ve finansal iş dünyası gibi çok çeşitli alanlardaki pratik uygulama potansiyelini de sergiledi. Olay trendi analizine örnek olarak, Grok 4 Heavy, Polymarket'teki tahmin pazarını inceleyerek, istatistiksel hesaplama ve akıl yürütme yeteneklerini kullanarak, sadece birkaç dakikada Dodgers'ın Dünya Serisi'ndeki kazanma oranını %21.6 olarak tahmin edebiliyor ve geleneksel niceliksel analiz araçlarını aşan anında hesaplama gücünü sergiliyor.

Grok 4 Polymarket verilerini kullanarak Dodgers'ın MLB Dünya Serisi'ndeki kazanma oranını tahmin ediyor.

(X, resmi tahmin pazarı ortağı olarak Polymarket ile iş birliği yaptığını duyurdu)

Grok'un gelecekteki vizyonu da etkileyici, xAI, gelecekteki sürümlerin video anlama ve oyun etkileşim yetenekleri ekleyeceğini belirtiyor. Bu sayede oyun oynayabilir ve "eğlence" olarak adlandırılan şeyi değerlendirebilir, hatta oyun motorlarını entegre ederek kendi etkileşimli ve sanatsal içeriklerini yaratabilir. Televizyon programları, film eserleri ve video oyunları dahil.

Ses açısından, Grok 4'ün performansı da önemli bir yükseliş gösterdi. Yeni model, diyalogları daha doğal ve akıcı hale getiren çeşitli ses stilleri ve aksanlar sunuyor. Lansman etkinliğinde ayrıca GPT ile kıyaslama yapılarak, Grok 4'ün kullanıcıyı yalnızca kesmediği değil, aynı zamanda düşünme ve yanıt verme gecikme süresini de önemli ölçüde kısalttığı vurgulandı, bu da arayüzünün en büyük özelliklerinden biri haline geldi.

Grok 4 sadece bir araç değil, aynı zamanda insanlık medeniyetinin itici gücüdür.

Grok 4'ün doğuşu, yalnızca AI'nın daha derin düşünme ve uygulama aşamasına girmesini temsil etmekle kalmıyor, Musk'a göre, eğitim, bilim, ticaret ve yaratıcı endüstrileri kapsayan bir zeka devrimi başlatma potansiyeline de sahip. Grok gerçekten bu süreçte yer alacak, sadece yan planda yardımcı olan bir dil modeli veya yardımcı araç olmayacak.

xAI geliştirme ekibinin gelecekteki vizyonu büyük ve radikal. Onlar vurguluyor: "AI artık sadece bizim düşünmemize yardımcı olmuyor, aynı zamanda bizimle birlikte dünyayı yaratıyor."

Bu makale Doktora seviyesinde AI? Musk xAI Grok 4'ü tanıttı: Çoklu ajan akıl yürütme, piyasa tahmin işlevi bir arada. İlk olarak Chain News ABMedia'da yayınlandı.