AI tingkat doktor? Peluncuran Grok 4 oleh Musk XAI: Fitur inferensi multi-agen dan pasar prediksi dalam satu tampilan.

Question

Perusahaan kecerdasan buatan xAI yang dipimpin oleh Musk secara resmi meluncurkan model AI generasi terbaru, Grok 4, beberapa jam yang lalu, yang diklaim sebagai "AI tercerdas di dunia". Model ini menggabungkan kemampuan penalaran yang belum pernah ada sebelumnya, tingkat akademik setara doktor, dan integrasi penggunaan berbagai alat, serta memecahkan rekor dalam berbagai pengujian benchmark. Ia memperkirakan Grok 4 akan membawa penemuan teknis atau makna akademis yang substansial dalam satu tahun.

Memperkenalkan Grok 4, model AI terkuat di dunia. Tonton siaran langsung sekarang:

— xAI (@xai) 10 Juli 2025

Dua versi: Grok 4 dan Grok 4 Heavy

Pertama, Grok 4 dibagi menjadi versi agen tunggal (Single-Agent Version) dari Grok 4, serta versi agen multi (Multi-Agent Version) dari Grok 4 Heavy.

Grok 4: Versi dasar, menggunakan satu agen AI untuk menangani masalah.

Grok 4 Heavy: Menggunakan model kolaborasi multi-agen (multi-agent collaboration), memungkinkan beberapa agen untuk menyelesaikan masalah masing-masing terlebih dahulu, kemudian saling berbagi solusi dan membandingkan hasil satu sama lain seperti "kelompok belajar", dan akhirnya mendapatkan jawaban akhir.

Saat ini, perusahaan juga telah meluncurkan rencana langganan termahal hingga saat ini "SuperGrok Heavy", seharga 300 dolar per bulan. Para pelanggan yang berlangganan rencana ini dapat merasakan layanan Grok 4 Heavy lebih awal, serta mendapatkan hak prioritas untuk menggunakan fitur-fitur yang akan diluncurkan di masa depan.

Kecerdasan Tingkat Doktor: Dari Nilai SAT Penuh hingga Jenius di Semua Bidang

Selanjutnya, xAI mengklaim bahwa Grok 4 memiliki kemampuan akademis dan logika yang melampaui manusia, menjadikannya salah satu model yang paling mendekati kecerdasan buatan umum (AGI) saat ini. Ia mampu meraih hampir nilai sempurna dalam ujian tinggi seperti SAT, GRE di Amerika Serikat, dan menunjukkan pengetahuan setingkat doktor di semua disiplin ilmu.

Selain itu, Grok 4 mencetak rekor baru dalam berbagai pengujian indikator benchmark, menunjukkan batas kemampuan yang belum pernah terlihat sebelumnya. Secara spesifik termasuk:

Dalam tantangan logika matematika yang sulit seperti masalah pascasarjana (GPQA), ujian matematika Amerika (AIME 2025), dan kompetisi Olimpiade Matematika Amerika (USAMO), semua peringkat tertinggi di antara model AI yang ada.

Dalam simulasi pengujian operasi bisnis mesin penjual otomatis Vending-Bench, berhasil menggandakan pendapatan aset, menunjukkan kemampuan perumusan strategi yang stabil dan konsisten.

Pusat Penelitian Biomedis ARC Institute menggunakan Grok 4 untuk mengotomatiskan proses penelitian mereka dan mendorong pelaksanaan eksperimen dengan efisiensi tinggi.

Bidang lain seperti pemeriksaan pencitraan medis, perumusan strategi keuangan, dan pengembangan permainan juga telah memiliki aplikasi nyata.

Sementara itu, dalam Ujian Terakhir Kemanusiaan (, HLE), Grok 4 dapat menyelesaikan 25,4% soal tanpa bantuan, versi Grok 4 Heavy dapat menyelesaikan 44,4% soal, menjadikannya yang terbaik di antara model AI yang ada.

Menggunakan superkomputer Colossus untuk melatih Grok 4, efisiensi komputasi meningkat pesat.

xAI mengungkapkan bahwa lahirnya Grok 4 adalah hasil dari lompatan ganda dalam perangkat keras dan strategi pelatihan: "Jumlah pelatihan Grok 4 adalah 100 kali lipat dari Grok 2."

Dengan superkomputer Colossus kami yang memiliki sekitar 200.000 H100 GPU, dari pra-pelatihan hingga pembelajaran penguatan (RLHF), Grok 4 memperkuat fokus dan akurasi model dalam tugas inferensi.

Tim menekankan bahwa dengan sulitnya soal yang ditulis manusia kini "tidak dapat melatih" Grok 4 secara efektif, dunia nyata akan menjadi tempat ujian terakhir, seperti apakah benar-benar dapat menciptakan penemuan atau teknologi yang berguna, sebagai penilaian apakah mereka benar-benar efektif.

Integrasi alat dan interaksi dengan realitas: Grok 4 menuju AI yang dapat dioperasikan

Sementara itu, Grok 4 tidak hanya akan berpikir, tetapi juga akan belajar bagaimana menyelesaikan masalah dunia nyata. xAI menunjukkan bahwa, berbeda dengan model lainnya, Grok 4 mengintegrasikan kemampuan penggunaan alat ke dalam proses pelatihan, meningkatkan kemampuan praktis dan respons.

Dalam beberapa bulan ke depan, Grok 4 akan terhubung dengan alat analisis teknik yang digunakan oleh Tesla dan SpaceX, memasuki lingkungan teknik yang lebih canggih. Kami juga berencana untuk menyediakan alat tingkat perusahaan yang kuat dan simulator fisika yang sangat akurat kepada berbagai perusahaan sebelum akhir tahun ini.

Tim menambahkan, "Tujuan saat ini adalah agar Grok dapat mengendalikan robot humanoid Optimus, dan memverifikasi kebenaran dan efektivitas logika serta kreativitasnya di dunia fisik."

(Jensen Huang dari Nvidia: Chip Huawei telah mengejar NVIDIA H20, robot Optimus Elon Musk membuka peluang bisnis triliunan )

Melebihi kemampuan penalaran manusia: Dapatkah Grok 4 menciptakan penemuan baru?

Selanjutnya adalah fungsi penalaran yang paling dibanggakan oleh xAI. Grok 4 tidak hanya dapat mengekstrak pengetahuan dari data pelatihan, tetapi juga memiliki kemampuan berpikir logis yang dikembangkan melalui pelatihan yang diperkuat, mampu membangun solusi masalah secara mandiri dalam situasi yang tidak diketahui, dan melakukan verifikasi pemikiran kolektif multi-agen, akhirnya menyimpulkan sendiri seperti ilmuwan manusia:

Grok 4 dirancang sebagai cara berpikir yang berasal dari "prinsip pertama", mampu menemukan masalah sendiri, membangun logika, dan menyelesaikan deduksi kompleks, ini adalah bidang penalaran yang sulit dijangkau oleh AI lainnya.

xAI memperkirakan, Grok 4 akan menemukan teknologi baru yang benar-benar praktis paling cepat tahun ini dan paling lambat tahun depan, serta mungkin menemukan prinsip ilmiah yang saat ini belum diketahui oleh manusia dalam dua tahun ke depan.

(Wawancara dengan Musk: Kecerdasan Super AI akan Meledak, Pengusaha Harus Mengejar Kehidupan yang "Berguna" dan Bukan "Hebat")

Dari perkiraan pasar hingga penciptaan game: Aplikasi Grok 4 kembali diperluas

Akhirnya, xAI juga menunjukkan potensi aplikasi nyata Grok 4 di berbagai bidang seperti interaksi suara dan bisnis keuangan. Sebagai contoh, dalam membaca tren peristiwa, Grok 4 Heavy dapat melihat pasar prediksi Polymarket, menggunakan kemampuan statistik dan penalaran, hanya dalam beberapa menit dapat memprediksi bahwa peluang Dodgers untuk menang di World Series adalah 21,6%, menunjukkan kemampuan komputasi waktu nyata yang melampaui alat analisis kuantitatif tradisional.

Grok 4 memperkirakan persentase kemenangan tim Dodgers di World Series MLB melalui data Polymarket

(X mengumumkan kemitraan dengan Polymarket, sebagai mitra pasar prediksi resmi )

Visi masa depan Grok juga sangat mengesankan, xAI menyatakan, versi mendatang akan menambahkan kemampuan pemahaman video dan interaksi permainan, yang mampu memainkan permainan dan menilai apa yang disebut "kesenangan", bahkan mengintegrasikan mesin permainan untuk menciptakan konten interaktif dan seni sendiri. Termasuk program televisi, film, dan permainan video.

Dalam hal suara, Grok 4 mengalami peningkatan signifikan. Model versi baru ini memperkenalkan berbagai gaya suara dan aksen, menjadikan percakapan lebih alami dan lancar. Dalam acara peluncuran, juga sengaja dibandingkan dengan GPT, menyoroti bahwa Grok 4 tidak hanya tidak mengganggu pengguna, tetapi juga secara signifikan mengurangi waktu keterlambatan dalam berpikir dan merespons, menjadi salah satu sorotan dari antarmukanya.

Grok 4 bukan hanya alat, tetapi juga pendorong peradaban manusia

Kelahiran Grok 4 tidak hanya mewakili AI yang memasuki tahap pemikiran dan aplikasi yang lebih dalam, menurut Musk, tetapi juga diharapkan dapat memicu revolusi cerdas yang melintasi pendidikan, sains, bisnis, dan industri kreatif, di mana Grok akan benar-benar berpartisipasi, bukan hanya sebagai model bahasa atau alat bantu yang membantu dari samping.

Tim pengembang xAI memiliki visi masa depan yang besar dan radikal, mereka menekankan: "AI kini tidak lagi hanya membantu kita berpikir, tetapi juga menciptakan dunia bersama kita."

Artikel ini Doktoral AI? Elon Musk xAI meluncurkan Grok 4: multi-agen inferensi, fungsi prediksi pasar sekaligus dilihat Pertama kali muncul di Berita Blockchain ABMedia.