博士級 AI？マスク XAI が Grok 4 を発表：マルチエージェント推論、予測市場機能を一度に見る

Question

マスクが率いる人工知能会社 xAI が数時間前に最新世代の AI モデル Grok 4 を正式に発表し、「地球上で最もサトシな AI」と称しています。このモデルは、前例のない推論能力、博士号レベルの学術水準、そして多ツールの使用統合を組み合わせており、いくつかのベンチマークテストで記録を打ち破りました。彼は Grok 4 が一年以内に実質的な技術発明または学術的意義をもたらすと予想しています。

Grok 4を紹介します。世界で最も強力なAIモデルです。今すぐライブストリームをご覧ください。

— xAI (@xai) 2025年7月10日

2つのバージョン:Grok 4とGrok 4 Heavy

まず、Grok 4 は、シングルエージェントバージョン (シングルエージェント Version)バージョン 0192837465839201シングルエージェントバージョンのGrok 4 Heavy Version(に分かれています。

Grok 4：ベーシックバージョン、単一の AI エージェントで問題を処理します。

Grok 4 Heavy：多エージェント協力モデルを採用し、)multi-agent collaboration(を通じて、複数のエージェントがそれぞれ問題を解決し、その後「学習グループ」のように互いに解決策を共有し合い、成果を比較して最終的な答えを導き出します。

現在、この会社は現時点で最も高価なサブスクリプションプラン「SuperGrok Heavy」を月額300ドルで提供しています。このプランのサブスクライバーは、Grok 4 Heavyサービスを先行体験でき、今後リリースされる機能の優先使用権を得ることができます。

博士レベルの知恵：SAT満点から全分野の天才へ

さらに、xAIはGrok 4が人間を超える学術的および論理的能力を持ち、現段階で最も汎用人工知能)AGI(に近いモデルの一つであると主張しています。彼はアメリカのSAT、GREなどの高等試験でほぼ満点を獲得し、すべての科目で博士以上のレベルの知識を示しています。

また、Grok 4は複数の指標ベンチマークテストで新記録を樹立し、前例のない能力の限界を示しました。具体的には：

困難な大学院生の問題 )GPQA(、アメリカの数学試験 )AIME 2025(、アメリカ数学オリンピック競技会 )USAMO( などの高難度の数理論理チャレンジは、現行のAIモデルの中で第一位にランクされています。

Vending-Bench自動販売機ビジネスオペレーションシミュレーションテストで、資産収入を倍増させることに成功し、安定した一貫した戦略策定能力を示しました。

生物医学研究センター ARC Institute は Grok 4 を使用して研究プロセスの自動化を支援し、高効率で実験を進めています。

その他にも、医療画像検査、金融戦略の策定、ゲーム開発などの分野で実際の応用が存在しています。

同時、人類の最終試験)Humanity’s Last Exam、HLE(において、Grok 4は補助なしで25.4%の問題を解くことができ、Grok 4 Heavyバージョンは44.4%の問題を解くことができ、既存のAIモデルの中で1位にランクされています。

Colossusスーパーコンピュータを使用してGrok 4をトレーニングし、計算効率が大幅に向上しました。

xAIは、Grok 4の誕生の背後に、ハードウェアとトレーニング戦略の二重の飛躍があることを明らかにしました：「Grok 4のトレーニング量はGrok 2の100倍です。」

私たちのColossusスーパーコンピュータ約20万個のH100 GPUを利用して、事前学習から強化学習)RLHF(まで、Grok 4はモデルの推論タスクへの集中力と精度を強化しました。

チームは、人間が作成した試験の難易度が「効果的にGrok 4を訓練できない」ため、現実世界が最終的なテストの場になると強調しています。実際に役立つ発明や技術を創造できるかどうかを通じて、それらが実際に効果的であるかどうかを判断します。

ツール統合と現実とのインタラクション：Grok 4 実用的なAIへの道

同時、Grok 4 は単に考えるだけでなく、実世界の問題を解決する方法も学びます。xAI は、他のモデルとは異なり、Grok 4 がツールの使用能力をトレーニングプロセスに組み込むことで、実践と応用能力を向上させることを示しています。

今後数ヶ月以内に、Grok 4はテスラとSpaceXで使用されるエンジニアリング分析ツールに接続し、より精密なエンジニアリング環境に入ります。私たちはさらに、今年末までに各大企業に強力なエンタープライズレベルのツールと高度に精密な物理シミュレーターを提供する計画です。

チームは補足して言った。「現在の目標は、Grokが人型ロボットOptimusを操縦し、物理的な世界でその論理と創造性の真実性と有効性を検証することです。」

)輝達黄仁勲：華為のチップはNVIDIA H20に追いついた、マスクのOptimusロボットが兆元のビジネスチャンスを開く(

人間の推理能力を超える：Grok 4 は新しい発明を生み出せるのか？

次に、xAIが最も誇る推論機能についてです。Grok 4は、トレーニングデータから知識を抽出できるだけでなく、強化トレーニングによって培われた論理的思考能力を持ち、未知の状況下で自ら問題解決法を構築し、複数のエージェントによる集団的な思考検証を行い、最終的に人間の科学者と同様に自らの結論を導き出します：

Grok 4は「第一性原理」から出発した思考方法として設計されており、自ら問題を発見し、論理を構築し、複雑な演繹を完成させることができます。これは他の従来のAIが難しく到達できない推論領域です。

xAIは、Grok 4が最早で今年中、最遅で来年には実用的な新技術を発明し、今後2年以内に人類がまだ知らない科学原理を発見する可能性があると期待しています。

)マスクインタビュー：AIのスーパーインテリジェンスが爆発し、起業家は「偉大」ではなく「有用」な人生を追求すべき(

市場予測からゲーム制作まで：Grok 4 アプリケーションの側面が再び拡大

最後、xAIはGrok 4が音声インタラクションや金融ビジネスなど多くの分野での実際の応用可能性を示した。イベントトレンドの解釈の例として、Grok 4 Heavyは予測市場Polymarketを確認し、統計計算と推論能力を活用して、わずか数分でドジャースのワールドシリーズでの勝率が21.6%であると予測し、従来の定量分析ツールを超えるリアルタイム計算能力を示した。

Grok 4 ポリマーケットのデータを通じてドジャースのMLBワールドシリーズにおける勝率を推定する

)XはPolymarketとの提携を発表し、公式予測市場パートナーとして(に就任します。

Grokの未来のビジョンも驚くべきものであり、xAIは今後のバージョンに動画理解とゲームインタラクションの能力を追加すると述べています。ゲームをプレイし、「楽しさ」と呼ばれるものを判断することができ、さらにはゲームエンジンを統合して自らインタラクティブなアートコンテンツを創造することができるようになります。テレビ番組、映画作品、そしてビデオゲームなどが含まれます。

音声面では、Grok 4 のパフォーマンスも大幅にアップグレードされました。新しいモデルは、さまざまな声のスタイルとアクセントを導入し、対話をより自然で流暢にしています。発表会では、GPTとの比較が意図的に行われ、Grok 4 はユーザーを中断することなく、思考と応答の遅延時間を大幅に短縮したことが強調され、そのインターフェースの大きなハイライトとなりました。

Grok 4は単なるツールではなく、人類文明の推進器です。

Grok 4 の誕生は、AI がより深い思考と応用の段階に入ったことを示すだけでなく、マスクによれば、教育、科学、ビジネス、そしてクリエイティブ産業を横断する知恵の革命を引き起こすことが期待されています。そして、Grok は本当にその中に参加することになり、単なるサポートの言語モデルや補助ツールではありません。

xAI開発チームの未来のビジョンは壮大で過激です。彼らは「AIは今や私たちの思考を助けるだけでなく、私たちと共に世界を創造するものだ」と強調しています。

この記事博士号 AI？マスク xAI が Grok 4 を発表：マルチエージェント推論、マーケット予測機能を一挙に見れる最初に登場したのは鏈ニュース ABMedia。