Gemma 4のリリースは、オープンリサーチにおける重要なパラダイムシフトを示しています。高度なMixture-of-Experts (MoE) 技術と、テキスト、視覚、音声にわたるネイティブな深い指示チューニングを統合することで、Gemma 4は世界中の開発者や研究者にとってのアクセスしやすさを維持しながら、最先端のパフォーマンスを実現します。
104B
最大パラメータ (MoE)
1M
トークンコンテキストウィンドウ
4.2x
推論の高速化
89%
MMLU トップスコア
📊 最先端のベンチマーク
Gemma 4は、オープンウェイトモデルの新たな標準を確立します。以下のグラフは、主要な学術ベンチマークにおけるその優位性を示しており、前世代 (Gemma 3) を大幅に上回り、クローズドソースの巨大モデルと非常に競争力のある状態を維持しています。論理的推論とコーディング (HumanEval) に焦点を当てたことで、目覚ましい改善が見られます。
🎯 多次元的な能力
テキストのみのモデルとは異なり、Gemma 4は複数のモダリティを理解できるようにゼロから訓練されました。このレーダーチャートは、能力のバランスの取れたスケーリングを視覚化しています。視覚およびマルチリンガルタスクの拡張は、世代間の最大の飛躍を表しており、複雑なエージェントのための非常に汎用性の高い基盤を提供します。
⚙️ ハイブリッドアーキテクチャの構成
法外な推論コストなしで高いパラメータ数を実現するために、フラッグシップのGemma 4 104BはSparse Mixture-of-Experts (MoE) アーキテクチャを利用しています。このドーナツグラフはパラメータの分布を分析しています。生成中、任意の特定のトークンでアクティブになるのは約18Bのパラメータのみです。
🔍 1Mコンテキストウィンドウ検索
コンテキストの長さは、オープンウェイトエコシステムでは前例のない100万トークンに拡張されました。この折れ線グラフは、「Needle In A Haystack (干し草の山から針を探す)」の検索精度を示しています。印象的なことに、Gemma 4はコンテキストウィンドウが最大限界に近づいても、ほぼ完璧なリコールを維持しています。
Gemma 4 エコシステム
Gemma 4 9B
オンデバイスでの展開とモバイルエッジコンピューティングに最適化された、超軽量で密なアーキテクチャ。
Gemma 4 27B
完璧な中間点。ローカルワークステーション向けの優れたコーディングと推論を提供する密なアーキテクチャ。
Gemma 4 104B MoE
フラッグシップのMoEモデル。サーバークラスのハードウェアを必要とする、クローズドシステムに匹敵するエンタープライズグレードの機能。