Gemma 4: 次世代のオープンモデル

Gemma 4のリリースは、オープンリサーチにおける重要なパラダイムシフトを示しています。高度なMixture-of-Experts (MoE) 技術と、テキスト、視覚、音声にわたるネイティブな深い指示チューニングを統合することで、Gemma 4は世界中の開発者や研究者にとってのアクセスしやすさを維持しながら、最先端のパフォーマンスを実現します。

🧠

104B

最大パラメータ (MoE)

📜

1M

トークンコンテキストウィンドウ

⚡

4.2x

推論の高速化

🏆

89%

MMLU トップスコア

📊 最先端のベンチマーク

Gemma 4は、オープンウェイトモデルの新たな標準を確立します。以下のグラフは、主要な学術ベンチマークにおけるその優位性を示しており、前世代 (Gemma 3) を大幅に上回り、クローズドソースの巨大モデルと非常に競争力のある状態を維持しています。論理的推論とコーディング (HumanEval) に焦点を当てたことで、目覚ましい改善が見られます。

重要なポイント: Gemma 4 (104B) は、以前の世代に比べて平均18%の改善を示しており、複雑なコーディングと数学のタスクで80%のしきい値を超えています。

🎯 多次元的な能力

テキストのみのモデルとは異なり、Gemma 4は複数のモダリティを理解できるようにゼロから訓練されました。このレーダーチャートは、能力のバランスの取れたスケーリングを視覚化しています。視覚およびマルチリンガルタスクの拡張は、世代間の最大の飛躍を表しており、複雑なエージェントのための非常に汎用性の高い基盤を提供します。

重要なポイント: このモデルは信じられないほどバランスの取れたプロファイルを示しています。もはや単なるコーディングやテキストの強力なモデルではなく、深い空間的および言語的知能を備えた統合されたマルチモーダルエンジンです。

⚙️ ハイブリッドアーキテクチャの構成

法外な推論コストなしで高いパラメータ数を実現するために、フラッグシップのGemma 4 104BはSparse Mixture-of-Experts (MoE) アーキテクチャを利用しています。このドーナツグラフはパラメータの分布を分析しています。生成中、任意の特定のトークンでアクティブになるのは約18Bのパラメータのみです。

重要なポイント: MoEルーティングメカニズムにより、膨大な知識の保存 (スパースエキスパート) が可能になる一方で、コアの密なレイヤーはリーンに保たれ、計算効率が最大化されます。

🔍 1Mコンテキストウィンドウ検索

コンテキストの長さは、オープンウェイトエコシステムでは前例のない100万トークンに拡張されました。この折れ線グラフは、「Needle In A Haystack (干し草の山から針を探す)」の検索精度を示しています。印象的なことに、Gemma 4はコンテキストウィンドウが最大限界に近づいても、ほぼ完璧なリコールを維持しています。

重要なポイント: ユーザーは、コードベース全体、複数の書籍、または長文の財務レポートを入力しても、モデルがコンテキストウィンドウの端で大幅な劣化なしに情報を正確に抽出できると確信できます。

Gemma 4 エコシステム

📱

Gemma 4 9B

オンデバイスでの展開とモバイルエッジコンピューティングに最適化された、超軽量で密なアーキテクチャ。

バランス

💻

Gemma 4 27B

完璧な中間点。ローカルワークステーション向けの優れたコーディングと推論を提供する密なアーキテクチャ。

🏗️

Gemma 4 104B MoE

フラッグシップのMoEモデル。サーバークラスのハードウェアを必要とする、クローズドシステムに匹敵するエンタープライズグレードの機能。