Google DeepMind アーキテクチャレポート

Gemini Robotics-ER 1.6

ロボット工学にエージェント機能をもたらす、最も高度な身体化推論モデル。これまでにない空間推論、強化された自律性、そして過去最高の安全コンプライアンスを備えています。

VLM
Vision-Language Model
+10%
動画リスク検出の向上
1.6
モデル世代

強化された自律性

Gemini Robotics-ER 1.6は、ロボットに強化された自律性を導入し、オープンエンドな環境での推論、適応、変化への対応を可能にします。自然言語での対話を複雑なタスクの割り当てに変換します。複雑な視覚データを解釈し、空間推論を実行することで、ロボットはシームレスにアクションを計画できます。

  • check_circle自然言語コマンドをサブタスクに分解。
  • check_circleオブジェクト間の関係を理解し、動的なシーンを解釈。
  • check_circle既存のロボットコントローラーと統合し、長期的なタスクを完了。

過去最も安全なロボティクスモデル

身体化推論において安全性は最優先事項です。Gemini Robotics-ER 1.6は、敵対的な空間推論タスクにおける安全ポリシーへの優れた準拠を示しています。Gemini 3.0 Flashと比較して、物理的な安全制約を遵守する能力が大幅に向上しており、テキストや動画のシナリオにおける負傷リスクを正確に認識します。