GENIE 3

Google DeepMindの無限のワールドモデル

テキストから生まれる宇宙

Genie 3は、Google DeepMindによって開発された画期的な汎用ワールドモデルです。テキスト、画像、またはスケッチを基に、ゲームのようでインタラクティブな、写真のようにリアルな3次元仮想世界を生成することができます。

Project Genieにおいて最近機能拡張され、Street Viewのデータを使用したグラウンディングが可能になりました。これにより、生成された現実を現実世界の画像で固定し、AIエージェントに複雑な環境をナビゲートして対話するための超現実的な空間を提供します。

3D
環境タイプ
リアルタイム
生成速度
無限
可能性
Street View
グラウンディングデータ

Genie 3の仕組み

Genie 3は、シンプルな入力を完全にプレイ可能な環境に変換し、人間とAIエージェントの両方が安全な仮想空間で現実世界のシナリオを探索、トレーニング、シミュレーションできるようにします。

入力テキスト、画像、スケッチ
生成ワールドモデル シミュレーション
出力インタラクティブな3D世界