テキストから生まれる宇宙
Genie 3は、Google DeepMindによって開発された画期的な汎用ワールドモデルです。テキスト、画像、またはスケッチを基に、ゲームのようでインタラクティブな、写真のようにリアルな3次元仮想世界を生成することができます。
Project Genieにおいて最近機能拡張され、Street Viewのデータを使用したグラウンディングが可能になりました。これにより、生成された現実を現実世界の画像で固定し、AIエージェントに複雑な環境をナビゲートして対話するための超現実的な空間を提供します。
3D
環境タイプ
リアルタイム
生成速度
無限
可能性
Street View
グラウンディングデータ
Genie 3の仕組み
Genie 3は、シンプルな入力を完全にプレイ可能な環境に変換し、人間とAIエージェントの両方が安全な仮想空間で現実世界のシナリオを探索、トレーニング、シミュレーションできるようにします。
入力テキスト、画像、スケッチ
➔
➔
生成ワールドモデル シミュレーション
➔
➔
出力インタラクティブな3D世界