Google Labs / DeepMind発表 2026-01-29 ・レビュー 2026-06-13

Project Genieが示す世界モデルの入口

Project Genieは、画像やテキストから探索可能な世界を作り、ユーザーが動くたびに周囲をリアルタイム生成するGoogle Labsの実験です。表面だけ見ると「ゲームを自動生成するAI」に見えます。ただ、DeepMindがGenie 3をworld modelとして説明している点を踏まえると、本質はゲーム制作より広い。AIが行動を試し、失敗し、条件を変えてもう一度試せる環境を作る方向です。

3行で捉える

何が起きた: AIは文章や動画を作る段階から、行動を試せる仮想世界を作る段階へ進んでいる。
どう読む: ゲーム生成の派手さではなく、AIが行動を試す訓練環境を自分で作り始めた点で読む。
次に見る: 既存の業務手順、プロンプト、レビュー基準は、どのモデル挙動を前提にしていたか。

所属テーマ

モデル能力の再配置 AIの基盤化と流通網

モデル能力の再配置: モデルの更新は、単なる性能向上ではなく、長文、動画、コード、研究、専門領域への役割配分を変えている。Fable 5、Gemini、Opus、RSI関連の動きは、何を人が持つかを再設計させる。

このテーマの流れを見る

前後の流れ

Gemini Diffusionが示す生成の並列化 Gemma 4が示すローカルLLMの実務化

読む点

Project Genieは、見た目としては「3D世界を作って遊べるAI」です。Google Labs側では、世界、キャラクター、探索方法を作り、動くほど周囲の世界がリアルタイムに生成される体験として見せています。DeepMind側では、Genie 3をテキストから24fps、720pのインタラクティブな世界を生成できるworld modelとして説明しています。

ここで読むべきなのは、ゲーム制作の置き換えではありません。AIが文章や動画を出すだけでなく、行動の結果を試せる環境まで生成し始めたことです。

何が変わるか

チャットAIは、主に質問に答えるモデルでした。動画生成AIは、結果としての映像を作るモデルでした。世界モデルは一段違います。ユーザーやAIが動き、その動きに応じて環境が続き、場合によっては天候、物体、キャラクターのような条件も変えられる。つまり「行動したら何が起きるか」を扱うモデルです。

これは、AIエージェントにとって大きい。現実に出す前に、仮想の倉庫、道路、店舗、教室、災害現場、ゲーム空間で失敗できるからです。AIが賢くなるだけでなく、AIが練習する場所もAIが作る方向へ進んでいます。

実務への意味

企業側で見るべき論点は、きれいな3D世界が作れるかではありません。自社の仕事で「現実では試しにくいが、仮想なら試せる場面」があるかです。

たとえば、物流導線、店舗オペレーション、工場安全、接客訓練、災害対応、ロボットの動作確認は、現実の失敗コストが高い領域です。世界モデルが使えるようになると、手順書や動画教材だけでなく、試して失敗できる訓練環境そのものを作る発想が出てきます。

注意点

一方で、現時点のProject Genieを業務シミュレーターとしてそのまま扱うのは早いです。Google Labs上でも早期研究プロトタイプとして位置づけられ、利用は米国のGoogle AI Ultra加入者、18歳以上に限られています。DeepMindも、行動空間の制約、複数エージェントの相互作用、現実の地理的正確性、文字表現、長時間の連続操作に限界があると説明しています。

だから、今すぐ導入する話ではありません。押さえるべきは、Googleが「世界を作るAI」を、エージェント訓練や教育、評価の基盤として見ていることです。AIの競争軸は、答えの精度から、行動を試す環境の所有へ広がっています。

元ソース DeepMind解説