Google I/O / Android Central発表 2025-05-20 ・レビュー 2026-06-13

Gemini Diffusionが示す生成の並列化

Google I/O 2025で紹介されたGemini Diffusionは、通常のLLMが次のトークンを1つずつ出す前提に対して、拡散モデル的に複数箇所を並列に整える方向を示しました。報道ベースでは、コード生成でGoogleの軽量2.5モデルより5倍速いと説明されています。

3行で捉える

モデル能力の再配置: モデルの更新は、単なる性能向上ではなく、長文、動画、コード、研究、専門領域への役割配分を変えている。Fable 5、Gemini、Opus、RSI関連の動きは、何を人が持つかを再設計させる。

これは「Geminiが速くなった」という小さな話ではありません。AIの競争軸が、モデルの知能やベンチマークだけでなく、生成の待ち時間そのものへ広がったという話です。チャットでは数秒待てても、IDE、検索、業務アプリの中では数秒の遅延が利用頻度を決めます。

従来型のLLMは、前の出力を見て次を出す逐次処理が基本です。Diffusion型の言語モデルは、文章やコードをブロック的に見て、複数の候補を同時に整える方向を取ります。これが安定すれば、AIは「質問して待つ相手」から「作業画面の中で遅延なく動く部品」へ近づきます。

一方で、速さと信頼性は別です。長い文脈の整合性、途中編集の制御、安全性、評価方法はまだ見極めが必要です。現時点では、Gemini Diffusionを完成品の導入候補としてではなく、Googleが生成AIの体験をどこへ寄せているかを見る材料として扱うのがよいです。

見るべきは、Gemini Diffusion単体の一般提供時期より、Googleがこの低遅延生成をCoding、Search、Workspace、Androidのどこに埋め込むかです。AIが速くなるほど、プロンプトを書く力より、AIが常時触れる業務画面、権限、ログ、停止条件の設計が重要になります。