What's new with Gemini from Google DeepMind(Google Cloud Next '26速報)

記事タイトルとURLをコピーする

G-gen の荒井です。当記事は Google Cloud Next '26 in Las Vegas の1日目に行われた ブレイクアウトセッション「What's new with Gemini from Google DeepMind」の速報レポートをお届けします。

G-gen Tech Blog では、現地でイベントに参加したメンバーや、日本から情報をウォッチするメンバーが、Google Cloud Next '26 に関連する記事を発信します。

blog.g-gen.co.jp

セッションの概要

当セッションでは、Google DeepMind が開発する Gemini モデルの進化と、多様な AI 技術のポートフォリオについて解説されました。また Google Cloud におけるエンタープライズ向けの仕組みや、Replit 社による Vertex AI を活用したソフトウェア開発の民主化事例が紹介されました。

Google DeepMind と Gemini モデルの進化

DeepMind の歴史と Gemini

Google DeepMind は、2010年にロンドンで設立され、人工汎用知能(AGI)の構築をミッションとして掲げています。現在は Google の AI モデル開発を統合し、Gemini モデルの開発を牽引しています。Gemini は、推論能力、マルチモーダル理解、エージェント機能、そしてコーディング能力において優れたパフォーマンスを発揮します。

DeepMind の成り立ちや取り組みについては、YouTube でドキュメンタリー映画が公開されています。

youtu.be

Gemini ファミリーのラインナップ

Gemini は 2年強の歴史があり、2026年4月現在、最新バージョンは 3.1 です。また Gemini ファミリーでは以下のモデルが提供されています。

モデル 概要と特徴
Pro 最も大規模で高機能。エージェントの駆動や、コーディング、STEM(科学、技術、工学、数学)分野の作業に最適。
Flash 性能と効率のバランスが優れており、最も人気のある主力モデル。
Flash-Light 最小、最速で、最も高いパフォーマンス効率を実現。

多様な AI モデルと最新技術の展開

幅広い AI ポートフォリオ

Google DeepMind は、Gemini 以外にも多様な領域で特徴ある AI モデルを開発しています。オープンウェイトモデルから生成メディア、ロボティクスに至るまで、幅広い技術が提供されています。主要なモデルと技術は以下の表の通りです。

モデル 概要と特徴
Gemma 20億から300億のパラメータサイズを持つオープンウェイトモデルです。端末上(オンデバイス)で効率的に動作するのが特徴です。特定のタスクに特化した訓練に適しており、幅広い言語をサポートするほか、音声や動画の理解機能も組み込まれています。
Gemini Live 音声の入出力を直接処理するネイティブな音声モデルです。遅延が少なく(低遅延)、表現力豊かな音声対話を実現します。話しかけている人間の感情を反映(ミラーリング)したり、状況に合わせて自発的に話すことができます。
Lyria 音楽生成に特化したモデルです。テキストの指示(プロンプト)や画像をもとに、ボーカル(歌声)を含む最大3分間の完全な楽曲を生成することができます。
Gemini Deep Research 市場調査などの深い探索的リサーチを行うAI エージェントです。1回の API 呼び出しで、ウェブ上の公開情報だけでなく、ユーザー独自のデータソースにもアクセスして情報を収集します。テキストだけでなく、チャートやインフォグラフィックを含むレポートを生成します。
Genie テキストや画像から、キーボードで操作可能なインタラクティブな2Dまたは3Dの世界を生成するモデル(Genie 3)です。エンターテインメントやゲーム、教育分野に加え、ロボットが現実世界と相互作用する方法を学ぶためのシミュレーション環境としても非常に重要とされています。
Gemini Robotics(ER) 物理世界で動く汎用ロボットを制御するためのプラットフォームです。「Embodied Reasoning (ER : 身体的推論)」という技術を用い、ロボットが視覚を使って状況を理解し、推論して行動できるようにします。Boston Dynamics 社の「Spot」ロボットに搭載され、オブジェクトのカウントや計器の読み取りなどに活用されています。

上記以外にも、Gemini が利用されている Google プロダクトは数多くあります。詳しくは以下の記事を参照してください。

blog.g-gen.co.jp

最新技術がもたらす期待効果

これらの多様なモデルを組み合わせることで、テキストや画像だけでなく、音声や動画、さらには物理的なロボット制御まで、幅広い業務プロセスを自動化できます。用途に応じた最適なモデルを選択することで、コストパフォーマンスを高めつつ、新しいユーザー体験や革新的なサービスを創出することが可能になります。

Google Cloud におけるエンタープライズ向け AI の実装

DeepMind と Google Cloud の緊密な連携

DeepMind は自社の AI がすべての業界や地域を変革することを目指しており、最終的な目標である人工汎用知能(AGI)の構築に向けて、多種多様なユースケースからトレーニングすることを重視しています。そのため、Google 製品の裏側で動いているものと同じ最先端の AI モデルを、Google Cloud でも利用できるようにしています。

Google Cloud に実装し、開発者や顧客からの多様なフィードバックを得ることで AI モデルの継続的な改善に役立てています。

エンタープライズ環境における「プラットフォーム」と「信頼」の重要性

AI エージェントは高度な処理能力を持っていますが、企業の独自データ(顧客情報や非公開データなど)をあらかじめ把握しているわけではありません。そのため、銀行の KYC(顧客確認)プロセスやバイオテクノロジー企業の臨床データ分析といった重要業務で AI を自律的に稼働させるには、単なる AI モデルだけでなく、強固な「プラットフォーム」が不可欠です。

Google Cloud では、人間の介入なしにエージェントを安全に運用するため、具体的に以下のような仕組みがすでに実装されています。

スケーラブル
クラウドの圧倒的な規模(クラウドスケール)を最大限に活かし、人間の介入なしでも、大規模な処理を効率的にスケールできる仕組み。

柔軟性
適切な認証を行い、機密性の高い社内データであっても、安全かつ柔軟に情報を検索できる仕組み。

信頼に基づいて構築
AI を安心して自律稼働させるための基盤であり、主に以下の機能によって担保されます。

  • エージェントが「どのような決定を下したか」「どのデータにアクセスしたか」「どのようなデータを生成・分類したか」を後から確認できる仕組み。
  • 行動をリアルタイムで監視し、ポリシー違反時に即座に動作を停止させる機能。さらに、過去の成功・失敗例をコンテキストに戻し、継続的に自己改善させる仕組み。

このような強固な仕組みがあるからこそ、クラウド上での大規模なソフトウェア開発(コード生成)はもちろん、銀行や医療機関といったセキュリティ要件の厳しい業界でも、AI エージェントの導入が急速に拡大しています。

マルチモーダルモデルの組み合わせ(パイプライン化)

今後の AI 活用の展望として、複数のマルチモーダルモデルを組み合わせたパイプライン化が挙げられます。例えば「Google 検索で現在地の情報をグラウンディングし、天気を調べ、その天気の様子を示す動画を生成する」といったように、異なる機能を持つモデルを連携させることで、より高度で複合的なユースケースが実現されつつあります。

Replit 社における Gemini と Vertex AI の活用事例

ソフトウェア開発の民主化と Vertex AI の利点

Replit 社は、クラウドベースのソフトウェア開発プラットフォームを提供し、誰もがソフトウェアを作成できる環境を目指しています。同社は、インフラストラクチャの基盤として Google Cloud を採用し、Vertex AI を通じて Gemini モデルを活用しています。Vertex AI を使用することで、インフラ管理の負担が軽減され、セキュリティやコンプライアンス要件を容易に満たすことができます。

これにより、Replit 社はモデルの運用ではなく、ユーザー体験の向上にリソースを集中できるという大きなメリットを得ています。

Replit Agent と評価の重要性

Replit 社が提供する Replit Agent は、ユーザーが自然言語で指示を出すだけで、アプリケーションの計画、コーディング、デプロイまでを自動で行う機能です。このエージェントの裏側では、Gemini モデルが複雑なタスクを複数のステップに分解し、実行しています。また、AI エージェントの品質を維持・向上させるためには、継続的な評価が不可欠です。

Replit 社では、オフラインでの厳密な評価と、実際のユーザーの行動データを基にしたオンライン評価を組み合わせることで、モデルの精度を継続的に改善しています。こうした仕組みから、開発者はインフラ構築や環境構築の手間から解放され、アイデアを即座にアプリケーションとして形にできます。

荒井 雄基 (記事一覧)

クラウドソリューション部 クラウドサポート課

オンプレ環境のネットワーク・サーバーシステムを主戦場としていたが、クラウド領域にシフト。現在は Google Workspace を中心に企業の DX 推進をサポート。

Google Cloud Partner Top Engineer 2025 / 2026
・Google Cloud 認定資格 7冠
・Jagu'e'r エバンジェリスト