G-gen の高宮です。当記事は、Google Cloud Next '26 in Las Vegas の1日目に行われたブレイクアウトセッション「 Transform cloud operations and management with generative AI 」のレポートです。
G-gen Tech Blog では、現地でイベントに参加したメンバーや、日本から情報をウォッチするメンバーが、Google Cloud Next '26 に関連する記事を発信します。

セッションの概要
本セッションでは、Google の Deepak Kallakuri 氏(Group Product Manager)、 Mark Church 氏(Group Product Manager)、そして Replit 社の Scott Kennedy 氏(VP of Engineering)が登壇しました。
セッションでは、生成 AI の普及によって爆発的に増加するアプリケーションを管理するために、 Gemini Cloud Assist がどのように進化し、プロアクティブかつ自律的なクラウド運用を実現するのかについて、デモを交えて紹介されました。

ソフトウェア開発の加速と運用側の課題
生成 AI とエージェントの登場により、ソフトウェア開発の障壁が下がり、かつてないスピードで新しいソフトウェアが生み出されています。しかし、その裏側で運用チームは、急速に開発されるアプリケーションを安全かつ確実にデプロイし、管理するという課題に直面しています。
生成 AI やエージェントを使用して開発されたアプリケーションには、従来のマニュアルが通用しない課題(品質、トレース、ハードウェア要件など)があります。 Gemini Cloud Assist を使用して運用チームがこの状況を解決するためには、単なる「対話型のエージェント」以上の、ワークフローを自動化するエンタープライズグレードの「自律的なエージェント」が必要であると語られました。

Gemini Cloud Assist の進化
Gemini Cloud Assist の新しい特徴
Gemini Cloud Assist はマニュアルなワークフローから、プロアクティブなクラウドライフサイクル管理へと進化しました。主な強化ポイントは以下の通りです。
| カテゴリ | 概要 | 詳細・特徴 |
|---|---|---|
| Design & Deploy | インフラ設計とデプロイ | Terraform における YAML を用いたインテント駆動型設計。セキュリティ設計。 |
| Operate & Manage | リソース操作の代行 | gcloud と kubectl、bq コマンドの連携。Human-in-the-Loop を伴うコマンドの実行。 |
| Investigate | 調査・トラブルシューティング | プロアクティブな調査。サポートケースの作成と引継ぎ。 |
| Optimize | コストの分析と最適化 | プロアクティブなコスト分析。コスト異常の検出。 |

- 参考 : Gemini Cloud Assist overview
- 参考 : Gemini Cloud Assist Investigationsを解説。AIエージェントでトラブルシューティング - G-gen Tech Blog
エージェントの内部構造
Gemini Cloud Assist を支えるエージェントの内部構造として、大きく以下の3つの要素が追加・強化されたことが解説されました。
| 機能 | 概要 | 詳細・特徴 |
|---|---|---|
| Reasoning loop | 推論ループ | ユーザーのプロンプトや解決すべき課題について推論し、ツールの呼び出しを実行。以前の実行結果に基づいて次の呼び出しを調整し、複雑なトラブルシューティングの際には複数の推論ループを並行して実行することが可能。 |
| Agent Session History | エージェントのセッション履歴 | ユーザーのセッションを理解し、コンソール画面やプロジェクト内のリソースからコンテキストを取得。 |
| Long-term memory | 長期記憶 | 環境やユーザーの好みを長期的に学習することで、時間の経過とともにより的確な回答を返すように進化。 |

プロアクティブなエージェントと自律化
Proactive agents は、アラートが発生した際にエージェントが自律的に調査を開始する機能です。これまではアラートが発生してから人間が調査を開始していましたが、この機能により、深夜にアラートが発生しても、エージェントが自動的に関連するアラートをグループ化し、調査を実行して根本原因と修正案を作成しておきます。運用担当者が確認したときには、すでに解決の準備が整っているという、プロアクティブな運用への転換を実現します。

MCP サーバーによるエコシステム連携
Gemini Cloud Assist が Model Context Protocol (以下、MCP)をサポートしました。これにより、 Gemini CLI や Claude Code 、あるいは自作のカスタムエージェントから、 Gemini Cloud Assist の調査機能やコスト分析機能をツールとして呼び出せるようになります。Google Cloud の専門知識を持つエージェントの能力を、既存の開発ワークフローにシームレスに組み込むことが可能です。


- 参考 : Integrate Gemini Cloud Assist with third-party tools using MCP
- 参考 : MCP Reference: geminicloudassist.googleapis.com
- 参考 : Google Cloud MCP Serversを解説 - G-gen Tech Blog
Gemini Cloud Assist を用いたデモ
1. ホリデーセールを想定した負荷テスト環境の構築
セッションでは、強化された各機能を活用し、チャットアプリケーションの負荷テスト環境の構築から、それに伴う障害の調査と解決までを一気通貫で行うデモが披露されました。
デモのシナリオとして、チャットベースのアプリケーション(Chatly)に対してホリデーセールをシミュレーションするために、擬似的にトラフィックを生成するジェネレータを追加する状況が示されました。 Gemini Cloud Assist に対して、自然言語で「トラフィックジェネレータを追加して」と指示を出します。

2. 既存環境のコンテキスト理解とプロビジョニング
指示を受けたエージェントは、プロジェクト内の既存リソースの状態を理解し、必要なインフラ構成を推論します。この際、すでに別のトラフィックジェネレータが存在していることを検知すると、「すでに存在しますが、新しく作成しますか? それとも更新しますか?」とユーザーに確認を求めました。
これは、エージェントが単に指示を実行するだけでなく、環境のコンテキストを理解して重複作業を回避する能力を示しています。運用担当者が実行を承認(Human-in-the-loop)すると、エージェントがユーザーの権限を代理行使してトラフィックジェネレータをデプロイしました。

3. 稼働状況の確認と調査の提案
負荷テストの実行後、アプリケーションのトラフィック、レイテンシ、エラー率などを尋ねると、エージェントは Cloud Monitoring などから情報を収集し、それらを包括的に提示しました。ロードバランサから 503 エラーが返され、レイテンシが悪化していることを検知したエージェントは、自発的に「詳細な調査を実行しましょうか?」とユーザーに提案し、トラブルシューティングのフェーズへとスムーズに移行しました。

4. インフラとアプリケーションコードの統合分析
デモ環境は、フロントエンドおよびバックエンドの Cloud Run と、永続化層の Cloud SQL で構成される3層アプリケーションです。 Gemini Cloud Assist が調査を開始すると、複数の仮説を並行して検証しました。高い CPU 使用率や、ログに出力された OOM(Out of Memory)メッセージなどのインフラストラクチャのシグナルを収集します。

さらに、ソースコードのデプロイメントと連携し、アプリケーションのコードベースまで踏み込んだ調査を行いました。結果として、「アプリケーションコード内に、150万個の辞書オブジェクトを生成する非効率なループ処理が存在し、それが設定されたメモリ上限を超過させている」という根本原因を特定しました。

5. 修復プランの提示と実行
開発チームにコードの修正を依頼してデプロイを待つ間にもシステムを復旧させるため、 Gemini Cloud Assist は暫定的な修復プランとして「Cloud Run のメモリ割り当てを 2GB に増やす」ことを提案しました。運用担当者が提案内容を確認し、実行を承認すると、エージェントが迅速に設定を変更し、障害を解消させました。

Replit 社における活用事例
Replit 社の Scott Kennedy 氏からは、同社のプラットフォーム上で稼働する 120 万以上の公開アプリを支えるために AI がいかに不可欠であるかが語られました。

Replit では、ユーザーがアプリを公開した後に直面する「運用の罠(コスト、信頼性、セキュリティの不安)」を解決するために、 Gemini Cloud Assist を活用しています。ワンクリックで稼働状況の調査、原因特定、そして修正の適用までを自律的に行える環境を構築しています。将来的には、AI が第 1 次オンコール担当となり、人間はより複雑なアーキテクチャの設計に集中できるようになると展望を述べました。


高宮 怜(記事一覧)
クラウドソリューション部ソリューションアーキテクト課
2025年6月より、G-genにジョイン。前職は四国のSIerで電力、製造業系のお客様に対して、PM/APエンジニアとして、要件定義から運用保守まで全工程を担当。現在はGoogle Cloudを学びながら、フルスタックエンジニアを目指してクラウドエンジニアとしてのスキルを習得中。
Follow @Ggen_RTakamiya