G-gen の杉村です。当記事では、Google Cloud Next '24 in Las Vegas のキーノート(2日目)に関する速報レポートをお届けします。セッションレポートなど、Google Cloud Next '24 の関連記事は Google Cloud Next '24 カテゴリの記事一覧からご覧いただけます。
Google Cloud Next '24 in Las Vegas
2024年4月9日(火)から11日(木)までの3日間、米国ネバダ州のラスベガスで、Google Cloud Next '24 が行われました。
本投稿では、Google Cloud Next '24 の2日目のキーノート(基調講演)で行われた、特に注目すべき技術的な発表にフォーカスして共有します。
1日目のキーノートについては、以下の記事を参照してください。
概要
Google Cloud Next '24 の2日めキーノート(基調講演)では、「Fast. Simple. Cutting edge. Pick three.」と銘打ち、アプリケーション開発者向けの発表がされました。Day 2 のキーノートでアプリケーション開発者向けの発表がされる点は、昨年サンフランシスコで行われた Google Cloud Next '23 と同様です。
開発者が日常的に行っている「build, run and operate」を AI 技術で補助することをテーマに、様々な発表が行われました。
ここからは、基調講演の中で発表された技術的な新発表をご紹介します。
Build
Gemini Code Assist
開発者にとって、最も身近に利用する生成 AI 関連サービスは Gemini Code Assist です。Gemini 1.5 は業界最大級の100万トークンのコンテキストウインドウを処理できます。つまり、より多くの背景情報(アプリケーションや環境に関する情報、コーディング規約など)を保持して、コーディングの補助ができることになります。
また Gemini は BigQuery や Looker、他のデータベースサービスなどと統合されているため、より高度な開発体験を得ることができます。
App Hub
App Hub は、アプリケーションの、プロジェクトをまたいだ Google Cloud リソースの使用状況や依存関係を可視化するための仕組みです。Gemini Cloud Assist と統合されており、AI の補助のもと、環境の可視化やトラブルシューティングに活かすことができます。
BigQuery continuous queries
BigQuery continuous queries が Preview 公開されました。ストリームデータに対して、継続的な SQL を発行し、リアルタイムなデータ処理が容易に実装できます。講演では、BigQuery コンソール画面で記述した SQL に対して、continuous query のオプションを有効化するだけで、SQL がデータを継続処理するように設定できる様子がデモされました。
Natural language support in AlloyDB
Natural language support in AlloyDB は、AlloyDB におけるベクトル検索の新しいインデキシングの仕組みである ScaNN vector indexing により、さらに高いパフォーマンスでリアルタイムなベクトル検索を実現することで、オペレーショナルデータベースで自然言語による検索がさらに実用的になることを指しています。
AlloyDB では、従来より PostgreSQL の拡張機能である pgvector
を利用したエンべディングとベクトル検索が可能でしたが、今回新たに発表された ScaNN vector indexing により、パフォーマンスが向上しています。
Parameterized secure views は、User ID など特定のキーをベースに行アクセスを制御する View です。これにより、プロンプトインジェクション攻撃のリスクを下げることができます。
- 参考 : Natural language support in AlloyDB for building gen AI apps with real-time data
- 参考 : Introducing ScaNN vector indexing in AlloyDB, bringing 12 years of Google research to speed up vector search
Run
Cloud Run application canvas
Cloud Run application canvas は、Gemini Cloud Assist の補助により、Cloud Run アプリケーションの設計やデプロイを容易に実現する仕組みです。自然言語で実現したいアプリケーションを指示すると、グラフィカルにアーキテクチャが提示され、デプロイまで簡単に行うことができます。
GKE と Gen AI
Gen AI Quick Start Solutions for GKE(Python フレームワークである Ray との統合)、Support for Gemma on GKE など、Google Kubernetes Engine(GKE)と生成 AI の統合も紹介されました。
- 参考 : Why GKE for your Ray AI workloads? Portability, scalability, manageability, cost
- 参考 : Gemma on Google Kubernetes Engine deep dive: New innovations to serve open generative AI models
Operate
Vertex AI Prompt Management
Preview 公開となっている Vertex AI Prompt Management のデモ画面が公開されました。生成 AI 基盤モデルに投入する複数のプロンプトを保存、比較するためのインターフェエイスです。
Shadow API detection
Apigee API Management の機能として提供される Advanced API Security の新機能として、Shadow API detection が発表されました。セキュリティインシデントの起因となるシャドウ API(中央管理者によって管理されていない API)を検知する機能です。
Confidential Accelerators for AI workloads
Confidential Accelerators for AI workloads は、情報保護の観点でセンシティブな AI ワークロードを稼働させるため、A3 マシンシリーズで Confidential VMs を利用可能になりました。
Compute Engine の A3 マシンシリーズは NVIDIA H100 GPU を搭載した、AI/ML や HPC(High Performance Computing)ワークロードに特化したマシンシリーズです。
Confidential VMs(Confidential Computing)は、Trusted Execution Environment(TEE)という特別なハードウェアにより、メモリ上のデータも暗号化される VM です。Google Cloud では保存されたデータ(at-rest、すなわちストレージ上のデータ)はデフォルトで暗号化されていますが、Confidential VMs ではメモリ上のデータも暗号化されており、OS やミドルウェアなどソフトウェアの脆弱性を突いた高度な攻撃等に対する、より高い耐性を持ちます。
- 参考 : Expanded Confidential Computing portfolio and introducing Confidential Accelerators for AI workloads
- 参考 : The A3 machine series
- 参考 : Confidential VM overview
GKE container and model preloading
GKE container and model preloading(GKE コンテナとモデルの先行読み込み)が Preview 公開されました。GKE の新しいノードが起動する際、あらかじめコンテナイメージや AI モデルをディスクにロードしておくことで、オートスケーリングを高速化し、機械学習推論のエンドポイントを提供するようなサービスにおいて、遅延を抑えることができます。
関連記事
3日目終了時点での総評を、以下の記事で紹介ています。
Next では、Cloud Run の新機能など、生成 AI 以外に関する複数のアップデートも発表されています。それらの発表は、当社のセッションレポート記事もご参照ください。
杉村 勇馬 (記事一覧)
執行役員 CTO / クラウドソリューション部 部長
元警察官という経歴を持つ現 IT エンジニア。クラウド管理・運用やネットワークに知見。AWS 12資格、Google Cloud認定資格11資格。X (旧 Twitter) では Google Cloud や AWS のアップデート情報をつぶやいています。
Follow @y_sugi_it