Google Cloud Next '24 in Las Vegas 速報レポート(キーノート・1日目)

記事タイトルとURLをコピーする

G-gen の杉村です。当記事では、Google Cloud Next '24 in Las Vegas のキーノート(1日目)に関する速報レポートをお届けします。セッションレポートなど、Google Cloud Next '24 の関連記事は Google Cloud Next '24 カテゴリの記事一覧からご覧いただけます。

Google Cloud Next '24 in Las Vegas

2024年4月9日(火)から11日(木)までの3日間、米国ネバダ州のラスベガスで、Google Cloud Next '24 が行われました。

会場はラスベガス有数のカジノ・リゾートホテルであるマンダレイ・ベイ。120エーカー(東京ドーム約10個分)の広大な敷地を持ちます。

会場となるマンダレイ・ベイ

重要な新発表は初日のキーノート(基調講演)で行われます。また会場内の複数の会議室で、新機能の発表や、今後の Google Cloud 活用に関する示唆に富んだセッションが行われました。

G-gen 社からも11名のメンバーが現地へ赴き、その熱気を感じてきました。その様子は、本記事や、他のセッションレポートでお知らせします。関連記事は、Google Cloud Next '24 カテゴリの記事一覧でご覧いただけます。

本投稿では、Google Cloud Next '24 のキーノート(基調講演)で行われた、特に注目すべき技術的な発表にフォーカスして共有します。

概要

Google Cloud Next の開幕を飾るキーノート(基調講演)では、Google Cloud の CEO である Thomas Kurian や、各プロダクトの VP(Vice President)が、Google Cloud の最近の機能改善や、顧客事例を紹介しました。

全体を通して生成 AI プロダクトにフォーカスされていた点は、昨年8月に行われた Google Cloud Next '23 in San Francisco と同様でしたが、今回は「〇〇 Agent(エージェント)」という言葉が強調されていたのが印象的でした。

ここでいう Agent とは、生成 AI が「テキストや画像、動画の生成」に留まらず、人間から自然言語による指示を受けて、さまざまなタスクを行う仕組みを指します。基調講演では、Customer Agent、Employee Agent、Creative Agent、Data Agent、Security Agent、Code Agent など、さまざまな Agent が登場し、人間から文字入力や電話による音声で自然言語による指示を受けて、商品の購入処理を完了させたり、データベースに入っているデータの可視化を行う様子がデモされました。

ここからは、基調講演の中で発表された技術的な新発表をご紹介します。

キーノート会場

AI Hypercomputer

機械学習のフレームワークやオープンソースに特化したスーパーコンピューティングのアーキテクチャである AI Hypercomputer が発表されました。

AI Hypercomputer には、NVIDIA H100 Tensor Core GPU を搭載した Compute Engine VM である A3 Mega VM や、Hyperdisk ML などの AI ワークロードに特化したストレージソリューション、新しい TPU である TPU v5p などが含まれます。

TPU v5p(写真は別のセッションから)

また従来から存在する Google Distributed Cloud(略称 GDC。オンプレミスへ Google Cloud を拡張するソリューション)での AI 活用も示唆されました。NVIDIA GPUs to GDCGKE on GDCAlloyDB Omni for Vector Search(AlloyDB Omni はオンプレミスにインストールできる AlloyDB)、また最も厳格な規制業界にも対応する Sovereign Cloud の概念も発表されました。

Google Distributed Cloud(写真は Expo 会場より)

Google Axion

Thomas Kurian がことさら誇らしげに発表したのが、Google が独自開発した CPU である Google Axion です。

Google Axion は Arm ベースの CPU であり、「従来の x86 ベースのインスタンスと比べ、50%のパフォーマンス改善、60%のエネルギー効率改善」が期待できるとしています。

また、Compute Engine の General Purpose VM(一般用途 VM)として N4 シリーズと C4 シリーズが利用可能になります。これらは第5世代 Intel Xeon プロセッサを搭載しており、General Purpose VM、すなわち特定の用途に特化していない、汎用的なマシンシリーズです。

Gemini 1.5 Pro 等の生成 AI モデル

これまで Limited Preview(一部の許可されたユーザーのみ利用可能なプレビュー)だった Google の生成 AI 基盤モデル Gemini 1.5 Pro の Public Preview が発表されました。これまでできなかった、音声付き動画ファイルの処理も可能になっています。

Anthropic 社の Claude 3(Sonnet / Haiku)の Vertex AI からの利用も GA(一般公開)されました。

ほかに、「オープンモデル(オープンソースと近い概念の生成 AI モデル)」の位置づけである Gemma のコード生成用モデルである CodeGemma、自然言語から画像や動画を生成する Imagen 2.0 も紹介されました。Imagen 2.0 で生成された画像には、従来から発表されている Digital Watermarking(電子透かし)が入ります。

Vertex AI でのグラウンディング「Enterprise Truth」

Vertex AI 経由で利用する生成 AI から利用するグラウンディング(生成 AI の誤った生成を補強するために外部情報を利用すること)のデータ取得先として Google Search が利用可能になります(Preview)。これにより、インターネット上の最新情報を、生成されたコンテンツの補強に使うことができるようになり、より生成 AI の汎用性が向上すると考えられます。

また、企業内のデータをグランディング先として利用する場合、AlloyDB や BigQuery といった Google Cloud 上のデータベース、Workday、Salesforce、ServiceNow、Hadoop、Confluence、JIRA などのサードパーティアプリケーションを利用することができます。

講演では、これらのように Web 経由の情報や企業内の情報を組み合わせてグランディングを行うことを Enterprise Truth と呼称していました。

Vertex AI Agent Builder

Vertex AI Agent Builder は、人間の代わりにプログラムが生成 AI の力を借りてタスクを実行する Agent(エージェント)を実装するフルマネージドサービスです。

前述の Enterprise Truth を実装する手段として、Agent Builder により Agent を開発し、Agent が Google Search やデータベースなどから必要な情報を抽出したり、必要に応じてコードを実行したりして、最終的な目的を達成します。

講演では、架空の EC サイトを模したデモ Web サイトのチャット欄に「この YouTube 動画のキーボード演奏者が着ている、チェックのシャツを買いたいです。値段と、買える場所と、いつ手に入るかが知りたい」という英語による指示と、YouTube の動画の URL を貼り付けると、ほどなくして Agent が関連商品一覧と在庫情報等を一覧で返し、会場からは驚きの声が上がりました。

講演では、これを Customer Agent という概念で表現し、顧客の要望に直接的に応える Agent として紹介されました。

G-gen のエンジニアが、Vertex AI Agent Builder をさっそく試用し、以下の記事にしています。

blog.g-gen.co.jp

プロンプト開発と精度計測の補助

詳細は語られませんでしたが、Vertex AI Prompt Management の Preview が発表されました。生成 AI 用のプロンプトを保存したり、チームで共有したりするためのツールになる見込みです。

また、生成 AI 基盤モデルの比較のための補助ツールとして Automatic side-by-sideAutoSxS)が GA(一般公開)されました。生成 AI の出力をスコア付けし、パフォーマンスを定量的に比較するためのツールです。

さらに、より小さいデータセットでモデルをクイックに比較するための Rapid Evaluation feature も Preview 公開されました。

生成 AI による開発補助

生成 AI によるアプリケーション開発補助ツールの進化も発表されました。

Gemini Code Assist は、従来は Duet AI for Developers(Gemini for Developers)と呼ばれていたもので、コード生成やコーディング補助をするツールです。Gemini 1.5 Pro が Gemini Code Assist を提供することにより、より精度が向上しました。

Gemini Cloud Assist は、Google Cloud の Web コンソール等に組み込まれた、Google Cloud の利用補助ツールです。自然言語で Google Cloud の使い方等に関する質問が可能で、設計や運用、トラブルシュートに活用できます。今回は Private preview の発表です。コンソール内のチャットに、自然言語で Google Cloud の使い方を質問すると回答してくれるほか、公式ドキュメントの案内や、gcloud CLI のコマンドラインを教えてくれます。

これまで「Gemini in Google Cloud(Duet AI for Google Cloud)」と呼ばれていたサービスは、今回 Gemini for Google Cloud として再定義され、その中には「Gemini Code Assist」「Gemini Cloud Assist」「Gemini in Security」「Gemini in BigQuery」「Gemini in Looker」「Gemini in Databases」が含まれています。詳細は、以下の記事をご参照ください。

公式ブログ「Powering Google Cloud with Gemini」より引用

生成 AI によるデータ活用

Gemini in BigQueryGemini in Looker は、自然言語の指示により SQL を生成したり、データを可視化する仕組みです。

これらは前回の Google Cloud Next '23 でも発表されていましたが、より進化した BigQuery Studio などにより、更に統合が進んだ印象です。

また Gemini in BigQuery は申請ベースでの Preview が可能になっており、早速 G-gen のエンジニアによって試用した様子が、以下で記事になっています。

blog.g-gen.co.jp

生成 AI とセキュリティ

Gemini in Threat Intelligence は、脅威に関する情報を自然言語で提供する仕組みです。

Gemini in Security Operations は、Google の提供する SIEM である Chronicle 向けの機能で、自然言語での検索やセキュリティ情報の要約を可能にします。

Gemini in Security Command Center は、従来から存在するリスク検知サービスである Security Command Center に、自然言語でのセキュリティ関連情報の検索を提供する機能です。

Google Workspace と生成 AI

昨年、英語版が GA(一般公開)となった Gemini for Google Workspace も、機能拡張が続いています。

特に強調されたのは Google Workspace の新サービスである Google Vids の発表です。Google Vids は生成 AI を使った動画編集や生成のサービスです。テーマに沿ったストーリーボードを自動生成し、ユーザーが保有する動画、画像、音声などをもとに容易な動画編集を可能にします。他の Google Workspace サービスと一貫した操作性で、ブラウザ上で完結する動画編集サービスです。2024年6月に、Workspace Labs(実験的機能のプレビューができる招待制のプログラム)で公開予定です。

ただし Google Vids は、原則的にはユーザーがすでに持っている動画や画像を活用するものであり、ストーリーボードやデザイン、スクリプト(台本)の生成はできるものの、動画自体の生成はできない、とのことです。

Google Vids の発表

AI Meetings and Messaging add-on は追加料金で利用可能なアドオンです。自動議事メモ、チャットの要約、69の言語に対応したリアルタイム翻訳などの機能を、$10/ユーザー/月間の追加料金で可能にします。

AI Security add-on は、自動的に機密ファイルの分類などのデータ保護(Data Loss Prevention)を行う機能で、こちらも$10/ユーザー/月間の追加料金です。

関連記事

2日目のキーノートについては、以下の記事をご参照ください。

blog.g-gen.co.jp

G-gen によるその他の記事は、以下の記事一覧をご参照ください。

blog.g-gen.co.jp

杉村 勇馬 (記事一覧)

執行役員 CTO / クラウドソリューション部 部長

元警察官という経歴を持つ現 IT エンジニア。クラウド管理・運用やネットワークに知見。AWS 12資格、Google Cloud認定資格11資格。X (旧 Twitter) では Google Cloud や AWS のアップデート情報をつぶやいています。