自然言語でデータ分析ができるGemini in BigQuery(データキャンバス)を試してみた

記事タイトルとURLをコピーする

はじめまして!4月に G-gen に入社した奥田梨紗です。この度 Google Cloud Next '24 in Las Vegas で発表された Gemini in BigQuery を試してみたので手順等をご紹介します。

はじめに

Gemini in BigQuery とは

Google Cloud Next '24 で発表された Gemini for Google Cloud の機能の1つです。 データキャンバスを作成し、自然言語(いわゆる普段話す言葉)をプロンプトに入力することで SQL や Python の構文を作成します。 そのため、いわゆるプログラミングの知識がなくても BigQuery 上でデータ分析ができる機能です。

また、作成したノートブックはクエリの実行履歴などを表で分かりやすく確認することができるため、引き継ぎが多く有るプロジェクトなどでもデータを視覚化しやすいツールです。

本記事で作成したデータキャンバス

BigQuery とは、様々なデータを蓄積・統合・クエリできる Google Cloud ( 旧称 GCP ) の データウェアハウス( DWH )サービスです。 また当社ブログでも様々な記事で BigQuery に関して解説をしております。

また2024年4月時点では Gemini in BigQuery はプレビュー版となっており、本番環境での利用は推奨されておりません。 プレビュー版のサービスを使うことに関しての注意点等は下記にて解説をしております。 blog.g-gen.co.jp

試したこと

試した使い方はシンプルであり、以下の通りです。

  1. Google Cloud 側へ利用申請を行う
  2. BigQuery キャンバスを作成
  3. Gemini in BigQuery を用いて SQL やグラフ を作成

参考:Set up Gemini in BigQuery  |  Gemini for Google Cloud

Google Cloud 側へ利用申請を行う

記事執筆時(2024年4月)、Gemini in BigQuery はプレビュー機能のためGoogle Cloud へ利用申請を行いました。

申請が通過した際、Google Cloud よりメールが届きます。 メール受信後、申請したプロジェクトに移動し、ホームタブ隣の『 ▼ 』を押下、『 データキャンバスを作成 』という項目が表示されるかどうかを確認します。

申請前・申請中の作成画面
申請後の作成画面

BigQuery キャンバスを作成

『 BigQuery キャンバス 』を作成します。 キャンバスの作成のためには既存のテーブルが必要となるため別途作成する必要があります。

サンプルデータとして架空の企業リストを利用しました。

Number CompanyName Industory EstablishYear Employee
GS00001 株式会社アルファネクスト 情報通信 2020 60
GS00002 ブルーバードテクノロジーズ株式会社 サービス 2016 15

各フィールドの種類は下記の様に設定しました。

フィールド名と型

テーブル作成後にホームタブ隣の『 ▼ 』を押下、『 データキャンバスを作成 』を押下します。

『 Get started by selecting a data source 』、に利用したいテーブル名を入力し、『 ADD TO CANVAS 』を押下します。

選択したクエリのスキーマが表示されたら、左下の『 <>クエリ 』を押下し、クエリ用のプロンプト作成ウインドウを表示します。

プロンプトを入力できるテキストボックスが表示されました。

Gemini in BigQuery を用いて SQL やグラフを作成

テキストボックス上に作成したいクエリを自然言語で入力します。 今回試した3つの事例を紹介します。

例1: 特定の数値でデータを分類する

プロンプトに入力した内容は下記です。

1995年以前に設立された社員数50名以上の会社を教えてください。

右端の『 ▶ 』を押下することでSQLが作成されます。

『 ▶ 』を押下する前

『 ▶ 』を押下した後

作成された SQL を実行する際は、プロンプト文の下の『 実行 』を押下します。

プロンプトの下にクエリ結果が表示されました。

例2: 分類分け

クエリ結果に対して追加でクエリを実行することが出来ます。 例1の結果の左下にある、『 これらの結果に対してクエリを実行する 』を押下するとプロンプトが新たに表示されます。

プロンプトに入力した内容は下記です。

企業を下記の様に分類してください。社員数が1-50名、51名-100名、100名-150名、150名-300名、300名以上。分類した後、それぞれの項目が何社ずつあるのか教えてください

プロンプト入力画面(プロンプトの内容は途中で途切れてしまう様です)

例1と同様に右端の『 ▶ 』を押下することで SQL が作成され、 作成された SQL を実行するために、プロンプト文の下の『 実行 』を押下します。

クエリ実行結果
クエリを実行することで、より具体的に分析が出来ました。

例3:グラフを作成

例2の結果の中央下にある『 可視化 』を押下します。

どの種類のグラフを作成するか選択できます。今回は『 棒グラフの作成 』を押下します。

棒グラフが作成できましたが、できればX軸の従業員数は1-50名、51名-100名...といったように値を調整したいので、左下の『 EDIT 』を押下します。

作成したグラフ(1回目)

EDIT 押下後、プロンプトの内容を編集できるようになったので下記を入力しました。

上記の結果に対して棒グラフを作成してください。横軸は従業員数、縦軸は企業数の合計です。横軸のレンジは下記の順番でお願いします。 1. 1-50 2. 51-100 3. 101-150 4. 151-300 5. 300以上

その結果、横軸が整理され視覚的にも確認しやすいデータとなりました。

作成したグラフ(2回目)

関連記事

blog.g-gen.co.jp

奥田 梨紗(記事一覧)

クラウドソリューション部クラウドデベロッパー課

前職はベトナムのIT企業。
Google Cloudの可能性に惹かれ、2024年4月G-genにジョイン。日々修行中です!