BigQueryのデータ分析情報(Data insights)を解説

記事タイトルとURLをコピーする

G-gen の min です。BigQuery でデータ分析情報を生成する機能データ分析情報(Data insights)について解説します。

データ分析情報とは

概要

データ分析情報Data insights)とは、BigQuery に統合された AI アシスタントである Gemini in BigQuery の機能の一つです。

BigQuery に蓄積されたデータを使用して分析を始める際、初めて見るテーブルにどのようなデータが入っているのか、他のテーブルとどのような関係があるのかを理解するには、通常、試しに SQL を書いてデータを抽出したり、設計書を読み解くなどの手間がかかります。

データ分析情報を使用すると、AI がテーブルやカラムの名前などの付帯情報(メタデータ)を読み取り、テーブルの概要を説明するテキストや、データ分析に役立つ SQL クエリを自動生成します。これにより、SQL に不慣れな非エンジニアの方や、初めてそのデータに触れるアナリストであっても、スムーズにデータ探索を開始できます。

2つの分析レベル

データ分析情報には、分析の範囲に応じて以下の2つの機能が提供されています。それぞれの詳細については後述します。

機能名 分析対象 主な提供内容
テーブル分析情報(table insights) 単一のテーブル データ内容や品質の分析、要約文の生成、データ抽出用 SQL クエリの提案
データセット分析情報(datasets insights) 単一のデータセット 複数テーブル間の関係性の推論、テーブル結合を伴う SQL クエリの提案

後者のデータセット分析情報については、2026年4月現在、Preview 段階です。

分析情報を生成するモード

BigQuery では、分析情報を生成する際に以下の2つのモードが用意されています。

モード 説明 用途
生成して公開(Generate and publish) AI が生成したデータの説明や SQL クエリの提案を、Google Cloud のデータ辞書サービスである Dataplex Universal Catalog に保存します。権限を持つ他のメンバーと知識を共有できるほか、保存された説明を後から手動で編集することも可能です。 会社全体でデータの説明などのドキュメントを共有し、継続的に知識を蓄積・再利用したい場合。
公開せずに生成(Generate without publish) その場限りの分析情報をすぐに作成します。生成された情報は、共有のデータ辞書には保存(公開)されません。 共有のデータ辞書に不要な情報を増やさず、一時的なデータ確認やお試しでの分析を素早く行いたい場合。

前者の生成して公開(Generate and publish)については、2026年4月現在、Preview 段階です。

Dataplex Universal Catalog については、以下の記事を参照してください。

blog.g-gen.co.jp

事前準備

必要な API の有効化

データ分析情報を使用するプロジェクトでは、事前に以下の API を有効化しておく必要があります。

  • BigQuery API
  • Dataplex API
  • Gemini for Google Cloud API

必要な IAM ロール

コンソール画面からデータ分析情報を生成し、その結果を閲覧するためには、作業するユーザーの Google アカウントに対して以下の IAM ロールが付与されている必要があります。

データ分析情報の機能は内部的に Dataplex というデータ管理サービスの機能を使用しているため、BigQuery だけでなく Dataplex の権限も必要となる点に注意してください。

  • 「BigQuery データ閲覧者(roles/bigquery.dataViewer)」または「BigQuery データ編集者(roles/bigquery.dataEditor)」
  • 「Dataplex DataScan 編集者(roles/dataplex.dataScanEditor)」または「Dataplex DataScan 管理者(roles/dataplex.dataScanAdmin)」

参考 : BigQuery でデータ分析情報を生成する - 必要なロール

テーブル分析情報

提供される機能

テーブル分析情報は、単一の BigQuery テーブルに含まれるデータの内容や品質、傾向を理解するための機能です。対象のテーブルに対して分析情報を生成すると、AI が以下のような情報を提供します。

クエリの生成

データ内のパターン、異常値、外れ値などを検出するための自然言語の質問と、それに対応する SQL クエリを提案します。

説明の生成

テーブル全体および各カラムに対する説明文を自動生成します。対象のテーブルに対してデータ プロファイル スキャン(データの傾向や統計情報を抽出する機能)が実行されている場合、その結果も加味してより正確な説明が生成されます。

データ プロファイル スキャンについては、以下の公式ドキュメントを参照してください。

生成言語の制御

テーブルとカラムの説明を特定の言語で生成するように、Gemini に指示できます。

言語を指定するには、分析情報を生成する前に、テーブルの既存の説明文に「日本語で説明をして」といった短い指示を追記します。対象テーブルの「詳細」タブを開き、「詳細を編集」をクリックして指示文を追記および保存します。

詳細タブの画面

説明編集の画面

サポートされている言語の一覧については、以下を参照してください。

生成手順

Google Cloud コンソール画面から、テーブル分析情報を公開せずに生成する手順は以下のとおりです。

  1. Google Cloud コンソールを開き、BigQuery Studio の画面に移動します。
  2. 画面左側の「エクスプローラ」ペインで、対象のプロジェクト名、データセット名の順に選択し、分析したいテーブルをクリックします。
  3. 画面右側にテーブルの詳細情報が表示されるため、上部のタブメニューから「分析情報」タブを選択します。
    分析情報タブの画面
  4. 画面内の「公開せずに生成」ボタンをクリックします。

分析情報の生成には数分程度かかる場合があります。生成が完了すると、AI によって提案されたテーブルの概要や、データを分析するためのサンプル SQL クエリなどが同じ画面に表示されます。表示された SQL はそのまま実行したり、要件にあわせて書き換えて保存できます。

生成した分析情報の保存

Gemini in BigQuery は、データ分析情報を生成するときに、テーブルとカラムの説明を自動的に生成します。必要に応じてこれらの説明を編集し、BigQuery のスキーマや詳細情報として手動で保存できます。

テーブルで分析する内容を記述した詳細なテーブルの説明は、Gemini in BigQuery でより関連性の高い分析情報を生成するのに役立ちます。保存された説明は、自分や他のメンバーが参照できるだけでなく、今後の分析情報を生成するためにも使用されます。

説明文を保存する手順は以下のとおりです。

  1. 対象テーブルの画面で「分析情報」タブを開きます。
    分析情報を生成後の分析情報タブの画面
  2. 画面内の「テーブルの説明」セクションにある「列の説明を表示」をクリックします。説明のプレビュー画面が表示されます。
    説明のプレビュー画面
  3. テーブル自体の説明を保存したい場合は、「詳細に保存」をクリックします。「提案された説明をコピー」をクリックして入力欄に内容を反映させたのち、「Save to details」をクリックします。
    詳細に保存の画面
  4. カラムの説明を追加・保存したい場合は、2. のプレビュー画面にて「列の説明」セクションにある「スキーマに保存」をクリックします。現在のスキーマとの変更内容の差分を確認し、問題がなければ「保存」をクリックします。
    現在のスキーマの確認画面

データセット分析情報

提供される機能

データセット分析情報は、単一のデータセット内に存在する複数のテーブル間の関係性を把握するための機能です。当機能は 2026年4月現在、Preview 公開されています。

テーブル同士をどのように結合すれば意味のあるデータが抽出できるかを AI が推論し、以下の情報を提供します。

データセットの説明

データセット全体の概要を AI が要約して提供します。

リレーションシップグラフ

データセット内のテーブル間の関係性を示す図を表示します。線にカーソルを合わせると、どのカラムをキーにして結合できるかといった詳細を確認できます。

リレーションシップテーブル

テーブル間の関係性を表形式で一覧表示します。関係性の根拠として、明示的なシステム上の制約(外部キーなど)、過去のクエリの実行履歴に基づく使用状況、またはテーブル名やカラム名からの AI による推論が含まれます。

クエリの推奨

複数のテーブルを結合してデータを抽出するための、実践的な SQL クエリのサンプルを提供します。

生成手順

Google Cloud コンソール画面から、データセット分析情報を公開せずに生成する手順は以下のとおりです。

  1. Google Cloud コンソールを開き、BigQuery Studio の画面に移動します。
  2. 画面左側の「エクスプローラ」ペインで、対象のプロジェクト名のツリーを選択し、分析したいデータセットをクリックします。
  3. 画面右側にデータセットの詳細情報が表示されるため、上部のタブメニューから「分析情報」タブを選択します。
    分析情報タブの画面
  4. 画面内の「公開せずに生成」ボタンをクリックします。

分析情報の生成には数分程度かかる場合があります。生成が完了すると、AI によって提案されたデータセットの概要やリレーションシップグラフなどが同じ画面に表示されます。

例:Relationships の図

例:リレーションテーブル

制限事項

データ分析情報を使用する際の主な制限事項は以下のとおりです。

  • サポートされるテーブルは、BigQuery ネイティブのテーブル、BigLake テーブル、外部テーブル、ビュー
  • カラムレベルのアクセス制御が設定されているテーブルに対して分析情報を生成するには、実行ユーザーが対象テーブルのすべてのカラムに対する読み取り権限を持っている必要がある
  • テーブル分析情報において、AI が説明文を自動生成できるのは 1 テーブルあたり最大 350 カラムまで
  • 新たにデータセット分析情報を生成すると、対象データセットに対する以前の分析情報は上書きされる
  • マルチクラウド環境に保存されている、他クラウドのデータは対象外

参考 : BigQuery でデータ分析情報を生成する - 制限事項

料金

データ分析情報の機能自体に対する追加料金は発生しません。

データ分析情報は、Google Cloud プロジェクトにおいて、以下のいずれかの BigQuery 料金体系を適用している場合に使用できます。

  • オンデマンド
  • Enterprise エディション
  • Enterprise Plus エディション

プロジェクトに BigQuery Editions の Standard エディションが適用されている場合は、データ分析情報を使用できないので注意してください。

また、生成された SQL クエリを BigQuery で実行した際には、通常の BigQuery のコンピューティング料金(データスキャンに対する課金など)が発生します。

佐々木 愛美 (min) (記事一覧)

クラウドソリューション部 データアナリティクス課。2024年7月 G-gen にジョイン。G-gen 最南端、沖縄県在住。最近覚えた島言葉は、「マヤー(猫)」。