G-gen の佐々木です。当記事では、Google Cloud Next '26 で発表された BigQuery に関する新機能について、公式の投稿記事「What’s new in BigQuery: Powering the Agentic Era」の内容をもとに紹介します。
- はじめに
- Open, cross-cloud lakehouse
- Graph-based reasoning for enterprise agents
- Native AI processing to unlock structured and unstructured data
- Agentic experiences
- BigQuery における Conversational Analytics(GA / Preview)
- Proactive Agentic Workflows(Preview)
- BigQuery Agent Analytics(GA / Preview)
- BigQuery Studio の新機能群(GA / Preview)
- データサイエンスエージェント(GA)
- Colab Data Apps(Preview)
- BigQuery Remote MCP Server(GA)
- BigQuery ADK Toolset(GA)
- Google Cloud Data Agent Kit(Preview)
- Unparalleled performance and scale

はじめに
以下の Google 公式投稿を参考に、Google Cloud Next '26 で発表された BigQuery の新機能を紹介します。なお、当記事で紹介する機能の提供ステータス(GA / Preview / Coming Soon)は 2026年4月23日現在の情報です。
他の Google Cloud Next '26 の関連記事は、Google Cloud Next '26 カテゴリの記事一覧から参照してください。
Open, cross-cloud lakehouse
Managed Iceberg Tables(GA)
Google Cloud Lakehouse(旧称 : BigLake)は、Apache Iceberg などのオープンテーブル形式と Google Cloud のマネージドストレージを組み合わせた、オープンデータレイクハウス向けのストレージエンジンです。
Google Cloud Lakehouse における Managed Iceberg Tables は、OSS である Apache Iceberg のマルチエンジン互換性と BigQuery の高度な機能を組み合わせたマネージドな Iceberg テーブルで、自動テーブル管理、Iceberg パーティショニング、マルチテーブルトランザクション、変更データキャプチャ(CDC)、強化されたベクトル化(Enhanced Vectorization)、履歴ベースの最適化(History-based Optimizations)を提供します。
- 参考 : Google Cloud Lakehouse とは
- 参考 : Apache Iceberg テーブル
Iceberg REST Catalog の読み書き相互運用性(Preview)
Iceberg REST Catalog は、BigQuery、Spark、その他 OSS / サードパーティエンジンの間で Iceberg テーブルを共有するためのカタログです。
カタログ上での Iceberg テーブルに対する読み書きの相互運用性(Read/Write Interoperability)により、複数の Iceberg 互換エンジン(Apache Spark、Trino など)から Iceberg テーブルを作成 / 更新 / クエリできるようになります。
Cross-Cloud Lakehouse(Preview)
Cross-Cloud Lakehouse は、AWS や Azure など Google Cloud 以外のクラウド上のデータに対して、データ移行や ETL を行うことなく BigQuery の分析機能や AI 機能をそのまま適用できる機能です。たとえば、Amazon S3 Iceberg 上のデータに対して Gemini Enterprise のエージェントや BigQuery の AI 関数などを実行できます。
Iceberg REST Catalog によるオープンスタンダードなテーブル共有と、Cross-Cloud Interconnect によるクラウド間の高帯域幅ネットワークを組み合わせることで実現されています。
- 参考 : クロスクラウド レイクハウスについて
- 参考 : The future of data lakehouse: Open and interoperable for the agentic era
基盤技術である Cross-Cloud Interconnect については以下の記事をご一読ください。
Catalog Federation(Preview)
Catalog Federation は、外部のメタデータカタログを BigQuery 側でフェデレーションする機能です。
AWS Glue、Databricks、SAP、Salesforce、Snowflake のカタログに対応しており、Confluent Tableflow についても2026年後半に提供予定です。データの発見、分析、ゼロコピー共有を、複数のカタログをまたいで実現できます。
リアルタイムデータレプリケーション(GA / Preview)
Spanner、AlloyDB、Cloud SQL から BigQuery へのリアルタイムレプリケーション(GA)と、Iceberg テーブルへのレプリケーション(Preview)が提供されます。これにより、データベースの変更をリアルタイムに分析基盤側へ反映でき、レプリケーションパイプラインを別途整備する必要がなくなります。
Graph-based reasoning for enterprise agents
BigQuery Graph(Preview)
BigQuery Graph は、BigQuery 上でデータをグラフとしてモデル化 / 分析 / 可視化できるグラフ分析機能です。SQL の CREATE PROPERTY GRAPH 文で既存の BigQuery テーブルに対してエンティティ(ノード)と関係性(エッジ)を直接定義でき、データの移動や重複を伴わずにグラフ分析を行えます。
従来の SQL では「友達の友達の友達」のような多段階の関係性分析に複数の JOIN を入れ子にする必要があり、SQL の記述・読解が難しいうえ、データ規模が大きくなるとパフォーマンスが急激に低下する点が課題でした。グラフ分析では、データをノードとエッジの集合としてモデル化することで、こうした多段階の関係性を直感的に記述でき、深い探索もスケーラブルに実行できます。
BigQuery Graph はこうしたグラフ分析を BigQuery 上でネイティブに実行できる基盤として、不正検知、Customer 360、サプライチェーン分析、ソーシャルネットワーク分析などのユースケースに対応します。
BigQuery Graph におけるメジャーのネイティブサポート(Preview)
メジャー(売上や解約率といった集計値を再利用可能な形で定義したもの)が BigQuery Graph 上でネイティブサポートされるようになりました。
これにより、メジャーとエンティティ間のリレーションシップを1つのガバナンスされた定義に統合でき、AI エージェントは単なる検索や集計に留まらず、あるビジネスイベントが他の指標にもたらす影響をマルチホップで辿るような構造的推論を行えるようになります。
- 参考 : メジャーを使用する
BigQuery Conversational Analytics におけるグラフサポート(Preview)
自然言語データ分析の Conversational Analytics が BigQuery Graph と連携できるようになりました。会話分析エージェントが生テーブルではなくグラフ上のエンティティと関係を辿って推論するため、回答の精度が向上します。メジャーを用いて正確な KPI を計算すると同時に、関係性を辿ることで「なぜその数字になっているか」を発見できます。
BigQuery における Conversational Analytics の詳細については、以下の記事をご一読ください。
BigQuery Graph と Looker の統合(Preview)
BigQuery Graph と Looker の統合により、BigQuery Graph をそのまま Looker のビューとして公開でき、定義した指標をデータスタック全体で再利用できます。
逆方向のユースケースとして、Looker 側で BigQuery Graph を定義することもできます。これにより、Looker が標準で備えるバージョン管理(Git 連携)や検証機能を、グラフ定義の変更管理にそのまま適用できます。
BigQuery Studio での視覚的なモデリング機能(Preview)
BigQuery Studio 上で、BigQuery Graph のエンティティ、リレーションシップ、ビジネスロジックを視覚的に構築 / 管理できる新しいインターフェースが追加されました。グラフスキーマの設計を SQL の CREATE PROPERTY GRAPH 文だけでなく UI 上からも進めることができます。
Native AI processing to unlock structured and unstructured data
AI.PARSE_DOCUMENT(Preview)
マネージド AI 関数の1つである AI.PARSE_DOCUMENT は、OCR(光学文字認識)、レイアウト解析、チャンク分割を自動化する SQL 関数です。複雑なドキュメント処理ワークフローを別途のパイプラインを構築せずに簡素化でき、非構造化ドキュメントの取り込みを SQL で完結できます。
TabularFM(Preview)
TabularFM は、表形式データに対する高品質な回帰・分類機能を提供する基盤モデルです。事前学習済みのモデルとして提供されるため、特徴量選択、チューニング、モデルトレーニング、デプロイ後のモデル管理といった工程を経ずに、SQL から直接呼び出して予測結果を得られます。
従来の BigQuery ML では、表形式データに対する分類・回帰モデルをユースケースごとに用意する必要があり、本格的に運用するまでに一定のセットアップコストがかかっていました。TabularFM はこれを共通の基盤モデルに置き換え、典型的な分類・回帰タスクをモデル開発の工程を踏まずに試せるようにします。
ObjectRef(GA)
ObjectRef 値は、SQL や Python から非構造化データと構造化データを並行して扱うための値です。以下のフィールドを持つ STRUCT として表現されます。
| フィールド | 型 | モード | 説明 |
|---|---|---|---|
uri |
STRING | REQUIRED | Cloud Storage オブジェクトの URI |
version |
STRING | NULLABLE | オブジェクトのバージョン |
authorizer |
STRING | NULLABLE | 委任アクセス用の BigQuery 接続 ID。直接アクセスの場合は NULL |
details |
JSON | NULLABLE | オブジェクトのメタデータや処理時のエラー情報などが入る |
ObjectRef 値を操作するための SQL 関数として、以下の4種類がサポートされています。
| 関数 | 用途 |
|---|---|
OBJ.FETCH_METADATA |
URI のみが埋まった ObjectRef 値に Cloud Storage 上のメタデータを取り込み、完全な ObjectRef 値を返す |
OBJ.GET_ACCESS_URL |
ObjectRef が指す Cloud Storage オブジェクトへのアクセス URL(読み取り / 読み書き)を JSON 値で返す(委任アクセスが必要) |
OBJ.GET_READ_URL |
ObjectRef が指す Cloud Storage オブジェクトの読み取り用 URL を STRUCT(url、status)で返す(URL は45分で失効、委任アクセスが必要) |
OBJ.MAKE_REF |
Cloud Storage URI などから ObjectRef 値を生成する |
- 参考 : ObjectRef functions
- 参考 : ObjectRef 値を操作する
AI 連携関数の最適化モード(Preview)
Optimized Mode により、AI.CLASSIFY や AI.IF などの SQL から呼び出せる AI 関数で、タスク固有のモデルをクエリ実行時に動的にトレーニングして利用できます。これにより、従来の行単位でモデルを呼び出す場合と比較して、トークン消費量を230分の1に削減できます。
BigQuery ネイティブの Gemma エンベディング(Preview)
Gemma ベースの組み込みテキストエンベディングモデル embeddinggemma-300m が、AI.EMBED 関数および AI.SIMILARITY 関数で利用できるようになりました。エンベディング生成には BigQuery のスロットがそのまま使われるため、GPU 環境を別途用意することなく、検索や RAG 向けのエンベディングパイプラインを構築できます。
自律型エンベディング生成(GA)
Autonomous Embedding Generation(自律型エンベディング生成)は、テーブルのテキスト列(STRING 列)から生成するベクトルエンベディングをフルマネージドで維持する機能です。エンベディングモデルが生成したベクトルを自動メンテナンスし、ソース列のデータが追加・更新されるたびに自動で再生成されます。これにより、煩雑になりがちなエンベディング作成・更新ジョブの運用を簡素化できます。
- 参考 : 自律型エンベディング生成
BigQuery Hybrid Search(Preview)
BigQuery Hybrid Search はセマンティック検索と全文検索を単一の関数に統合する検索機能で、RAG や複雑な探索系ユースケースにおいて、単独の検索よりも高い精度を実現します。
Python UDF(GA / Preview)
Python UDF は、Python で独自実装したスカラー関数を BigQuery で利用する機能です。データの拡張・変換・クリーニングなどが行え、コンテナを用いたサーバーレス実行環境により数百万行規模まで自動スケールします。
以下の機能が新たに Preview 提供となり、Python UDF は今後数週間にわたって段階的に GA となる見込みです。
- Apache Arrow の
RecordBatchインターフェースを使ったベクトル化 Python UDF を作成でき、行単位の呼び出しと比べてパフォーマンスを改善できる - CPU 使用率、メモリ使用率、インスタンスごとの最大同時リクエスト数などのメトリクスを Cloud Monitoring にエクスポートできる
CREATE FUNCTION文に追加されたcontainer_request_concurrencyオプションで、Python UDF のコンテナインスタンスごとの最大同時リクエスト数を制御できる- イメージストレージのバイト数(プロジェクト・リージョンごとに 10 GiB)とミューテーションレート(プロジェクト・リージョンごとに1分あたり30回)の新しいクォータが適用される
INFORMATION_SCHEMA.JOBSビューのexternal_service_costs列、および Job API のExternalServiceCostsフィールドから Python UDF のコストを確認できる
参考 : Python のユーザー定義関数
コネクテッドシートにおける TimesFM モデルの利用(GA / Preview)
コネクテッドシート は、BigQuery のスケールを Google スプレッドシート上で利用できる機能です。アップデートにより、組み込みの時系列予測モデル TimesFM を使った予測(GA)と異常検知(Preview)に対応し、業務担当者がスプレッドシートから大規模データに対する予測や異常検知を行えるようになります。
- 参考 : コネクテッド シートの使用
- 参考 : TimesFM モデル
コネクテッドシートの利用方法については、以下の記事をご一読ください。
Geospatial Analytics Datasets(Preview)
Geospatial Analytics Datasets は、Google Maps Platform 由来のデータセットと Earth Engine のラスターデータおよび解析機能を BigQuery 上で直接扱えるようにする機能です。地理空間データの取得・前処理を自前で組まなくても、BigQuery の他のデータセットと同じ感覚で参照できます。
提供されるデータセットは以下の4種類です。
| データセット | 内容 |
|---|---|
| Imagery Insights | ストリートビューの画像 |
| Places Insights | Google マップ上のビジネス / スポットの集約データ |
| Roads Management Insights | 道路ネットワークの交通流・混雑状況 |
| Earth Engine in BigQuery | Earth Engine の衛星画像・ラスターデータと解析機能 |
Agentic experiences
BigQuery における Conversational Analytics(GA / Preview)
BigQuery の Conversational Analytics(対話型分析)は、自然言語を用いて BigQuery 上のデータに対する質問を生成 AI に投げかけ、分析を行うことができる機能です。予測分析や、構造化・非構造化データを横断した推論もサポートします。
BigQuery Studio および API 経由での利用は GA、データポータル(英名 : Data Studio、旧称 : Looker Studio)および Gemini Enterprise からの利用は Preview 提供となっています。
- 参考 : BigQuery の会話型分析
BigQuery の対話型分析機能の詳細については、以下の記事をご一読ください。
Proactive Agentic Workflows(Preview)
Proactive Agentic Workflows は、エージェントが単なる対話型の質問応答を超えてプロアクティブに動作する機能です。指標の変化を検知して根本原因分析を行い、定期的な調査レポートをメールで直接配信するといったユースケースに対応します。
BigQuery Agent Analytics(GA / Preview)
BigQuery Agent Analytics は、AI エージェントのアクティビティ(イベント)を BigQuery に記録し、分析できるようにする機能です。エージェントのトラブルシューティング、最適化、定量評価に活用できます。
エージェント向けのプラグインとして、Agent Development Kit(ADK)向けのプラグインは GA、LangGraph 向けのプラグインは Preview として提供されています。
BigQuery に記録されるイベントの種類は、以下のようなものがあります。
| イベントの種類 | 内容 |
|---|---|
| LLM interactions | LLM へのプロンプト、モデル出力、エラーに関するイベント トークン使用量、生成にかかった時間なども記録される |
| Tool usage | ツール呼び出しの開始、完了、エラーに関するイベント ツールの呼び出し元( tool_origin)も記録される |
| State Management | エージェントの内部状態の変更に関するイベント |
| Agent lifecycle & Generic Events | エージェントの起動、実行完了、ユーザー入力の受信などのイベント |
| Human-in-the-Loop (HITL) Events | ユーザー認証情報の要求、ユーザーへの確認要求、ユーザーからの入力要求などの割り込みイベント |
以下の記事では、BigQuery Agent Analytics の ADK 向けプラグインの使い方を紹介しています。
BigQuery Studio の新機能群(GA / Preview)
BigQuery Studio は BigQuery の各種機能を Google Cloud コンソールに統合した BigQuery 向けのワークスペースです。今回のアップデートで複数の機能が追加されました。
| 機能 | ステータス | 内容 |
|---|---|---|
| コンテキスト認識型アシスタント | Preview | リソース探索やトラブルシューティングを支援 |
| SQL Cells | GA | SQL と DataFrames を統合 |
| Visualization Cells | GA | ノートブック内で直接ビジュアルを作成 |
| Files Explorer | GA | フォルダ形式でコード資産を整理・共有・管理 |
| Git Integration and Workflows | Preview | GitHub、GitLab、Bitbucket、Azure DevOps に対応した Git 連携 |
データサイエンスエージェント(GA)
データサイエンスエージェント(Data Science Agent)は、Colab Enterprise ノートブック上で動作する AI エージェントです。自然言語で目標を述べるだけで実行計画を自動生成し、データのロード、クリーニング、ビジュアライゼーションを自動で進めます。内部的には BigQuery ML、DataFrames、Spark を組み合わせて利用しています。
Colab Enterprise のほか、BigQuery Studio 上で Colab Enterprise ノートブックを開くことでも、データサイエンスエージェントを利用することができます。
データサイエンスエージェントの詳細については、以下の記事をご一読ください。
Colab Data Apps(Preview)
Colab Data Apps は、BigQuery Studio のノートブックで作成したデータ分析を、Python 製のインタラクティブアプリに変換できる機能です。アプリは BigQuery のスロットを使用してフルマネージドな環境で実行されます。
アプリの公開・共有はデータポータル側で行い、エンドユーザーはコードを編集することなく、UI 上で日付範囲やフィルタなどのパラメータを変更してデータを操作できます。
BigQuery Remote MCP Server(GA)
BigQuery Remote MCP Server は、Model Context Protocol(MCP)対応のリモートサーバーをマネージドで提供するものであり、AI エージェントが MCP を介して BigQuery を操作できるようになります。
Google Cloud が提供している MCP サーバーについては、以下の記事をご一読ください。
BigQuery ADK Toolset(GA)
BigQuery ADK Toolset は、Agent Development Kit(ADK)を用いて構築したエージェントが BigQuery 上のデータを閲覧・操作するためのツールセットです。
Google Cloud Data Agent Kit(Preview)
Google Cloud Data Agent Kit は、IDE、ノートブック、ターミナルといった開発環境を問わずに利用可能な、エージェントによるデータ活用を支援する一連の機能を提供するスイートです。VS Code 拡張機能、MCP サーバー、Gemini CLI / Codex / Claude Code 向けのスターターパックといった複数の形態で提供されます。
エージェントは BigQuery、AlloyDB、Cloud SQL(MySQL / PostgreSQL)、Spanner、Cloud Storage などの Google Cloud 上のデータソースに接続し、以下のような作業を支援します。
- Python や SQL でのクエリ実行、および自然言語による問い合わせを介したデータの検出・探索
- Managed Service for Apache Spark や BigQuery でのデータエンジニアリングパイプラインの構築・テスト・デプロイ
- データの探索・クリーンアップから ML モデルの学習・デプロイまでを行う AI / ML 開発
- 組み込みの AI スキルやツールを使った反復的なタスクの自動化
参考 : VS Code 用 Data Agent Kit 拡張機能の概要
参考 : Data Agent Kit Starter Pack(GitHub)
Unparalleled performance and scale
Fluid Scaling(GA)
Fluid Scaling は、変動の大きいワークロードに対して、コストとパフォーマンスのトレードオフを必要としない BigQuery 向けのオートスケーリング機能です。秒単位課金により細かい粒度でスケールでき、最大34%のコスト削減が可能です。
高度なランタイム、小規模クエリ、履歴ベースの最適化(GA)
BigQuery のクエリエンジンに、高度なランタイム、小規模クエリの最適化、履歴ベースの最適化が適用されました。これらは BigQuery ネイティブテーブルと Iceberg テーブルの双方のワークロードに対して、コードやスキーマの変更なしに自動で適用されます。これにより、前年比でクエリ速度を35%向上させつつ、クエリ処理コストを40%削減しています。
新しいワークロード管理機能(GA / Preview)
reservation groups(GA)、flexible dynamic assignments(Preview)、プロジェクトレベルのスロット / 同時実行制御(Preview)といった新しいワークロード管理機能が追加され、きめ細かなコスト配分と価格性能比の制御ができるようになりました。さらに、宣言型・ルールベースのワークロード管理(Preview)により、これらの管理を簡素化できます。
可観測性の向上(GA / Preview)
ミッションクリティカルなワークロード向けに、Enhanced Observability(GA)、Intersection Routing(Preview)、Agent-Ready Security Center(Preview)といった可観測性・ディザスタリカバリ・セキュリティ関連の機能が追加・強化されました。さらに、Agent-Powered Observability(Preview)により、AI エージェントによるターンキーなトラブルシューティングで運用を簡素化できます。
佐々木 駿太 (記事一覧)
G-gen 最北端、北海道在住のクラウドソリューション部エンジニア
2022年6月に G-gen にジョイン。Google Cloud Partner Top Engineer に選出(2024 / 2025 Fellow / 2026)。好きな Google Cloud プロダクトは Cloud Run。
趣味はコーヒー、小説(SF、ミステリ)、カラオケなど。
Follow @sasashun0805