Looker のデータガバナンス機能を解説

記事タイトルとURLをコピーする

G-genの開原です。当記事では、Looker のデータガバナンス機能について解説します。

データガバナンスとは?

ガバナンス(governance)とは、日本語では、「統治」、「管理」、「支配」等を意味する言葉です。

データガバナンスとは、データの取り扱いを統制していく取り組みを指します。たとえば、データガバナンスが効いていない状態では、以下のようなことが起こります。

  • どのデータがビジネス判断に使うべき正しいデータかわからない
  • 同じ会社の中で、様々な部署が別々にデータを管理している。集計方法も異なる
  • データが、閲覧すべきでない人に見えてしまっている
  • データの管理コストが過剰にかかっているが、誰にも管理されていない

このような状態は、多くの組織で現実に発生しています。特に、データ活用を推進しはじめた初期は意識されていなかったこれらの問題が、データ活用が広がるにつれ、顕在化するケースも多くあります。逆にいうと、上記のような状態を解消する営みがデータガバナンスの構築であるといえます。

データガバナンスを効かせるためには、以下を行う必要があります。

  • データの定義
  • データに関するルールの策定
  • データ活用の効率化
  • データに関するセキュリティの強化

Looker の運用フロー

Google が提供するデータプラットフォームツール(BI ツール)である Looker では、以下のような運用フローで、データガバナンスが確保されます。

Lookerの運用フロー

  1. データアナリストやデータスチュアード、データエンジニア等のチームが LookML で指標や集計ロジックを定義する
  2. ビジネスユーザは、定義された情報を Explore 画面で可視化したいデータ項目(ディメンションとメジャー)を選択する
  3. Looker は、選択されたデータから SQL を自動生成し、データベースへクエリを投入する
  4. データベースから取得した結果が Explore に表示される
  5. ビジネスユーザは、表やグラフを必要に応じてダッシュボードに追加する
  6. 作成されたダッシュボードを他のユーザーが参照する
  7. 共有が必要なものは、スケジュール機能やアラート機能を使って定期配信する
  8. データアナリストは、各ユーザーの検索履歴やアクセス状況を確認する
  9. データアナリストは、必要に応じて LookML をメンテナンスする

Lookerのガバナンス機能

上記運用フロー図の中で、具体的にどのようなデータガバナンス機能が実装されているかを以下にまとめました。

LookML による指標・集計ロジックの集中管理

  • 指標、集計ロジックとダッシュボードを分離することで、ビジネスユーザーはデータ項目を選択するだけで表やグラフを作成することができる
  • セルフサービス系のBIツールでよくある、ユーザー毎による指標の違いによる数値のズレを無くし、誰が操作しても同じ結果を取得することができる
  • データの修正や変更が必要な場合は、LookMLの定義を一箇所変更するだけで、全てのダッシュボードへ変更内容を反映することができる
  • Gitによるバージョン管理は、いつ・だれが・何のために 変更したかを管理したり、リリース前のレビュー等に活用したりすることができる

分析結果を活用するためのアクション機能

  • スケジュール機能で、ダッシュボードの定期配信ができるので、組織内だけでなく組織外のパートナーも含めて簡単に分析結果を共有することができる
  • Googleサイトや社内ポータル等にダッシュボードを埋め込むことができる
  • 約40種類程のクラウドサービスへの連携ができ、開発することで連携先を追加することもできる
  • 設定した任意のしきい値に応じて、Slackやメールで通知するアラート機能がある
  • API から分析結果を取得することができる

セキュリティーを強化する権限管理

  • ユーザー、またはグループ単位でのデータアクセス権の管理ができる
  • データセット、ビュー、列レベルでのアクセス権の制御ができる
  • ユーザー属性や引数に応じて、検索条件や集計ロジックを動的に変更することができる

システムアクティビティ機能

  • 各ユーザーのデータの検索履歴を記録するため、ユーザーやグループ単位での利用状況を確認できる
  • 履歴データを可視化して、ダッシュボード表示することができる
  • アクセスされていないダッシュボード等を洗い出し、不要なものを削除したり、改善したりすることができる

データガバナンスと BI ツール

BI ツールによる分析結果は、組織における意思決定を行う上で非常に重要な情報です。そのためには、分析に使われるデータが正確であり、かつ統制が効いている状態、すなわち、データガバナンスが効いている状態にある必要があります。BI ツールを選定する上で、データガバナンス機能は重要な選定基準です。

通常、BI ツールと呼ばれる製品は、データガバナンスに関する機能を持っていないか、乏しいことがほとんどです。しかしながら Google が提供する Looker は、特にデータガバナンス機能が充実しているツールです。

BIツールの選定については Looker と Looker Studio(旧称データポータル)を比較した記事もご参照ください。

blog.g-gen.co.jp

開原 大佑(記事一覧)

クラウドソリューション部

2022年5月にG-gen にジョイン。
前職までは関東を中心として、全国の医療機関へのシステム導入、運用保守を担当。現在は、Looker案件を中心に担当。Google Cloud スキルアップに向けて勉強中。