G-genの開原です。当記事では、Looker のデータガバナンス機能について解説します。
データガバナンスとは?
ガバナンス(governance)とは、日本語では、「統治」・「管理」・「支配」等を意味した言葉です。
つまり、データガバナンスとは、データの取り扱いを統制していくことを意味しています。よって、データガバナンスを効かせるためには、以下を実行していく必要があります。
- データの定義・ルール策定
- データ活用の効率化
- セキュリティ強化
Looker の運用フロー
Lookerは下記のような運用フローで利用されます。
- データアナリストがLookMLで指標や集計ロジックを定義する
- ビジネスユーザは、定義された情報をExplore画面で可視化したいデータ項目(dimension,measure)を選択する
- Lookerは、選択されたデータよりSQLを自動生成し、データベースへクエリを投げる
- データベースから取得した結果をExploreに表示する
- ビジネスユーザは、表やグラフを必要に応じてダッシュボードに追加する
- 作成されたダッシュボードを他のユーザーが参照する
- 共有が必要なものは、スケジュール機能やアラート機能を使って定期配信する
- データアナリストは、各ユーザーの検索履歴やアクセス状況を確認する
- データアナリストは、必要に応じてLookMLをメンテナンスする
Lookerのガバナンス機能
上記運用フロー図の中で、具体的にどのようなデータガバナンス機能が実装されているかを以下にまとめました。
LookMLによる指標・集計ロジックの集中管理
- 指標、集計ロジックとダッシュボードを分離することで、ビジネスユーザーはデータ項目を選択するだけで表やグラフを作成することができる
- セルフサービス系のBIツールでよくある、ユーザー毎による指標の違いによる数値のズレを無くし、誰が操作しても同じ結果を取得することができる
- データの修正や変更が必要な場合は、LookMLの定義を一箇所変更するだけで、全てのダッシュボードへ変更内容を反映することができる
- Gitによるバージョン管理は、いつ・だれが・何のために 変更したかを管理したり、リリース前のレビュー等に活用したりすることができる
分析結果を活用するためのアクション機能
- スケジュール機能で、ダッシュボードの定期配信ができるので、組織内だけでなく組織外のパートナーも含めて簡単に分析結果を共有することができる
- Googleサイトや社内ポータル等にダッシュボードを埋め込むことができる
- 約40種類程のクラウドサービスへの連携ができ、開発することで連携先を追加することもできる
- 設定した任意のしきい値に応じて、Slackやメールで通知するアラート機能がある
- API から分析結果を取得することができる
セキュリティーを強化する権限管理
- ユーザー、またはグループ単位でのデータアクセス権の管理ができる
- データセット、ビュー、列レベルでのアクセス権の制御ができる
- ユーザー属性や引数に応じて、検索条件や集計ロジックを動的に変更することができる
システムアクティビティ機能
- 各ユーザーのデータの検索履歴を記録するため、ユーザーやグループ単位での利用状況を確認できる
- 履歴データを可視化して、ダッシュボード表示することができる
- アクセスされていないダッシュボード等を洗い出し、不要なものを削除したり、改善したりすることができる
まとめ
BIツールによる分析結果は、組織における意思決定を行う上で非常に重要な情報です。
そのためには、正確な分析結果が必要です。BIツールを選定する上で、データガバナンス機能も非常に重要な選定基準です。
BIツールの選定については Looker と Looker Studio (旧称データポータル) を比較した記事もご参照ください。
開原 大佑(記事一覧)
クラウドソリューション部
2022年5月にG-gen にジョイン。
前職までは関東を中心として、全国の医療機関へのシステム導入、運用保守を担当。現在は、Looker案件を中心に担当。Google Cloud スキルアップに向けて勉強中。