こんにちは、G-genの開原です。5月にG-genにジョインしましたので、今回が当ブログ初投稿となります。
データ分析を始めようと BI ツール の選定をしている際、選定基準等でお悩みの方も多いのではないでしょうか。
当記事では Google (Google Cloud) が提供する Looker と データポータル (別称 Data Studio) という2つのデータ可視化サービスの特徴についてご紹介した上で、選定のポイントを解説します。
Looker とは?
Looker は Google Cloud が提供する次世代型の「データプラットフォーム製品」です。
「データプラットフォーム製品!?BIツールじゃないの?」と思う人もいることでしょう。 Looker は一般的には BI ツールのカテゴリーに分類されることが多いですが、単純な BI ツールではありません。 LookML という独自のモデリング言語を記述することで データの一貫性 を担保することが可能な製品です。
組織の中で全員が、この LookML でモデリングされた値や計算式を利用してデータ分析や可視化をするようになるため 全員が同じ分析結果を得る ことが可能となります。
他にも、チャットツールや E メール、セールスフォース・オートメーション製品との連携により データ分析と業務をシームレス (繋ぎ目なし) に連携させる 機能を多数備えています。
このように BI ツール (可視化) の部分はあくまで Looker の機能の一部分にすぎない、と言えます。
公式サイト: Looker ドキュメンテーション
データポータル とは?
データポータル (別称 Data Studio) とは Google が提供する完全クラウドベースのBIツールで、基本的に 無料 で利用することができます。
Google アナリティクスや Google Sheets (スプレッドシート) 等、様々なデータソースへの接続が可能であり、 SQL 等の専門知識がなくても直感的にレポート作成が可能です。無料とは思えない高機能なグラフや表を使って、ダッシュボードを作成することができます。
Google アカウントさえあれば、基本的に無料ですぐに利用することが可能ですので、とても 簡単に使い始められる 点が特徴です。
公式サイト: データポータルのヘルプ
データ分析における課題
Looker とデータポータルの特徴について説明する前に、データ分析における一般的な課題について取り上げたいと思います。
自組織ではどのような課題があるでしょうか。まずはそこに着目し、これからご紹介する Looker / データポータルの各特徴が どのように課題にアプローチできるか に着目して、製品を選定することになります。
- データが集約されておらず各システムのデータベースに分散している
- データは集まっているが、それを可視化するツールがない
- データベースへの問い合わせるためのクエリ (SQL) を書くスキルのある人がいない
- データ集計の計算式が人によって異なり、分析結果にずれが生じている
- 同じようなレポートが複数作られていて、どれが正しいか分からない
- BI ツールを各部署で個別に導入・管理しており、全体最適ができていない
Looker の特徴
データのアップロード不要
Looker は独自のデータベースを持ちません。データウェアハウス等のデータソースに直接、都度アクセスして、自動生成された SQL でデータを取得するため、常に リアルタイムのデータを取得 することが可能です。
ただし、これには処理速度の早いデータベースを利用することが前提です。 Google Cloud (旧称 GCP) の BigQuery や Amazon Web Services (AWS) の Redshift などが想定されます。
LookML によるデータの一元管理
LookML という独自のデータモデリング言語によって 指標 を集中管理するため、ユーザによるデータのズレがなくなり、 データの一貫性を担保 することが可能です。
なお「指標」とは、ここでは「店舗別 日次 売上」「DAU (Daily Active User)」など、ビジネス判断のために用いられる数字を意味しています。
もし複数のレポートで使われている指標の集計方法に変更があったとしても、 LookML にのみ手を加えれば良いので、多数のダッシュボードを都度編集する必要はなく、 メンテナンスコストが低く なります。
また LookML は Git によるバージョン管理ができるため、いつ・だれが・何のために・どこを変更したのかが明確になります。
豊富な業務連携
既存の SaaS や E メールなどと連携した業務フローを作り上げることが可能です。
例えば LookML で定義された指標に対して分析官がデータ探索を行い、その結果を E メールや Slack に シームレスに (Looker の画面を離れることなく) 連携 してビジネス部門に依頼をすることなどが可能です。
また iframe で自社ポータルサイトへ Looker のダッシュボードを配置することなどが可能な他、 API連携による柔軟な追加開発も可能です。
データポータルの特徴
無料で魅力的なダッシュボード
原則的に 全機能が無料 で利用可能です (ただし権限管理のために Google アカウントが必要なため、利用者が 50 名を超えるなど、場合によっては有償のアカウント契約が必要) 。
データポータルでは、無料とは思えないほど高機能でリッチなビジュアルを実現できます。
簡単・すぐに始められる手軽さ
ブラウザ上のマウスによる 簡単な操作 で表やグラフを追加可能です。 SQL やプログラミング等の専門知識は不要です。
エンジニアではないビジネスユーザーでも、最初は慣れが必要なものの、ある程度習熟すれば、自在にダッシュボードを作ったりデータベースの中身を探索できるようになります。
多様なデータソース
手元にある csv や Google Sheets (スプレッドシート) をデータソースとしてそのまま利用することができます。それ以外にも多くの データコネクタ があり、 BigQuery 、 Redshift 、 MySQL などに対応しています。これによりデータ取得のイニシャルコストを大幅に削減可能です。
データポータルがどのデータソースに対応しているかは公式の コネクターギャラリー をご参照ください。以下にごく一部のみを挙げます。
- BigQuery
- Amazon Redshift
- MySQL
- PostgreSQL
- Microsoft SQL Server
- Google Analytics
- Google Ads
- Google Sheets
機能比較と選定基準
機能比較
以下は、それぞれの主要機能や特徴の比較表です。
項目 | Looker | データポータル |
---|---|---|
製品の目的 | データドリブンな業務の実現 データ活用基盤の構築 |
現状分析、可視化 |
利用規模 | 組織全体からの関係者まで (パートナー、お客様) |
小規模(特定の少人数) |
モデリング | インスタンス全体を一元管理 | ダッシュボード毎に定義 |
データソース | データベース | 500以上のデータソース (CSV、 Google Sheets、 Google Analytics 等) |
データ ディクショナリ |
LookMLで定義可能 | なし |
権限設定・ セキュリティ |
ユーザー・グループ単位で アクセス制限可能 |
なし |
バージョン管理 | Gitによるバージョン管理が可能 | 自動もしくは手動で 版数管理が可能 |
データ連携 | SaaSへの埋め込み ifame埋め込み Rest API 等 |
iframe埋め込み URL埋め込み |
アラート | 任意条件でメールやSlackに通知 | なし |
スケジューリング | メール、ウェブフック、 AmazonS3、 SFTPサーバ 等へ定期配信 |
メールへの定期配信 |
利用料金 | 有償 | 無償 |
選定基準
ここまでにご紹介した特徴や機能を踏まえて、製品選定する際の評価例をまとめました。
選定基準 | Looker | データポータル |
---|---|---|
データ活用基盤を構築したい | ◎ | ◯ |
すぐに手軽にデータ分析を始めたい | ◎ | |
組織全体でデータ分析をしたい | ◎ | ◯ |
組織外にも共有したい | ◎ | ◯ |
既存のワークフローを活用したい | ◎ | |
メンテナンスを効率化したい | ◎ | |
安価に利用したい | ◎ |
まとめ
今回はそれぞれの特徴や機能について比較しましたが、それぞれのサービスには向き・不向きがあります。
データポータルは、なんと言っても原則無料で、操作が簡単ですので、 小規模な BI 導入 や これからデータ分析を始める組織 に向いています。
一方で Looker は LookML の学習コストやライセンス料金の点で導入のハードルは高いながらも、企業全体でのデータ分析基盤の構築や、新たなデータ文化を作っていきたい等の 明確なビジョン を持っている組織には大変魅力的となります。
当社ではデータポータル、 BigQuery 、 Compute Engine (仮想サーバー) などの操作を体験できる Google Cloud ハンズオンセミナーを 毎月実施 していますので、興味がある方はぜひご参加ください!
開原 大佑(記事一覧)
クラウドソリューション部
2022年5月にG-gen にジョイン。
前職までは関東を中心として、全国の医療機関へのシステム導入、運用保守を担当。Google Cloud 認定資格取得に向けて日々勉強中。