大学アドミニストレーターを目指す大学職員のブログ

大学や高等教育関連、法令の解説が中心のブログ

【スポンサーリンク】

Googleデータポータルで誰でもできるデータの可視化をしてみた

グラフ作成やインフォグラフィックを行うときにどんなツールを使っているでしょうか?Excelでやっている人もいれば、BI(ビジネスインテリジェンス)ツールを使っている人もいると思います。

大学においてはIR(Institutional Research)活動として、BIツール(ビジネスインテリジェンスツール)を使っている事例も多く聞きます。

大学のIRは企業のIRとは定義や行っている事が異なります。大学のIRは、データに基づく意思決定を支援する、データを情報へと変換し提供するといったものを指します。

BIツールはデータを情報へと変換する過程が動的に行えるようになるツールです。

このBIを行うそのメリットとして、垣松は(垣松2009:18)①事実データを見ることにより、思い込みを排除、②大量のデータの中に埋もれた知識を発見できる、③得られた知識を使って仮説検証を行い、業務を改善、さらに手に入れたデータを使い分析というサイクルによって“事実”の背後にある“真実”に迫れるようになるといったものをあげています。

BIツールは色んなものがあり、「Tableau」や「Microsoft Power BI」などが無料で使えるものから有料で機能豊富なものまで色々とあります。

大学のIRの中では「Tableau」や「Microsoft Power BI」の事例を聞くことがありますが、GoogleのBIツールであるデータポータルはあまり聞くことがありません。そこで今回は初心者がGoogleのデータポータルを使ってみてどうだったかをメモしてみます。

今回使ったデータはオープンデータである学校基本調査の令和2年度のもので、「大学の都道府県別学校数及び学生数」を活用します。

学校基本調査 | ファイル | 統計データを探す | 政府統計の総合窓口

また簡易レポートですがデータさえあれば30分程度でこれぐらいは作れてしまいます。

f:id:as-daigaku23:20201120113646j:plain



事前準備 データを横持ちから縦持ちにする

学校基本調査のデータをダウンロードすると下記のようなデータとなっています。ただこのデータをBIツールに流し込んでもうまくデータの可視化ができません。

f:id:as-daigaku23:20201120111817p:plain

なぜならBIツールは、データを縦持ちにする必要があるからです。縦持ちとしたのが次のデータ(の一部)となります。

No 年度 都道府県 設置・男女 人数
1 2020 北海道 国立男 22,471
2 2020 北海道 国立女 11,239
3 2020 北海道 公立男 3,976
4 2020 北海道 公立女 2,664
5 2020 北海道 私立男 27,924
6 2020 北海道 私立女 21,413
7 2020 青森県 国立男 4,068
8 2020 青森県 国立女 2,821
9 2020 青森県 公立男 881
10 2020 青森県 公立女 1,379
11 2020 青森県 私立男 4,182
12 2020 青森県 私立女 3,222
13 2020 岩手県 国立男 3,425
14 2020 岩手県 国立女 2,042
15 2020 岩手県 公立男 1,039
16 2020 岩手県 公立女 1,063
17 2020 岩手県 私立男 2,764
18 2020 岩手県 私立女 2,499

今回は学校数は使わないので削除し、計もBIツールで出せるので削除しています。年次を入れているのは今後過去のデータをいれて可視化するかもしれないと思ったので、念のために入れています。

Google データポータルの簡単な手順

GoogleデータポータルはGoogleのアカウントがあれば利用が可能です。今回はプライベートのアカウントでやっていますが、大学の教育用のGoogleアカウントでもいじることはできました。

marketingplatform.google.com

レポート作成とデータを流し込む

データポータルにログインしたら、レポートを作成します。まずはどのデータを使うかを選ぶこんな画面が出てきます。

WEBマーケティングにも使うようにGoogleアナリティクスなどと連携も出来ますが、今回は準備した縦持ちデータをGoogleスプレッドシートに入れて活用します。

f:id:as-daigaku23:20201120113335j:plain

適当にデザインしてグラフやコントロールを追加する

グラフやコントロールはクリック1つで挿入可能で、どのデータを使うか、どのように並べるかなどは下図の赤枠のところをいじると簡単にグラフなどが作れます。

f:id:as-daigaku23:20201120113818j:plain

また今回は足しているだけのグラフばかりですが、平均値・件数・最大値・最小値・標準偏差や関数も使えます。イメージ的にはExcelのピポッドテーブルに近い感じです。

また上図の右上は、コントロールで指定した都道府県だけを見たい場合などに使います。これで関東圏内の都道府県の結果だけを見たいといった事も簡単に見る事が可能です。

グラフやコントロールは下図のメニューにあるようなものが利用可能です。

f:id:as-daigaku23:20201120114346j:plain

あとはグラフやらタイトルをつけていけば、簡単にレポートが作成できます。レポートは共有も可能ですし、作成者(おそらく編集者も)はPDFでダウンロードも可能です。またページ追加、ページサイズ変更も簡単に設定が可能ですし、いくつかテンプレートも用意されています。

最後はデザイン力ですね。これは自分にはないものです……。

終わり

BIツールは直感的に使えるものが多いですが、Googleデータポータルも同様に直感的にレポートが作成できます。ExcelのピポッドテーブルやGoogleサイトを使った事がある人はすぐに使えると思います。面倒なのはデータを縦持ちにしないといけない事ぐらいですね。

また問題としてはクラウドにデータをあげるので、個人情報などが入ったデータは活用しにくいのがあります。

ただ例えば学生にこれを使ってもらったデータ系を扱ったPBL教育なども出来るかなとは思いますが、もう少しいじってみないといけないですね。

なお、今回使ったレポートは下記からアクセスできます。

datastudio.google.com

参考文献

垣松直幸,2009,「ビジネスインテリジェンスの概要」株式会社NTTデータ技術開発本部ビジネスインテリジェンス推進センター編著『BI革命』NTT出版株式会社,17-68.