グラフ作成やインフォグラフィックを行うときにどんなツールを使っているでしょうか?Excelでやっている人もいれば、BI(ビジネスインテリジェンス)ツールを使っている人もいると思います。
大学においてはIR(Institutional Research)活動として、BIツール(ビジネスインテリジェンスツール)を使っている事例も多く聞きます。
BIツールはデータを情報へと変換する過程が動的に行えるようになるツールです。
このBIを行うそのメリットとして、垣松は(垣松2009:18)①事実データを見ることにより、思い込みを排除、②大量のデータの中に埋もれた知識を発見できる、③得られた知識を使って仮説検証を行い、業務を改善、さらに手に入れたデータを使い分析というサイクルによって“事実”の背後にある“真実”に迫れるようになるといったものをあげています。
BIツールは色んなものがあり、「Tableau」や「Microsoft Power BI」などが無料で使えるものから有料で機能豊富なものまで色々とあります。
大学のIRの中では「Tableau」や「Microsoft Power BI」の事例を聞くことがありますが、GoogleのBIツールであるデータポータルはあまり聞くことがありません。そこで今回は初心者がGoogleのデータポータルを使ってみてどうだったかをメモしてみます。
今回使ったデータはオープンデータである学校基本調査の令和2年度のもので、「大学の都道府県別学校数及び学生数」を活用します。
学校基本調査 | ファイル | 統計データを探す | 政府統計の総合窓口
また簡易レポートですがデータさえあれば30分程度でこれぐらいは作れてしまいます。
事前準備 データを横持ちから縦持ちにする
学校基本調査のデータをダウンロードすると下記のようなデータとなっています。ただこのデータをBIツールに流し込んでもうまくデータの可視化ができません。
なぜならBIツールは、データを縦持ちにする必要があるからです。縦持ちとしたのが次のデータ(の一部)となります。
No | 年度 | 都道府県 | 設置・男女 | 人数 |
1 | 2020 | 北海道 | 国立男 | 22,471 |
2 | 2020 | 北海道 | 国立女 | 11,239 |
3 | 2020 | 北海道 | 公立男 | 3,976 |
4 | 2020 | 北海道 | 公立女 | 2,664 |
5 | 2020 | 北海道 | 私立男 | 27,924 |
6 | 2020 | 北海道 | 私立女 | 21,413 |
7 | 2020 | 青森県 | 国立男 | 4,068 |
8 | 2020 | 青森県 | 国立女 | 2,821 |
9 | 2020 | 青森県 | 公立男 | 881 |
10 | 2020 | 青森県 | 公立女 | 1,379 |
11 | 2020 | 青森県 | 私立男 | 4,182 |
12 | 2020 | 青森県 | 私立女 | 3,222 |
13 | 2020 | 岩手県 | 国立男 | 3,425 |
14 | 2020 | 岩手県 | 国立女 | 2,042 |
15 | 2020 | 岩手県 | 公立男 | 1,039 |
16 | 2020 | 岩手県 | 公立女 | 1,063 |
17 | 2020 | 岩手県 | 私立男 | 2,764 |
18 | 2020 | 岩手県 | 私立女 | 2,499 |
今回は学校数は使わないので削除し、計もBIツールで出せるので削除しています。年次を入れているのは今後過去のデータをいれて可視化するかもしれないと思ったので、念のために入れています。
Google データポータルの簡単な手順
GoogleデータポータルはGoogleのアカウントがあれば利用が可能です。今回はプライベートのアカウントでやっていますが、大学の教育用のGoogleアカウントでもいじることはできました。
レポート作成とデータを流し込む
データポータルにログインしたら、レポートを作成します。まずはどのデータを使うかを選ぶこんな画面が出てきます。
WEBマーケティングにも使うようにGoogleアナリティクスなどと連携も出来ますが、今回は準備した縦持ちデータをGoogleスプレッドシートに入れて活用します。
適当にデザインしてグラフやコントロールを追加する
グラフやコントロールはクリック1つで挿入可能で、どのデータを使うか、どのように並べるかなどは下図の赤枠のところをいじると簡単にグラフなどが作れます。
また今回は足しているだけのグラフばかりですが、平均値・件数・最大値・最小値・標準偏差や関数も使えます。イメージ的にはExcelのピポッドテーブルに近い感じです。
また上図の右上は、コントロールで指定した都道府県だけを見たい場合などに使います。これで関東圏内の都道府県の結果だけを見たいといった事も簡単に見る事が可能です。
グラフやコントロールは下図のメニューにあるようなものが利用可能です。
あとはグラフやらタイトルをつけていけば、簡単にレポートが作成できます。レポートは共有も可能ですし、作成者(おそらく編集者も)はPDFでダウンロードも可能です。またページ追加、ページサイズ変更も簡単に設定が可能ですし、いくつかテンプレートも用意されています。
最後はデザイン力ですね。これは自分にはないものです……。
終わり
BIツールは直感的に使えるものが多いですが、Googleデータポータルも同様に直感的にレポートが作成できます。ExcelのピポッドテーブルやGoogleサイトを使った事がある人はすぐに使えると思います。面倒なのはデータを縦持ちにしないといけない事ぐらいですね。
また問題としてはクラウドにデータをあげるので、個人情報などが入ったデータは活用しにくいのがあります。
ただ例えば学生にこれを使ってもらったデータ系を扱ったPBL教育なども出来るかなとは思いますが、もう少しいじってみないといけないですね。
なお、今回使ったレポートは下記からアクセスできます。
参考文献
垣松直幸,2009,「ビジネスインテリジェンスの概要」株式会社NTTデータ技術開発本部ビジネスインテリジェンス推進センター編著『BI革命』NTT出版株式会社,17-68.