Power BI for Office 365 コンポーネントの更新

ゴールデンウイーク中に現場の社員が自らデータ分析するための Power BI for Office 365 関連で 2 つのコンポーネントで嬉しい更新がありましたので、まとめて記載します。

Power Query の更新

2014 年 5 月 5 日付で Power Qeury の最新版 (バージョン 2.11.3625.144) が Download Center に公開されました。既に古いバージョンの Power Query がインストールされている環境であれば、Excel を起動すると以下のようなトースト通知が表示されるはずです。

image

詳細な更新内容は、トースト通知をクリックして表示される以下のページ (英語) に記載されていますが、以下に個人的に嬉しい機能を 2 つほど紹介します。

New updates for Power Query
http://blogs.msdn.com/b/powerbi/archive/2014/05/06/new-updates-for-power-query.aspx

  1. 既定のクエリ読み込み動作の設定が可能に!
    [POWER QUERY] タブの [コンピューターの設定] – [オプション] から、スクリーンショットのような設定を行うと、接続先からデータを取り込む際に Excel シート上ではなく、データ モデルとして取り込むことが可能になりますので、この設定がお薦めです。
    image
    image
  2. [下位の行の削除] が可能に!
    これまで、クエリ エディターから条件式によるフィルターや上位の行の削除が可能だったのですが、ついに、下位の行の削除が可能になりました。
    image
    image

Data Management Gateway の更新

2014 年 4 月 30 日付で Power Qeury の最新版 (バージョン1.1.5226.8) が Download Center に公開されました。

詳細な更新内容は、以下のページ (英語) に記載されていますが、これで、今までは Power Pivot で指定した SQL Server の接続先でなければ、スケジュール更新 (指定した時間に最新のデータを取得して Excel のデータ モデルとグラフに反映する機能) を行えなかったのが、Power Query で指定した SQL Server または Oracle Database の接続先を対象とすることが可能となりました。素晴らしい!

Scheduled Data Refresh for Power Query
http://blogs.msdn.com/b/powerbi/archive/2014/05/02/scheduled-data-refresh-for-power-query.aspx

「現場の社員が自らデータ分析」の実現が、どんどん容易になって大変良いことです。

広告

「現場の社員が自らデータ分析」を効果的に行うためには (3)

前々回前回からの続きで、Power BI for Office 365 の Office 365 関連の機能が、どのようにに「全ての現場の社員」が利用するのに役立つか考えてみます。

今回は、前々回に示した手順 5 (Power View で素敵なグラフを作成する) に効く Power BI Q&A に関してです。

Power Query のクエリによって生成されたデータは、表形式の「データ モデル」として Power Pivot と呼ばれる Excel 内のインメモリ データベースに保持され、そのデータ モデルから Power View を利用してグラフを作成する、という流れは、これまで何度か示してきました。
ここでのポイントは、たとえ共有クエリを利用して他の人が作成したクエリが再利用できても、グラフは自分で作成しなければならない、という点です。
前々回に紹介した Power BI サイトを利用すると、アップロードされている他の人が作成したグラフをそのままの形で参照することは出来ますが、グラフの見た目を変更する (例えば、棒グラフから円グラフに変更する) ことやグラフに表示する項目を変更する (例えば、商品の色ではなく値引き率を X 軸に表示する) には、Excel ファイルをダウンロードして編集し直す必要があります。更に、Power BI サイトを確認するという行為も、みんなの利用頻度が上がってくれば、多くの Excel ファイルがアップロードされることになり、その中から必要なファイル (グラフ) を見つけるには時間を要します。

そこで、Power BI for Office 365 の Office 365 関連機能である「Power BI Q&A」の出番です。Power BI Q&A によって、検索ボックスに質問内容を入力すると、大量に存在する Power BI ワークブックから該当する Power Pivot データ モデルの選択と適切な Power View グラフの表示を自動的に行ってくれます
例えば、以前に作成したサンプルを少し変更した Power BI ワークブックから、Power BI Q&A を利用して、地方単位で正規就職者数と専門学校等入学者数の相関関係を確認してみます。ユーザーは検索ボックスに「正規就職者数 専門学校等入学者数 八地方区分」と入力していくだけで、Power BI Q&A が勝手に該当する Excel ファイルを探して、最適だと思われるグラフの形式で表示してくれます。

image

Power BI Q&A で利用可能にする

Power BI サイトに Excel ファイルをアップロードしただけでは Power BI Q&A で利用可能、つまり、Power BI Q&A が探してグラフを作成する対象にはなりません。これは、他の人や自分で再利用すべき状態になっていない場合も考えられるためです。
Power BI Q&A で利用可能とするためには、Power BI サイトにアップロードした後に、ファイル右下の […] から [Q&A に追加] を選択するだけです。

image

Power BI Q&A を利用する

Power BI Q&A を利用するには、Power BI サイト右上の「Power BI Q&A による検索」をクリックすれば OK です。

image

検索ボックスに、データ モデルの列名や実データ値と条件式を入力していけば、入力するごとに適切と思われる結果を表示してくれます。

例えば、「正規就職者数」と入力すると、データ モデルの列名なので、他の列の情報から都道府県ごとの正規就職者数を地図形式で表示し、

image

続けて、「専門学校等入学者数」を入力すると、データ モデル内の 2 つの列名が指定されているので、それぞれを X 軸、Y 軸に設定したグラフを表示し、

image

続けて、「八地方区分」と入力すると、3 つ目の列が (そのデータの値の内容から) グルーピングのためのものだと判断され、地方毎にグループ化した結果をグラフで表示します。

image

そうです。Power BI Q&A は、入力された質問がデータ モデルの列名を指しているのか、データ モデル内の値を指しているのか、自動的に判断してくれます。ただのファイル システムの検索では、Excel の中の文字列の検索は可能ですが、その文字列の意味までは決して判断してはくれません。

Power BI Q&A で利用可能な質問の構文は、リンク先にも記載されていますので、併せて参照してください。

Demystifying Power BI Q&A – Part 1
http://blogs.msdn.com/b/powerbi/archive/2014/02/27/demystifying-power-bi-q-amp-a-part-1.aspx

Power BI Q&A の質問内容を共有する

これだ! という Power BI Q&A の質問内容が完成したら、その構文とグラフを共有したいですよね。
検索ボックス右側の封筒アイコンをクリックすれば、グラフと質問内容を表示する URL をメールで送信、リンク アイコンをクリックすれば、URL がコピーされるので Yammer 等で共有が可能です。

image

SharePoint サイトのサイトコレクション管理者であれば、「おすすめの質問」を登録することができ、Power BI Q&A 利用者間で共有することが可能です。

image

image

ということで…

Power BI Q&A によって、手順 5 (Power View で素敵なグラフを作成する) を全ての現場の社員が行うためのハードルはグッと下がりました。何と言っても、問い合わせると、Power BI Q&A が勝手にグラフを作成してくれるわけですから。

更に、手順 1 (社内に同じことをやった人が居ないか検索で探してみる) や手順 2 (xxx のデータを持ってないか聞く) の時間の削減にも効果がありますし、手順 4 (データ モデルのリレーションシップを作る) のサンプルを探し出すような行為も簡単にしてくれます。

今回の最後に、手順の概要と、これまでの内容を含めて効果のある Power BI for Office 365 の Office 365 関連の機能をまとめてみます。

手順 効果のある機能
1. 社内に同じことをやった人が居ないか検索で探してみる Power BI サイト
共有クエリ
Power BI Q&A
2. xxx のデータを持ってないか聞く 共有クエリ
Power BI Q&A
3. Power Query でそれぞれのデータを取得するクエリを作成する 共有クエリ
4. Power Pivot でそれぞれのクエリから生成されたデータ モデルのリレーションシップを作る Power BI Q&A
5. Power View で素敵なグラフを作成する Power BI サイト
Power BI Q&A
6. 完成した Excel ファイルを共有する Power BI サイト
共有クエリ

Power BI Q&A に関しては、以下も併せて参照してください。

Power BI for Q&A 概要
http://office.microsoft.com/ja-jp/office365-suite-help/HA104167933.aspx

「現場の社員が自らデータ分析」を効果的に行うためには (2)

前回からの続きで、Power BI for Office 365 の Office 365 関連の機能が、如何に「全ての現場の社員」が利用するのに役立つか考えてみます。

今回は、前回示した例の手順 3 (Power Query でそれぞれのデータを取得するクエリを作成する。) に効く Power Query の共有機能に関してです。
Power Query に関しては、このブログでも何度か例を示してきました。

Power BI で楽々データ分析
http://wp.me/p15HRf-iV

Power Query による公開 API の利用 (XML 出力編)
http://wp.me/p15HRf-kz

Power Query による分析データの再分析 (Excel & HTML 入力編)
http://wp.me/p15HRf-lN

Excel の画面を利用して、あらゆる場所 (Web サイトや RDBMS など)  から必要なデータ (売上データや顧客マスター) を取得し、並び替えたり、フィルターを掛けて使い易い形式に変換するための機能で、その結果として生成されるものを「クエリ」と呼んでいます。
つまり、「各自でクエリを作成する」か、「他の人から受け取ったり、何とか検索して見つけた Excel ファイルを開いて中に記述されているクエリをコピーして再利用する」ということで自分が利用するクエリを作成するわけです。

Power Query の取り扱いに慣れていればアッという間にクエリが作成できるかもしれませんが、全ての現場の社員がこれを行うのは少し大変ですし、時間の無駄です。
「売上データを取得する」「顧客マスターから顧客情報を取得する」といったことは多くの現場の社員がやりたいことですので、誰かが作成したクエリを他の人が簡単に利用できればいいわけです。これを簡単に行えるようにするのが、Power BI for Office 365 の「共有クエリ」の機能です。

共有クエリの利用開始

共有クエリの利用を可能にするのは簡単です。[POWER QUERY] タブの [組織] – [サインイン] アイコンをクリックして、表示されるサインイン ダイアログで [サインイン] をクリックして、Power BI for Office 365 の契約 (トライアルを含む) を行っているユーザーでサインインすれば OK です。

image

image

他の人が作成した共有クエリを利用する

他の人が作成した共有クエリを利用するのも超簡単です。サインイン後に、[POWER QUERY] タブの [外部データの取り込み] – [オンライン検索] を選択し、検索ボックスに何らかのキーワード (例: 「売上」) で検索を行って表示された共有クエリを選択して [ワークシートに追加] を選択すれば OK です。
当然、その後に Power Query の UI から利用する共有クエリの形式の変更も可能です!

image

image

自分が作成したクエリを共有クエリとして公開する

自分でクエリを作成したら、是非積極的に組織内に公開しましょう。もしかしたら使われないかも、とか、ちょっと恥ずかしい、とか思って共有しないと、会社全体のデータ分析の効果が落ちます。
サインイン後に、[POWER QUERY] タブの [クエリの管理] – [共有] を選択し、[クエリの共有] ダイアログで各種メタデータを入力し、[コピーの共有] を選択すれば OK です。
「名前」や「説明」に分かり易い内容を記載しておくと、他の人が共有クエリを検索し易くなって、効果が上がります。

image

image

証明されたクエリを登録する

Power BI for Office 365 のエキスパートだと認定されているユーザーには、クエリの公開時のダイアログに「他のユーザーのためにこのクエリを証明」というチェックボックスが表示されます。これをチェックして公開すると、そのクエリが「証明されたクエリ」として共有クエリの検索結果にメダル付きで表示されます。
Twitter で有名人のアカウントに用いられる認証済みアカウントのようなこの仕組みですが、お墨付きがあれば安心して共有クエリを利用できますよね。

image

自分が公開した共有クエリがどの程度利用されているか確認する

折角公開した共有クエリですから、他の人にどの程度利用してもらえているかを確認するためのレポート機能もあります。
Power BI サイトの上部に表示されている [自分の Power BI] をクリックすると、Power BI for Office 365 の Office 365 側の機能である「データ管理ポータル」が表示されます。

image

[データ] タブをクリックすることで、自分が公開した共有クエリの利用頻度を確認することが可能です。

image

ということで…

Power Query の共有クエリやデータ管理ポータルによって、手順 3 (Power Query でそれぞれのデータを取得するクエリを作成する。) を全ての現場の社員が行うためのハードルはグッと下がりました。
更に、手順 1 (社内に同じことをやった人が居ないか検索で探してみる) や手順 2 (xxx のデータを持ってないか聞く) の時間の削減にも効果がありますし、手順 6 の「何とか特徴のある結果が得られたので、せっかくだから、みんなで利用できるように Excel ファイルをファイル サーバーに置いておき、みんなにメールでお知らせする。」を、共有クエリの形で簡単にもしています。

今回の最後に、手順の概要と、前回の内容を含めて効果のある Power BI for Office 365 の Office 365 関連の機能をまとめてみます。

手順 効果のある機能
1. 社内に同じことをやった人が居ないか検索で探してみる Power BI サイト
共有クエリ
2. xxx のデータを持ってないか聞く 共有クエリ
3. Power Query でそれぞれのデータを取得するクエリを作成する 共有クエリ
4. Power Pivot でそれぞれのクエリから生成されたデータ モデルのリレーションシップを作る  
5. Power View で素敵なグラフを作成する  
6. 完成した Excel ファイルを共有する Power BI サイト
共有クエリ

Power Query の共有クエリやデータ管理ポータルに関しては、以下も併せて参照してください。

Power BI for Office 365 でのデータ管理の操作環境のヘルプ
http://office.microsoft.com/ja-jp/office365-sharepoint-online-enterprise-help/HA104079156.aspx

「現場の社員が自らデータ分析」を効果的に行うためには (1)

Power BI for Office 365 は、「ビジネスの主役である現場の社員が自らデータ分析をするために」提供されるサービスとのことです。

使い慣れた Excel で全社員がビッグデータ分析!- Power BI for Office 365
http://www.microsoft.com/ja-jp/office/2013/business/powerbi/default.aspx

これまでに、このブログでは Power Query や Power View といった Excel だけを利用した機能 (Excel のアドイン機能) を紹介してきました。

Power BI で楽々データ分析
http://wp.me/p15HRf-iV

Power Query による公開 API の利用 (XML 出力編)
http://wp.me/p15HRf-kz

Power Query による分析データの再分析 (Excel & HTML 入力編)
http://wp.me/p15HRf-lN

これを、「全ての現場の社員」が出来るかどうかを少し考えてみたいと思います。ある会社に多くの「現場の社員」が居る場合、こんな流れになるはずです。

例 : 売上の男女比と商品の青色の関係性を確認して、スペースの限られる店舗に置く商品の色を決めたい。

  1. 社内に同じことをやった人が居ないか検索で探してみる。
    「売上 男女 青 xlsx」で検索してみるが、検索結果に「商品名に”青”が含まれたデータ」などのゴミが多過ぎるし、どれが最新のデータかもわからないので挫折。
  2. 同じ部門内の人に xxx のデータ (例: 売上の男女比率、販売商品の詳細データ) を持ってないか聞き、無ければ IT 部門や担当部門 (顧客情報だから営業部門、売上だから経理部門、など) に電話、メール、わざわざミーティングなど各種方法で聞いて回る。
    すぐ貰える情報もあるが、場合によっては数か月掛かってデータあるいはデータの取得先が貰える。
  3. Power Query でそれぞれのデータを取得するクエリを作成する。
  4. Power Pivot でそれぞれのクエリから生成されたデータ モデルのリレーションシップを作る。
  5. Power View で素敵なグラフを作成する。

イマイチ、特徴のある結果が得られなかったので、今度は、売上の男女比と商品の値引き率の関係性を確認して値引き率を決めることにしてみますが、もらった売上データに値引き率の情報が含まれていないことがわかったので、そちらに関しては上記の 1 からやることにします。ヤレヤレ。

  1. 何とか特徴のある結果が得られたので、せっかくだから、みんなで利用できるように Excel ファイルをファイル サーバーに置いておき、みんなにメールでお知らせする。

…きっと、欲しい情報が得られたら、この商品の旬は過ぎ去っていると思います…というのは極端ですが、これを繰り返すのでは効果的とは言い難いです。
更に、Power BI for Office 365 の Excel 側の機能がいくら簡単と言っても、「全ての現場の社員」が利用するには、慣れるまでには少し (あくまでも ”少し” です。Excel の機能ですから、普通の分析ツールよりは簡単だと感じるはずです) ハードルがあります。

そこで重要になってくるのが、Power BI for Office 365 の Office 365 側の機能です。これから何度かに分けて、どういう点が効果的なのか考えてみましょう。

Power BI サイト

今回は、6 の「何とか特徴のある結果が得られたので、せっかくだから、みんなで利用できるように Excel ファイルをファイル サーバーに置いておき、みんなにメールでお知らせする。」を、より簡単にする「Power BI サイト」に関して記載します。

Power BI サイトは、Power BI for Office 365 の Excel 機能を利用して作成した Excel ファイルを保存する場所のことです。Power BI サイトにアクセスすると下記のようなページが表示されます。

image

Power BI サイトによって、6 に対して以下のような効率化が図れます。1 に対しても、検索しなくても済むという効果が得られる可能性も高いです。

  • Excel ファイルをアップロードするだけで組織内で共有し、次回以降で説明する Power BI Q&A などの Office 365 関連の機能を利用可能にすることが出来る
  • 共有している Excel ファイルの Power View グラフがファイルを開かないでもサムネイルで表示され、ファイルを開くことなく自分にとって有益なデータかどうかを判断できる。また、非常にファイル サイズが大きな (= 分析対象のデータ量が多い) Excel ファイルのサムネイルが表示できる (250MB まで)
  • ファイルをクリックすると、Excel アプリケーションを開かずに Web ブラウザで Power View グラフを表示したり、クリックして動作させることができる
  • クラウド上で構築されているので、出先や自宅からも確認が可能
  • 他の人にお薦めしたいグラフをお知らせする機能 (機能済みレポート) や、お気に入りのグラフをチェックしておく機能 (お気に入り) があるので、他の人にメールを送ったり、Web ブラウザのブックマークを利用する必要がない
  • 分析対象のデータの置かれている場所にもよりますが、データを手動または自動で最新の情報にリフレッシュすることが出来るので、いつでも最新のデータによるグラフを確認することが可能

Power BI サイトに関しては、以下も併せて参照してください。

Power BI for Office 365 の Power BI サイト
http://office.microsoft.com/ja-jp/office365-sharepoint-online-enterprise-help/power-bi-sites-on-power-bi-for-office-365-HA104097290.aspx

ビジネス インテリジェンスのイノベーション

先日、日経 BizGate の「サイトに本当は残酷なイノベーション、覚悟なき日本は低迷」という記事が掲載され、賛同できる記述が行われていました。

イノベーションとは、多かれ少なかれ既存のシステムを潰しにかかるものである。しかし、日本人はイノベーションが既存の市場をそのまま維持しながら、新しい市場が積み上がるような幻想を持っているのではないか。

ビジネス インテリジェンスの最新情報

急に話は変わって、ガートナーから 2014 年 2 月に BI 分野で最新のマジック・クアドラントである「Magic Quadrant for Business Intelligence and Analytics Platforms」がリリースされています。
InformationWeek には、2013 年のマジック・クアドラント (Magic Quadrant) との比較を含めてライターの方によるコメントが記載されています。実際の記事とマジック・クアドラントの表は、是非リンク先を参照してください。

Gartner BI Magic Quadrant: Winners & Losers
http://www.informationweek.com/big-data/big-data-analytics/gartner-bi-magic-quadrant-winners-and-losers/d/d-id/1114013

http://www.informationweek.com/big-data/big-data-analytics/gartner-bi-magic-quadrant-winners-and-losers/d/d-id/1114013?image_number=1

http://www.informationweek.com/big-data/big-data-analytics/gartner-bi-magic-quadrant-winners-and-losers/d/d-id/1114013?image_number=2

見てもらうと一目瞭然ですが、2013 年から 2014 年の間で、「リーダー」と呼ばれるポジションに位置する製品の位置関係が大きく変わっている、つまり、ビジネス インテリジェンス市場では、正に今イノベーションが起こっているということです。
なお、「リーダー」とは、次のような意味を持っています。

http://www.gartner.co.jp/research/methodologies/research_mq.php
リーダーは、今日の市場ニーズに対応する成熟した製品をリリースしており、市場が進化した場合でもリーダーの座を維持できるビジョンも明示しています。自社製品への集中的な取り組みと投資を通して、市場全体の方向性に影響を及ぼします。

ビジネス インテリジェンスのイノベーション

Tableau、Qlik や Microsoft といった「誰でも何処でも簡単にデータ分析」を行うことに注力しているベンダーが上位に移り、昔からの「一部のデータ分析のスペシャリストが超高機能な製品を使いこなして高度な分析」を行うことに継続して注力しているベンダーがリーダーから離れていっていることは言えます。
Microsoft は、2014 年のマジック・クアドラント発表時にはリリースしていませんでしたが、現在は「誰でも何処でも簡単にデータ分析」を行うことを可能にする Power BI for Office 365 を提供しています。

イノベーションを体感する

用語だけは昔から知られている「ビジネス インテリジェンス」には、正に今、「イノベーション」が起きています。まずは、Power BI for Office 365 を無料で試してみては如何でしょうか。

Power BI for Office 365 の開始方法
http://www.microsoft.com/ja-jp/office/2013/business/powerbi/trial/default.aspx

Power BI for Office 365 導入の効果は?

Power BI for Office 365 しかり、何か新しい製品やサービスの導入を検討する際に、必ず ROI (費用対効果) の話が出てきますので、その効果が数値化されて公開されている事例 (海外事例、英語) を確認できた範囲で並べてみます。

  1. LC Waikiki Retail Company : トルコの小売業 (衣料品)
    セルフサービス BI 関連コストを年間 1 億円削減
  2. Helse Vest : 西ノルウェー地域保健局
    レポート作成時間を 93% 削減
  3. Oslo University Hospital : ノルウェーの大学病院
    放射線データの分析時間を数か月から数日へ削減 “This is a dream.”
  4. Carnegie Mellon University : アメリカの大学
    エネルギー消費量を 30% 削減
  5. MediaCom : アメリカの広告業
    レポート作成が数人で数週間から一人で数時間に削減し、キャンペーン作成の生産性が 10% 向上
  6. Condé Nast : アメリカの出版業 (雑誌 VOGUE や GQ などを出版)
    レポート作成時間を 30% 削減

私自身の経験上、こういった数値は、お客様にそのままは信じてもらえないことが多いのですが、まずは、どういった観点があるのかを理解し、必要であれば自社で測定方法を検討の上で、測定してください。有償だと思われますが、コンサルティング会社に依頼されてもよろしいかと。
Power BI for Office 365 には、無料でお試しいただく方法が提供されています。

Power BI for Office 365 の開始方法
http://www.microsoft.com/ja-jp/office/2013/business/powerbi/trial/default.aspx

Power Query による分析データの再分析 (Excel & HTML 入力編)

現場社員が自らデータ分析を行うための新しいサービスである Power BI for Office 365 の Power Query を利用して、公開されているデータを利用してみましょう。前回に引き続いての内容ですが、今回は、様々な府省が管理している統計データが公開されている「政府統計の総合窓口 (e-Stat)」のデータを利用します。

政府統計の総合窓口(e-Stat)
http://www.e-stat.go.jp/

今回、調査するのは、都道府県別の大卒者の正規就職率と教育費の関係性です。
利用するデータは、それぞれ以下のページから Excel ファイルHTML で取得可能であり、後者の Web サイト「都道府県別統計とランキングで見る県民性」では e-Stat からも取得可能な家計調査のデータを分析して掲載しています。

平成 25 年度の都道府県別 状況別 卒業者数
http://www.e-stat.go.jp/SG1/estat/List.do?bid=000001051739&cycode=0

学習塾・予備校費用 [ 2008年第一位 埼玉県 ]|新・都道府県別統計とランキングで見る県民性 [とどラン]
http://todo-ran.com/t/kiji/11604

はい、そうです。いずれも、既にある角度から分析されたデータです。ここでは、データ間の関係性を見るために、複数の分析されたデータを元に再度分析を実施します。

何かのデータ分析の結果を得るには、データ間の関係性を確認することは重要ですが、これを行うには、「それぞれのデータが何処かに存在することを知っている、あるいは知ることが出来る」「試行錯誤でデータ間の関係性を確認する」ことが重要であり、これを行えるのはデータ分析の専門家か、データの意味をよく知っている人であることが必要です。Power BI for Office 365 は、データの意味をよく知っている人 (= データ分析の専門家ではない人) が、データの在り処を知り、試行錯誤でデータ分析を行うためのサービスとなっています。

完成すれば、以下のような都道府県名、教育費や正規就職率でフィルターを掛けることが可能な分布図が完成します。なお、今回は Power Query の利用手順をかなり簡素化して記載していますので、必要な方はこちらから完成した Excel ファイルをダウンロードして確認してください。

image

事前準備

Power Query で拡張子が .xls の Excel ファイルを取得するために、事前に ACE (Microsoft Access データベース エンジン) 2010 SP1 以降のプロバイダを以下より取得してインストールしておきます。

Microsoft Access データベース エンジン 2010 再頒布可能コンポーネント
http://www.microsoft.com/ja-jp/download/details.aspx?id=13255

正規就職率の取得

  1. [POWER QUERY] タブの [外部データの取り込み] – [ファイルから] – [Excel から] を選択し、[ファイル名] に以下の URL を入力し、[OK] をクリック
    http://www.e-stat.go.jp/SG1/estat/Xlsdl.do?sinfid=000023610209
    image
  2. クエリー エディターが開くので、[バイナリ] タブの [開く] – [形式を指定してファイルを開く] から [Excel ブック] を選択します
    image
  3. シートが表示されるので、1 行目 (Name 列の値が「73(2-1)」の行) の Data 列に書かれている「Table」をクリックします
    image
  4. シートの内容が表示されるので、順に以下の操作を行います
    image
    1) 不要な列 (Column2, 4, 5, 6, 8, 9 以外の列) を削除
    2) 列名の変更
    3) [上位の行の削除] から最初の 10 行を削除
    4) 「元都道府県」列から値が「null」と「都道府県別は…」の行を対象外に
    image
    5) 列のデータ型の変更
    6) 正規就職率の列を追加
    image
    7) [挿入] タブの [カスタム列の挿入] から、「都道府県」列を以下の式で追加 (元の都道府県名を正規化しています)
    Text.Replace(Text.Replace(Text.Replace(Text.Replace(Text.Remove([元都道府県名], “ ”) & “県”, “北海道県”, “北海道”), “大阪県”, “大阪府”), “京都県”, “京都府”), “東京県”, “東京都”)
    8) [名前] を「都道府県別正規就職率」、[ワークシートへの読み込み] のチェックを外し、[データ モデルへの読み込み] にチェックを入れたら [ファイル] タブの [適用して閉じる] を選択します
    image

都道府県別の教育費の取得

  1. [POWER QUERY] タブの [外部データの取り込み] – [Web から] を選択し、[URL] に以下の URL を入力し、[OK] をクリック
    http://todo-ran.com/t/kiji/11604
    image
  2. ナビゲーター ペインに HTML を解析した結果の構造が表示されるので、[Table 0] を選択します
    image
  3. シートの内容が表示されるので、順に以下の操作を行います
    image
    1) 余分な列 (1 列目と 4 列目) を削除
    2) 列名の変更
    3) 最初の 2 行を削除
    4) 「教育費」列を以下の数式で追加し、データ型を数値型に
    Text.Remove([単位付き教育費], “円”)
    5) 「都道府県」列から値が「全国」の行を対象外に
    6) [名前] を「都道府県別教育費」、[ワークシートへの読み込み] のチェックを外し、[データ モデルへの読み込み] にチェックを入れたら [ファイル] タブの [適用して閉じる] を選択します
    image

2 つのクエリの結合

ここまでで作成した 2 つのクエリを結合して、一つのデータ モデルを作成します。結合したデータ モデルを作成しておくと、Power View や Power Map によってデータをグラフや地図上に表示する際に操作が行い易くなります。
RDBMS のリレーションの作成と似ていますが、実際には RDBMS の 2 つの表を結合して、新しい表を作成しているイメージになります。

  1. [POWER QUERY] タブの [結合] – [マージ] を選択し、作成した 2 つのモデルと「都道府県」列を選択し、[OK] をクリック
    image
  2. シートの内容が表示されるので、順に以下の操作を行います
    image
    1) 「NewColumn」列右側のアイコンをクリックし、「教育費」のみを選択します
    image
    2) 列名を「教育費」に変更します
    3) 余分な列 (「正規就職率」「都道府県」「教育費」以外の列) を削除します
    4) 「都道府県」列をドラッグして一番左へ移動し、ドロップし、[名前] を「正規就職率と教育費」、[ワークシートへの読み込み] のチェックを外し、[データ モデルへの読み込み] にチェックを入れたら [ファイル] タブの [適用して閉じる] を選択します
    image

レポートの作成

レポートの作成には、いつものように Power View を利用します。

  1. [挿入] – [レポート] – [パワー ビュー] でパワー ビューのシートを追加します。
  2. [正規就職率と教育費] モデルから、以下の設定の散布図視覚エフェクトを追加します。
    image
  3. 最後に、以下の設定の集合縦棒グラフ視覚エフェクト (レポート下) を追加すれば完成です。
    image

ここまでの手順で、以下のようなレポート画面が表示されているはずです。
このグラフによって、実は、教育費を掛けたからといっても正規就職率が上がるわけではないこと (教育費と正規就職率には明確な相関関係がないこと) がわかります。
image

教育費の大小ではなく、どちらかと言えば、地方に住む人の方が正規就職率は高く、
image

沖縄県の正規就職率は他と比較しても非常に低いことや、image

北海道と沖縄県を比較すると、真逆に位置していることなども見えてきます。
image

データ分析は続くよ

容易に思いつく分析の視点として、正規就職率が高くても給与が低いのではないか、男女の差はどうなのか、複数年分のデータを見て過去からの推移を確認するなどが挙げられます。今回のサンプルではここまでですが、同じようにデータを見つけて手順を繰り返せば、きっと手に入れたいデータ分析の結果が得られることでしょう。

また、Power BI for Office 365 の機能をフルに使えば、Power BI データ カタログ機能で会社の中で誰かが作成した Power Query によるクエリを再利用したり、Power BI Q&A 機能で誰かが作成した Excel ファイル内のデータ モデルから簡単にグラフを作成することが可能です。ひとりで頑張るのは時間が掛かってしまい効率的ではありませんので、データ分析はみんなで行うことをお薦めします。