特集 特 集 新世代 速い、運用が楽! 新世代 BIツール3 製品 徹底研究 ツール B I 製品 徹底研究 3 曜日別、地域別、利益率、リピート購 クリックビュー タ ブ ロ ー 企業におけるデータ活用の機運が盛り上がるなか、 「QlikView」 「Tableau」 「Power BI」という新世代のBI(Business Intelligence)ツールが注目を集めて いる。処理が速い、ITエンジニアによる運用の手間が小さい―という特徴は、 どのように実現しているのか。分析画面の操作性とともに紹介する。(白井 良) 買率といった分析の 「軸」 に応じて、 デー タをツール内で加工したり集計したり しておく必要があった。そのため分析 の軸を追加するには、その都度、エン ジニアが加工・集計の設定をしなけれ ばならない。新世代BIツールは、その 56 「利用者が切り口を変えながらデー Softwareの「Tableau」 、米Microsoft 設定作業を大幅に軽減したという。 タを分析する、 『データ発見型』のBI の「Power BI for Office 365(Power 「速い」 「運用が楽」の秘密は、クラ ツールが台頭している」 。葡Gartner BI) 」の3製品だ。最大の特徴は処理 イアントPC上のインメモリー DBであ Portugalのジョアン・タパディニャス が速いこと。利用者が分析の切り口を る。3製品とも共通して備える。 氏(ビジネスアナリティクス リサーチ 変えると、秒単位の時間で応答してグ ハードディスクにアクセスしないこ ディレクター)はこう明言する。 ラフなどを表示する(図1) 。 とで、集計処理の速度は格段に向上す 特にシェアを伸ばしているのが、米 運用が楽なのも大きな特徴だ。従来 る。実メモリー容量を超えるビッグ QlikTechの「QlikView」 、米Tableau 型のBIツールでは、速度を高めるため、 データの集計もインメモリーで可能 NIKKEI SYSTEMS 2014.7 処理が遅い 運用が面倒 分析対象のデータ量が増えたり、複雑 な集計をしたりすると、 ディスクアクセス がボトルネックになり、 レスポンスが低 下する 曜日別、地域別といった新たな分析の 「軸」 を追加するには、 エンジニアがBI ツール内におけるデータの加工・集計 の設定をする必要がある 従来型の 一般的なBIツール 【エンジニアの作業例】 ・利用者ニーズを基に分析の軸を決める ・軸ごとの中間集計データを作る ・ 「多次元DB」 を作成する ・分析対象のデータをBIツールに取り込む ※太字の作業は、新世代 BI ツールで不要になるもの (サーバー中心の処理) 集計命令 データの 読み込み 結果 データウエアハウス (または業務システムのDB) 利用部門の担当者 運用が楽 分析対象のデータをクライアントPCのメモリー上に展開。 ディスクアクセスせずに集計し、 レスポンスを向上させる。 圧縮によりメモリー容量の数倍のデータを取り扱える 利用部門が自ら、分析の軸 【エンジニアの作業例】 を変えたり追加したりできる。 ・分析対象のデータをBIツール エンジニアの手間は小さい に取り込む 新世代 処理が速い 特 集 新世代BIツール BIツールのサーバー (クライアントPC中心の処理) B I BIツールのインメモリーDB (クライアントPC) 結果 3 製品 徹底研究 データウエアハウス (または業務システムのDB) ツール 集計命令 データの 読み込み 利用部門の担当者 1 新世代BIツールはエンジニアの作業を大幅に減らす 図 だ。例えばTableauのデータベースエ (1) データ領域を確保する仕組み ンジン「Tableau Data Engine」は、 データを列ごとに圧縮して 4分の1∼40分の1にサイ ズを減らす データを列ごとに取り込み、4分の1〜 40分の1のサイズに圧縮する( 図2) 。 クライアントPCのメインメモリー 16Gバイトのメモリーがあれば、数十 取り込んだデータに応じて データ領域のサイズを伸長 させる インメモリーのデータ領域 Gバイトのデータを取り扱えるという。 OS Tableau こうして集計処理を格段に速めたこ とで、切り口を変えるたび一から集計 しても十分に実用的になった。それゆ え、BIツール内でデータを加工したり (2)計算量を減らす仕組み クライアントPCのメインメモリー 集計したりしておく必要がなくなり、 そのための運用作業も不要になった。 Tableauの クライアントソフトの ユーザーインタフェース なお非力なクライアントでも使える ように、QlikViewとPower BIはサー バーで集計作業を行う構成も取れる 結果 データクエリー キャッシュ 集計処理の クエリー インメモリーのデータ領域 結果 過去に集計したデータをキャッシュする。 キャッ シュ済みのデータがヒットした場合は、 そのデータ を使って結果を返す (62ページの別掲記事) 。 以降ではツール別に、分析画面の操 作性や内部の仕組みを見ていこう。 集計命令 データを圧縮 した状態のま ま集計する 2 新世代BIツールにおけるインメモリー DBの機構(Tableauの例) 図 NIKKEI SYSTEMS 2014.7 57
© Copyright 2024