Data Warehouse
基幹系 (業務)システムから取引データなどを抽出・再構成して蓄積し、
情報分析と意思決定を行うための大規模データベース
「意思決定のために、目的別ごとに編成され、統合化された時系列で、更新処理をしないデータの集まり」
・・・データウェアハウスを提唱したビル・インモン(William H. Inmon)氏の定義)
DWHの構成
基幹系システムは、「経理」「販売」「在庫」「購買」というように、
機能ごとにシステムが構築されている。
これらのシステムでは、データの形式等が異なるということがあり、
また共通のキーを持たない為、 そのままでは分析には不向きである。
この為、「顧客」「製品」などの形で統合するのが“目的別” であり、
異なるシステムに分散されているデータを1つのデータベースに集めるのが“統合化”である。
これらをまとめて格納したものがデータウェアハウス(Data WareHouse 以下、DWH)や
データ・マート(以下、
DM
)である。
また、 基幹系システムは「今月の売上」「現在の在庫」「今期の利益」といった様に、
今現在の業務を処理する為ものであるため、過去のデータは長期間保存しない。
(「過去の顧客推移」 を分析したいという場合にスムーズに対応できない。)
これに対し、DWHは過去データも順に格納するが、これが“時系列”である。
DWHは基幹系システムと独立して構築される。
(基幹系システムに対して、 DWHは情報系システムと呼ばれる。)
DWHに格納されたデータを分析するツールとしては
OLAP
(OnLine Analytical Processing)がある。