検索

明細データを持つことに意味がある


基本要件以外にデータウェアハウスを価値あるものにする上で重要なポイントが、「明細データを持つ」ということです。

明細データとは

明細データとは、企業あるいはその業務システムで発生するアトミック(原子)レベルのデータのことです。素データともいいます。小売業の例でいうと、レジのスキャナで読み取ったバーコードひとつひとつの内容が 1件ずつのデータになっているものが、買上明細データです。銀行の場合ですと、給与振り込みとか残高照会、 ATM での現金引き出し、電気代の自動引き落としなどの動きのすべてを記録したものを、取引明細データといいます。

このような明細データは、もともと業務システム内部の処理のために一時的に保持されるもので、日次や月次の処理が終わって用済みになると、削除されるのがふつうです。(システムのバックアップ目的で一定期間テープ装置等にログを残していても、通常業務ではそのようなデータにアクセスすることはできません)

データウェアハウスは、今まで見捨てていた明細データを時系列で蓄積して、そこから情報を引き出せるようにします。ただ、実際のデータウェハウスでは、入力された暗証番号など、セキュリティ上慎重な扱いが求められる情報は除外している場合が多いので、どうぞご安心を。そのかわり、暗証番号エラーなどがあった時は、エラーがあったことを示すレコードをデータウェアハウスに格納しています。

サマリーデータとは

かつては情報系システムといっても、たいてい明細データは保有していませんでした。月末時点での残高や在庫のデータ、それから、月および決算期ごとに取引金額や件数を集約(サマリー)したデータを保有していました。その理由はデータを保管するストレージが高価だったこと、保管したとしても、膨大なデータを実際に活用できるコンピュータパワーを手に入れることが 1990年代以前は困難だったからです。

明細データを使うメリット

サマリーデータからは抜け落ちてしまう貴重な情報を、明細データは含んでいます。例えば、コンビニエンスストアの弁当の売れ行きを示すデータが、1時間単位にサマリーされたデータだったらどうでしょうか。オフィス街の店ではおそらく 11時30分過ぎころから 13時くらいまでの間に、多くの弁当が完売するでしょう。仮に 10種類の弁当を仕入れていたとします。さてどれが最も人気があったでしょうか?もし、1時間単位のサマリーデータだったら、だいたいどの弁当も 13時には売り切れていた、ということしかわからないでしょう。実際は、最も人気のある弁当はあっという間に、12時過ぎ早々に品切れになっていたかも知れませんね。そうすると、後から来たお客さんは、必然的に残った弁当から選択せざるを得ないわけで、その 10分後には 2番人気の弁当が売り切れる。そして次は 3番人気の商品が無くなっていく。こんなふうに、短い間にどんどん売れていく商品の様子をリアルに把握するためには、サマリーしていない明細データでないとだめなのです。まあ、コンビニエンスストアの実際はデータに頼りっぱなしではダメで、お店の人の観察眼が重要と思いますが…。

銀行では、店員の観察力で勝負とばかり言っていられません。とりわけサラリーマン顧客の場合、給料は振り込み、各種料金は自動引き落とし、現金を下ろすのは ATM、というように店員と対面で行う取引なんて、1年のうちに何回もありませんよね。でも、日本の銀行では長い間、顧客の様子を見るのは月次データというのが慣習でした。つまり、月末残高と月中平均残高というのを主に見るのです。確かに、4月の月末残高が 2,100万円、5月月末残高が 2,050万円、6月の月末残高が 2,200万円というお客さんだったら、たぶんいつも 2,000万円くらいのお金を預けていると想像しても、大きく違うことはないでしょう。でも普通の若いサラリーマン層に多い月末残高30万円前後の人だったら、どうでしょうか。

ここに Aさん、Bさん、2人の若手サラリーマンがいたとします。サマリーデータで見ると次のように見える 2人です。

Aさん:5月の月末残高は 25万円、月中平均残高は 9万円。

Bさん:5月の月末残高は 25万円。月中平均残高は 11万円。

たったこれだけの情報で 2人の財政状態の違いをイメージできますか?無理ですね。 だいたい似たような 2人かなぁ、としか言いようがないと思います。 もう少し気の利いたサマリーデータを持っている銀行だったら、月間の合計出金金額というサマリーデータを持っています。

Aさん:5月の総出金金額:約35万円。

Bさん:5月の総出金金額:約20万円。

これを見ると、Aさんの方が多くのお金が出て行っていることがわかりますね。でも、それがなぜなのかまでは想像つきません。 それでは明細データで見るとどうでしょうか。

Aさんは給料日直後には残高が 30万円を超えますが、あっという間に ATM でお金を引き出したり、多額のクレジットカードの引き落としがあったりして、給料日前には残高が 1,000円を切ってしまうギリギリの暮らしをしているようです。このような人には、カードローンのような商品をお勧めすると、利用してもらえるかもしれません。

一方、Bさんは給料日前でも残高は 7万円をキープしていますし、しかも 4月末と比べて 5月末の残高が増えています。かなり堅実な生活をしていそうです。このような人にはカードローンは必要無くて、積立型の貯蓄商品に興味を持ってもらえそうですね。

このように明細データで見れば、サマリーデータでは判らなかった 2人の財政状態あるいはライフスタイルの違いが、ずいぶん具体的にイメージできて、それぞれに適したセールストークを判断しやすくなります。

明細データとは、今回例にあげた小売業の POS や銀行オンラインデータのようなものに限りません。伝票や注文書で業務を行っているのでしたら、伝票や注文書単位のデータが明細データになります。データウェアハウスに明細データを蓄積して他のデータと組み合わせると、意思決定の精度を高めたり、新しい発見につなげることができるのです。


eventbanner.png