膨大なデータから意味ある情報を発掘! 「データマイニング」のここがすごい

効果の高いマーケティング施策の立案には、さまざまな客観的情報が欠かせません。そのような客観的な情報を得るための1つの有効な手段が「データマイニング」です。データマイニングとは何なのか、またどのようにマーケティングに活用されるのかを解説します。

膨大なデータから意味ある情報を発掘! 「データマイニング」のここがすごい

効果の高いマーケティング施策の立案には、さまざまな客観的情報が欠かせません。そのような客観的な情報を得るための1つの有効な手段が「データマイニング」です。データマイニングとは何なのか、またどのようにマーケティングに活用されるのかを解説します。

データマイニングとは

「ビールと紙おむつ」の逸話

データマイニングの事例として頻繁に語られるのが、「ビールと紙おむつ」の逸話です。データマイニングの有用性が初めて実証された例として伝説的に語られていますので、お聞きになられた方も多いかと思います。1992年に米紙ウォール* ストリート* ジャーナルに掲載されたその内容は、「スーパーマーケットチェーンの販売データを分析した結果、ビールと紙おむつを同時に購入する顧客が多いことが判明。

その理由について調査したところ、子供のいる家庭(米国)では母親が父親に紙おむつ購入を依頼し、父親は紙おむつのついでに缶ビール購入していたことが分かった。そこで2つの商品を並べて陳列してみると、売上が上昇した」というものです。

現在では伝説的に語られるケースも多いので、前後に他の逸話が挿入されていたり、該当のスーパーマーケットが何故か日本のスーパーマーケットになっていたりするケースがあるのですが、それにしてもデータマイニングの意味をよく捉えている逸話には間違いありません。

データマイニングの目的

マイニング(Mining)には「採鉱」や「採掘」という意味があります。採掘が広大な鉱脈の中から貴重な宝石を見つけ出すように、膨大なデータの中から価値ある意味を掘り起こしてくることがデータマイニングの目的です。

では、データの中の「価値ある意味」とは一体何なのでしょうか。それは前述の逸話のように我々に何らか具体的な利益(金銭とは限りません)をもたらしてくれる知見や発見のことです。詳しくは後述しますが、実際には多くの場合、データの分類や関連性、予測などの知見や発見が我々に何らかの利益をもたらしてくれることになります。

データマイニングの準備作業

データマイニングの詳細をする前に、実際にどのような手順でデータマイニングを行うのかを簡単に確認しておきましょう。データマイニングのためにはまずデータ収集が必要になります。データ収集の方法は割愛しますが、収集したデータは多くの場合、マイニング向けに事前に構築された「データウェアハウス(DWH)」内に格納します。

DWHはマイニング作業時にデータを取り出しやすく、かつ大量のデータを効率的に保管しておくようにするいわばデータ保管庫です。データ更新などを行うことを前提としていませんので「データベース」とは考え方や構造が異なります。そしてDWHに格納されたデータはマイニング適したデータ形式に加工(形式の統一や正規化)した後に実際のマイニング作業を行います。

さまざまなデータマイニングの手法

統計* 分析との違い

データに基づいた分析を実施し、何らかの結論を導く手法という意味でデータマイニングと似たものに「統計解析」があります。両者の違いは、統計解析が一般的に「取り扱うデータ量が少なく、事前に設定された仮説の検証を行うもの」に対して、データマイニングは「取り扱うデータが多く、新たな知見を発見するために行われるもの」とされます。

確かにデータマイニングでは「新たな知見の発見」に着目されるケースが多いのですが、仮説検証を目的としたデータマイニングを行う場合もあり、上記のような分類は必ずしも適切であるとは言えません。むしろデータマイニングに仮説検証型と知識発見型があり、統計解析とは結論や解答を導き出す手法に違いがあると考えた方が正確です。

それでは具体的にデータマイニングにはどのようなものがあるのか、代表的なものを見てみましょう。

関連性を発見する

データマイニングでは、データを読み解くことで物事の間の関連性を発見することができます。その1つが「マーケット* バスケット分析」です。POSデータやECの購入データなどを対象にデータ同士の関係性を分析することで、例えばどのような商品をどのような顧客が同時購入しているのかが分かります。

冒頭の「ビールと紙おむつ」はこのような手法の事例の1つです。これが分かれば、いわゆるクロスセルをより有効に働かせるような商品配置(実店舗、ECのバーチャル店舗にかかわらず)や、おすすめ商品の選定などに応用することができます。

また、Webマーケティングでは、Webサイトの利用履歴を始めとした多くのデータ間の関連性分析に活用されており、例えばあるコンテンツをダウンロードした顧客と実際の商品の購入の関係など、さまざまなマーケティング分析に用いられています。

物事を予測する

未来を完全に予測することはできませんが、それでもデータマイニングによって特定の事象が起こる確率を予測することはできます。その手法の1つが「ロジスティクス回帰分析」です。ロジスティクス回帰分析は、YESとNO(あるいはONとOFF、有りと無しなど)がはっきり識別できる事象に対して、その発生確率を予測するものです。

例えば、ダイレクトメールを送付して商品を購入する人と、送付しても購入しない人が分かれば、より効率良くダイレクトメールを送付するなど、費用対効果の高いマーケティング活動が可能になります。

その他「決定木分析」という手法もあります。これはIF THEN形式でデータを分類して予測する方法です。ロジスティクス回帰分析と一見似ていますが、こちらは、原則すべての条件分岐を洗い出すことでデータの「分類」にも活用できることが特徴です。

このようなデータマイニングでの予測値は、「過去のデータに基づいて算出されたもの」であることを自覚しておかなければなりません。そして過去に発生していない事象が起これば、予測が大きくはずれる可能性があることを認識しておく必要があります。

物事を分類する

何らかの類似性に基づいて対象を分類する方法が「クラスター分析」です。例えば単純に既婚者と未婚者を分けることは簡単ですが、年齢や性別、購入商品や購入履歴、Webサイトの訪問履歴など、多くの要素(データ)から類似性を見つけ出して「似た者同士」を分類することは手作業では困難です。この手法は、広告やダイレクトメールなどを出稿* 発信する際の対象のターゲティングなど、さまざまなマーケティング施策を実施する際の顧客セグメント(層分類)に利用されます。

もう1つ物事を分類する際によく利用される手法に「主成分分析」があります。これはより特徴的な情報(主成分)を見つけ出すことでデータを要約し、その主成分のみの少ないデータで分類できるようにする方法です。例えば自社にとっての「優良顧客」をきっちりと定義するのは、自社に対する貢献のあり方がさまざまであることなどから一般的には困難ですが、この主成分分析を使うことで、比較的簡単に定義* 分類することが可能になります。主成分分析はこのような優良顧客などその「特徴」自体に意味があり、なおかつ定義が困難な分類に有効です。

まとめ

  • データマイニングとは、膨大なデータの中から価値ある意味を掘り起こしてくること
  • データマイニングの際には、データ格納* 加工のためのデータウェアハウスを構築する場合が多い
  • データマイニングの手法には、物事の関連性を発見するマーケット* バスケット分析や、物事を予測するロジスティクス回帰分析、物事を分類するクラスター分析などがある

現在、データドリブン(データ志向)のデジタルマーケティングの手法が多く用いられつつあるため、データマイニングの重要性は従来よりも増しています。またデジタルマーケティングでは、比較的容易にデータ取得が可能です。さらにビッグデータの重要性などが叫ばれており、その活用方法として今後データマイニングがますます重要視されることが予想されます。

  • マーケティングオートメーションツール選定ガイドブック