判別分析：対象の特性から、どちらのグループに分かれるかを判別

判別分析

対象の特性から、その対象がどちらのグループに分かれているかを判断する。

リピートする顧客層を判別

観光地でホテルを経営しているAさんは、広告掲載のためにターゲットを絞り込んでいます。ターゲットはリピートが見込める顧客を対象にしたいと考えています。今までの顧客履歴から顧客の属性を選別して、リピート顧客にアピールするクリエイティブを作成したいと考えています。顧客情報からリピートに関連するであろう、年齢、職業、年収、滞在人数などをもとに判別分析を行いました。

ふたつのグループに分ける

判別分析

リピート数が0か1以上かを判別分析で検証した結果、年齢が高いく、年収が高い顧客であることは想定していましたが、滞在人数は少ないほどリピートに影響していることがわかりました。ファミリー向けではなく、高齢者を対象とした広告掲載を進めることにしました。広告掲載にあわせて高齢者向けのプランも検討しようと、Aさんは次の一手を考えています。

▲判別分析ページ上部へ

利用事例

たとえば、こんなときに

見込先が優良顧客になるか知りたい
新商品の機能を過去の実績から選定したい
ある取引先に対して最適な人選をしたい

こんなことができます

売上金額が5万円以上になるであろう顧客を属性から選別する
既存商品の属性から最も販売数が多くなる機能を判別して新商品を企画する
対象の取引先業態で業績の良いスタッフの属性をもとに判断する

▲判別分析ページ上部へ

判別分析の概要

説明変数（要因）から2つのグループのどちらに判別されるかを分析する。

判別分析

判別分析は、2つのグループに分けるときに基準となる要因を数学的に発見し、その影響度を測定する手法です。計算方法は回帰分析と同様に回帰式を用いて説明変数の影響度により区分します。回帰分析と異なるのは目的変数が2値となる点が大きく異なります。例えば、購買する・しない、特定の金額以上・以下など、どちらのグループに入るかを判断します。

説明変数の選択

良いモデルを作るためには、最適な説明変数の選択が重要になります。以下は、説明変数選択の基準を与えます。

正判別率

モデル式により、実際のデータでの判別の正答率を表示します。当然、正判別率が高ければ、実際のデータに適したモデルといえます。

有効性の検討

回帰式が役に立つか否かを評価するため自由度調整済みの重相関係数（R2）を確認します。0.3未満では悪く、0.8以上あれば非常に良いと解釈します。

有意性の検討

説明変数の分散が回帰によって説明できる部分と、説明できない部分に分解されます。これを回帰の分散分析から説明変数で目的変数を説明できるか、できないかを検定します。

説明変数の目的変数に対する影響度

各説明変数の目的変数に対する影響度比較するとき、偏回帰係数により確認します。
また、説明変数相互間で相関の高いものは含めない方がよいです。これは多重共線性といわれ、正しく推計できなくなる可能性があります。これを避けるためVIF（variance inflation factor）により判断します。10以上であれば、多重共線性が存在していると考えることができます。

ステップワイズ法

目的変数に対して出来るだけ役立つ説明変数を自動的に選択したい場合、ステップワイズ法を選択します。Trunk tools では、AICを基準に選択した説明変数の中から最適な説明変数を判別します。目的変数を予測する際、説明変数を増やせば増やすほど、測定データとの適合度を高めることが出来ます。しかし、ノイズなどの偶発的な変動にも考慮されるため、データにあわなくなります。このデータとの適合度のバランスをとるため、AICが利用されます。AICは赤池情報量規準といい、多くの場合、この値が最小のものが良いモデルとなります。ただし、機械的に行なうため、最適なモデルが選択されない場合があります。ステップワイズ法で変数を確認して、最終的にはステップワイズ法をなしにして分析する方法がとられます。

シミュレーション

判別分析も回帰分析と同様に未来を予測する性質があります。ある要因をとる場合、どちらのグループに入るかを判断するためです。今まで経験的に判断していたことを数学的に証明することができます。体調が悪い日でも的確に判断をくださいます。あなたは判断のエビデンスを得ることで確信をもって、また効率的に業務を行えるようになるでしょう。

▲判別分析ページ上部へ