トップ分析手法 > 回帰分析

回帰分析

回帰分析

複数の要因から未来を予測する。

データから未来を予測?

回帰分析という名前だけは知っているAさん。回帰分析という手法を仕事に活かせないかと、統計に詳しい大学時代の先輩Bさんに相談しました。Bさんは、Aさんが喫茶店向け商品の卸売会社で営業を担当していることを知ると、既存顧客の「売上金額」「駅からの距離」「駅乗降者数」「座席数」を教えてくれれば、新しく開拓する顧客からどの程度売上を確保できるか予測できるというのです。Aさんは半信半疑です。顧客が特定されないようにデータを加工して渡しました。

経験に頼らない客観的な基準

回帰分析

さらに、Aさんは新しく開拓する顧客の「駅からの距離」「駅乗降者数」「座席数」を伝え、年間で300万円の売上を想定していると伝えました。BさんはPCにデータを入力したあと、年間450万円ほどの売上が上がるだろうと予測しました。Bさんは数式をもとにいろいろ説明してくれましたが、細かいことは良く分かりませんでした。ただ、過去のデータをもとに話しているため全く根拠の無い話ではないようです。今までは漠然とした経験から売上を予測していましたが、客観的な基準を持つことにより効率的な顧客開拓ができると考えています。

利用事例

たとえば、こんなときに

  • 顧客の売上を予測したい

  • 売れている商品で最も重要な要因は何か知りたい

  • 新人スタッフがどの程度売上を上げるか知りたい

こんなことができます

  • 既存の顧客情報から売上に関係している属性を抽出して売上を予測する

  • 商品の属性をもとに回帰分析を行い、最も影響度の高い要因を探る

  • 新人スタッフの属性をもとに初年度の売上予測を行う

回帰分析の概要

説明変数(要因)から目的変数の値を予測します。

回帰分析

回帰分析はさまざまな呼び名を持っており、説明変数の数や質により呼び名が変わります。単回帰分析(説明変数が1つ)、重回帰分析(説明変数が2つ以上)、数量化Ⅰ類(説明変数が質的)などです。しかし、基本的な考え方は同じです。単回帰分析を例に取ると、説明変数の最も小さいばらつきのところに直線を引くこと、これが回帰線といわれ「y=ax+b」で表されます。xに説明変数を入れると、yの目的変数が定まる一次関数です。係数aと切片bを求めることにより、未知の説明変数xを入力すると目的変数yが求められます。

説明変数の選択

良いモデルを作るためには、最適な説明変数の選択が重要になります。以下は、説明変数選択の基準を与えます。

有効性の検討

回帰式が役に立つか否かを評価するため自由度調整済みの重相関係数(R2)を確認します。0.3未満では悪く、0.8以上あれば非常に良いと解釈します。

有意性の検討

説明変数の分散が回帰によって説明できる部分と、説明できない部分に分解されます。これを回帰の分散分析から説明変数で目的変数を説明できるか、できないかを検定します。

説明変数の目的変数に対する影響度

各説明変数の目的変数に対する影響度比較するとき、偏回帰係数により確認します。
また、説明変数相互間で相関の高いものは含めない方がよいです。これは多重共線性といわれ、正しく推計できなくなる可能性があります。これを避けるためVIF(variance inflation factor)により判断します。10以上であれば、多重共線性が存在していると考えることができます。

ステップワイズ法

目的変数に対して出来るだけ役立つ説明変数を自動的に選択したい場合、ステップワイズ法を選択します。Trunk tools では、AICを基準に選択した説明変数の中から最適な説明変数を判別します。目的変数を予測する際、説明変数を増やせば増やすほど、測定データとの適合度を高めることが出来ます。しかし、ノイズなどの偶発的な変動にも考慮されるため、データにあわなくなります。このデータとの適合度のバランスをとるため、AICが利用されます。AICは赤池情報量規準といい、多くの場合、この値が最小のものが良いモデルとなります。ただし、機械的に行なうため、最適なモデルが選択されない場合があります。ステップワイズ法で変数を確認して、最終的にはステップワイズ法をなしにして分析する方法がとられます。

シミュレーション

回帰分析は未来を予測するという強力な手法です。算出した回帰式に説明変数を入力することで、実際に起こっていないことも予測することができます。漠然とした経験に頼ることなく、数学的に判断の基準が得られます。ただし、過去の実績や説明変数の選択により、全く異なる未来を算出する可能性もあります。現実の世界はさまざまな変数により成り立っています。統計全般に言えることですが、使用法を守り、過剰な信頼を排除することが必要です。遠い未来は誰も予測できないことを意識して、説明変数を変更するなど、PDCAをまわすことが重要になります。

Trunk tools は誰でも簡単に分析できます

クリックだけで分析結果を集計表示

目的変数と説明変数を目的にあわせて変更してください。

回帰分析の設定

手法選択のモデル選択で、ステップワイズ法のあり・なしを指定します。

分析結果の表示

回帰統計、分散分析、回帰係数を表示します。上部にあるシミュレーションタブで、分析結果のモデルをもとにシミュレーションを行なうことができます。

回帰分析の分析結果:回帰統計、分散分析、回帰係数

ブックマークに登録すれば、分析を行なったときのメモとあわせて、いつでも分析結果を復元できます。

分析結果の見方がわからなくても安心

グラフや数値の見方がわからなくても、分析結果とあわせて表示されるポイントとヘルプで、すぐに業務にご活用いただけます。

回帰分析を確認したら

その他の分析も参考に

分析手法一覧から調べたい手法を選択してください。

Trunk toolsでは、業務データから回帰分析をスムーズに行います

すべてのサービスのデータを組み合わせて利用できます

  • 販売管理のデータと顧客データで、顧客の属性により、どの程度売り上げがあがるか予測する。

  • 予約管理のデータで、予約枠の属性により、どの程度売り上げがあがるか予測する。

サービス一覧から利用できる業務データをご確認ください。