第11回 - 2016/12/16

相関係数と直線回帰


相関係数とは

対になったデータの関係性を評価する指数で、-1〜+1の間の数値となる。たとえば、

ただし、無意味な組み合わせを取っても、相関係数は求めることはできる。その場合、まったく無意味な数値なのか、あるいは世紀の大発見か、それはわからない。

数学的な意味では数値は求められるかもしれないけども、意味があるかどうかという議論は、数字を扱う以前の問題である。

相関係数の求め方

公式は次のとおり

実際に相関係数を求めてみる

あまり深い意味はないが、以下のような統計データがある。


前年
順位
社 名

業態本社
(本部)


売上高
(百万円)
前年度比
増減率
(%)
経常利益
(百万円)
前年度比
増減率
(%)
当期利益
(百万円)
12セブン&アイ・ホールディングス  HD東京25,337,80637282,01613.7133,419
21イオン  千葉24,824,7758.9188,303757,656
  イトーヨーカ堂東京21,511,5301.220,982▲32.113,356
34ヤマダ電機  群馬31,443,66112.471,74714.643,420
43ダイエー  兵庫21,283,888▲23.437,28853.741,298
55ユニー  愛知21,228,9462.244,9158.19,302
67高島屋  大阪21,049,4051.839,5437.625,319
76西友  東京12996,130▲3.7▲2,614-▲55,792
89大丸  大阪2837,0321.833,35310.617,304
98三越  東京2804,120▲4.517,019▲14.712,936
1010伊勢丹  東京3781,7982.933,4168.118,291
1111エディオン  HD大阪3740,2933.618,631▲8.67,367
1212ヨドバシカメラ東京3646,2707.538,12612.414,587
1313丸井  東京3552,140▲1.744,372▲3.94,248
  セブン−イレブン・ジャパン東京2516,9674.9176,763▲1.198,402
1414コジマ  栃木3501,3350.74,354▲31.11,917
  そごう大阪2500,7145.515,36517,416
1516ビックカメラ  東京8480,45310.912,729▲13.56,008
  西武百貨店東京2465,830▲3.516,811▲0.12,546
1620ファーストリテイリング  HD山口8448,81916.973,13824.840,437
1715イズミ  広島2446,8202.324,1346.413,157
1817ケーズホールディングス  茨城3431,1187.813,91024.77,142
1918ライフコーポレーション大阪2418,6155.18,26236.61,640
2019平和堂  滋賀2412,7724.613,4805.65,908

日経ナビ2008: 小売業ランキングより

求めるのは、

の相関係数とする。

ワークシートに計算プロセスを展開して計算をしてみる

実際にやってみます

関数を使った相関係数を求める方法

correl関数を使う 実際にやってみます

分析ツールを使った方法

実際にやってみます

検討

こんな公式も見られる

あるいはこんな公式も

実はまったく同じ数値を意味している。

余談

片方の軸が数値ではない場合に相関係数みたいなものを求めたいとする。たとえば、風向きと平均気温の関係のようなもの。あるいは、部屋の壁紙の色と作業効率の関係など。この場合に使われるのが、分散分析

要因がたくさんあるような測定値から意味のあるものを取り出す処理を因子分析主成分分析、あるいは多変量解析という。

直線回帰

グラフを描いたとき、そのプロットを平均的に貫く直線があるとする。その直線の式を求める。こうした直線を回帰直線と言う事もあるが、近似直線ということもある。

データとして、x = {x1, x2, ... , xn}、y = {y1,y2, ... , yn}があるとする。

y = ax +b という直線で表現できるとすると、

で、定数a、bを求めることができる。実際にやってみます。

元データからグラフを作成する場合は、「散布図」を利用すること。

グラフ上に近似直線を描くことができる。実際にやってみます。

そのほかの方法

SLOPE関数、INTERCEPT関数を使う。

分析ツールの回帰分析(ただし、回帰直線以外のさまざまな情報が得られる)実際にやってみます。



本日の演習

練習問題11-1

今日のデータのサンプルを利用して相関係数を求める。売上高と当期利益の相関係数を求めてみよう。また、この関係をグラフ(散布図)に描いてみよう。

練習問題11-2

まいどおなじみ日立市の気象と天気予報というページがある。気象観測データというリンクの先に今月の月別データというところがある。適当な月の情報を表示すると、そこには、毎日の平均気温や湿度などが一覧表になっている。

日射量と平均気温の相関係数を求めてみる。散布図も描く。

練習問題11-3

湿度と最大瞬間風速の相関係数を求めてみる。散布図も描く。