第7回 - 2000/11/9
対になったデータの関係性を評価する指数で、-1〜+1の間の数値となる。たとえば、
ただし、無意味な組み合わせを取っても、相関係数は求めることはできる。その場合、まったく無意味な数値なのか、あるいは世紀の大発見か、それはわからない。
数学的な意味では数値は求められるかもしれないけども、意味があるかどうかという議論は、数字を扱う以前の問題である。
公式は次のとおり
あまり深い意味はないが、以下のような統計データがある。
順 位 |
順前 年 位度 |
会社名 | 本 社 | 売上高 (百万円) |
伸び率 (%) |
経常利益 (百万円) |
店舗数 |
1 | 1 | 青山商事 | 広 島 | 157,293 | ▲3.0 | 17,304 | 683 |
2 | 2 | アオキインターナショナル | 神奈川 | 72,147 | ▲5.3 | 3,653 | 282 |
3 | 3 | コナカ | 神奈川 | 51,606 | 0.2 | 3,426 | 264 |
4 | 4 | はるやま商事 | 岡 山 | 49,505 | 0 | 3,477 | 238 |
5 | 5 | タカキュー | 東 京 | 28,195 | ▲12.7 | ▲1,764 | 221 |
6 | 7 | ワークマン | 群 馬 | 21,553 | 16.7 | 1,969 | 390 |
7 | 8 | フタタ | 福 岡 | 17,241 | ▲2.0 | 61 | 102 |
8 | 13 | ユナイテッドアローズ | 東 京 | 17,016 | 18.7 | 2,246 | 24 |
9 | 10 | ゴトー | 静 岡 | 16,874 | 4.9 | 252 | 79 |
10 | 6 | 三峰 | 東 京 | 15,926 | ▲19.5 | ― | 92 |
専門店売上高ランキングより
http://www.nikkei.co.jp/report/senmon1.html
求めるのは、
の相関係数とする。
実際にやってみます
correl関数を使う 実際にやってみます
実際にやってみます
こんな公式も見られる
あるいはこんな公式も
実はまったく同じ数値を意味している 実際にやってみます。
片方の軸が数値ではない場合に相関係数みたいなものを求めたいとする。たとえば、風向きと平均気温の関係のようなもの。あるいは、部屋の壁紙の色と作業効率の関係など。この場合に使われるのが、分散分析。
要因がたくさんあるような測定値から意味のあるものを取り出す処理を因子分析や主成分分析、あるいは多変量解析という。
今日のデータのサンプルを利用して相関係数を求める。売上高と店舗数の相関係数を求めてみよう。また、この関係をグラフ(散布図)に描いてみよう。
まいどおなじみ日立市の気象と天気予報というページがある。気象観測データというリンクの先に今月の月別データというところがある。適当な月の情報を表示すると、そこには、毎日の平均気温や湿度などが一覧表になっている。
日射量と平均気温の相関係数を求めてみる。散布図も描く。
湿度と最大瞬間風速の相関係数を求めてみる。散布図も描く。