第12回 - 2013/12/20
実習で使うデータを、以下の手順でダウンロードして、Excelで開いてください。以下の手順は、Internet Explorerを使った場合です。
いろいろな場面でアンケートの集計を行うということもあるだろう。また、世の中にはそうした集計を仕事として請け負うような会社もけっこうある。アンケートは、すでに決まった形式のもの(有名な心理テストなど)もあるけど、普通はその都度違った内容のアンケートを取り、抽出したいデータもその時々で違っている。こうしたデータ処理では、非常に規模の大きなものでは、専用のソフトウエアを作成することもある。しかしながら、表計算ソフトのExcelやあるいはデータベースソフトなどを使って集計処理を行うこともある。また、その集計結果をまとめるのにWordなどのワープロを使うこともある。集計結果では表もあればグラフもあるだろう。いずれにしても、パソコンを駆使する格好の題材であるとも言えるわけだ。
しかしながら、逆にいえば、決まりきったやり方があるわけではなく、目的や調査内容に合わせて、パソコンを独自に駆使して結果を出さないといけない。最終的には統計解析をやることもある。しかしながら、いずれにしても、毎回、パソコンを使いこなすということが必要とされる。
ここで重要なことは、最初からある程度の目星をつけておくことだ。とにかく、入力すれば何とかなるかもしれないが、あるところでいきなり破綻することもある。もちろん、最初からそうしたことができれば文句はないが、幾度かの失敗を乗り越えで、計画的に調査報告を作れるようになってもらいたい。
それで、以下の実例は、実際にあった話をもとに、同じようなデータを構築して例を示す。以下のようにすると、途中で破綻をきたすのだが、それをどうやって克服するかも入り口の部分を説明しておこう。
次のような架空のアンケートがあるとする。内容はいいかげんだけど、まあ、ありがちなアンケートだ。つまり、いくつかの選択肢から選ぶ。また、選択肢は1つだけのこともあるが、複数の選択もありとする問題もある。もちろん、答えるから得たい内容や、あるいは答えやすさなどからこうしたバリエーションができるのは必然的なことである。
設問1 | あなた自身、いわゆる「環境問題」にどの程度関心がありますか | |
1- | まったくない | |
2- | 少しある | |
3- | ややある | |
4- | かなりある | |
5- | 大いにd関心がある | |
設問2 | 環境問題に関する討議に参加したことがありますか | |
1- | いいえ | |
2- | はい | |
設問3 | 身近な環境問題としてごみの扱いをお尋ねします。あなたは実際にどうしているのか、1つだけ | |
1- | ごみの収集場所や日にちなどはまったく意識せず、好きなときにごみを出している | |
2- | 収集場所には出しているが、日についてはあまり意識していない | |
3- | ごみの日に収集場所に出しているが、分別はあまり考えていない | |
4- | ごみの収集場所に、決められた日に分別して出している | |
5- | ごみは出していない | |
設問4 | ごみはどのように出せるようになればいいと考えるでしょうか、いくつでもお答えください | |
1- | 場所や日にちを意識しなくてもいいように、いつでも出せる体制が望まれる | |
2- | ごみは個別収集をして、収集場所ということ自体を撤廃すべき | |
3- | 収集場所を使う家庭を管理して限定し、清掃当番を確実に平等にすべき | |
4- | 不法投棄の取締りを強化すべきだ | |
5- | 分別が面倒だしよくわからない。なるべく分別の区分は少なくすべきだ | |
設問5 | ごみ問題の管理はどこがすべきだと考えるでしょうか。1つだけ答えてください | |
1- | 自治会 | |
2- | 市区町村 | |
3- | 都道府県 |
“とにかくExcelに入力すれば数えらるだろう”まあ、あたらずとも遠からずというところである。そこで、誰もが思いつくような入力をしてみた。
「apinfo9_trial.xls」の「アンケートの集計結果」のシートは、このアンケートの結果をワークシートに入力したものである。1人のアンケート回答を、1行に入力した。設問ごとに入力したが、複数回答のある設問4については、複数の列を用意した。
こういうアンケートの集計では、たとえば、設問1の1〜5の選択肢に対して、それぞれ何人の人が答えたかを知りたいと考える。
考えられるのは次のような方法だ。
カウントをするために式の設定を全部の設問に対して行うのは、いかにも大変だ。しかしながら、そのままではピボットテーブルはどう考えても適用できない。そこで、プログラムを作り展開しなおした。 → 実際にやってみます
プログラムとは次のようなものだ。
ここでのポイントは次の通り
このように展開すると、集計やピボットテーブルを利用できる。
この講義ではプログラムを作ることまでは求めていないが、こうした機能があることを知っておいてもらいたいことがまず1つの重要なポイントである。ただし、プログラム作成はそれほど簡単ではない。それなりにじっくり勉強しないと思ったとおりのものは作成できない。だから、締め切り間際に慌てて勉強しても遅い。だが、アンケートの処理だと、アンケートの回収の間に時間があるので、勉強をしてプログラムをあらかじめ作っておくなどの対処はできるはずだ。
「apinfo9_trial.xls」の「アンケートの集計結果 (2)」のシートは、同一の回答を別の基準で入力したものである。少なくとも、設問ごとの合計数はこれだと簡単に分かる。重複回答の有無に関係なく同一の方法で可能である。
結果的に、アンケートを始める段階で、最終的にどのように集計すればいいかが計画されていれば、途中でコケることはない。
今回の講義のようなアンケートだと、ある設問と別の設問の解答が密接に関連していることがあるかもしれない。こうした統計処理は、相関係数かと思うかもしれないが、実はこの場合は相関係数を求めてもあまり意味はない(なぜだか考えてみよう)。
そうした難しいこと以前に、次のような表を作ってはどうだろうか。
以上のような表を作ってみよう。少なくとも、設問1と設問4に関する表を作ってみること。
難しい統計処理もそれなりに重要だが、こうした地道な処理がそれ以前に重要である。こうして得られた結果を補強するために統計処理を使う場合もある。
トピックは、設問1と設問4の相関関係を見たい場合でしょう。ほかのものは、データの組ができあがっているけど、設問4だけは4列あります。
そこで、4列ある設問4を次のように、認識します。
設問1 | 設問2 | 設問3 | 設問4 | 設問4 | 設問4 | 設問4 | 設問5 | |
A001 | 2 | 4 | 1 | 2 | 4 | 1 | ||
A002 | 4 | 5 | 1 | 5 | 3 | |||
: | : | : | : | : | : | : | : | : |
C011 | 1 | 3 | 1 | 2 | 5 | 2 | ||
C012 | 3 | 4 | 1 | 2 | 3 | 1 |
ここで、設問1のセルを縦に4回分並べます。つまり、設問4の列の数だけ並べるということです。そして、それぞれの設問1の右側に、4列あるそれぞれの設問4のセルを並べます。つまり、以下の図のように、並べ直すということです。もちろん、別のシートに並べなおすのが基本でしょう。ただ、実際の作業は30行くらいある各列の移動などは結構ミスをしやすいものです。変なところにペーストしないようにするなどの注意が必要です。
設問1 | 設問4 | |
A001 | 2 | 2 |
A002 | 4 | 5 |
: | : | : |
C011 | 1 | 2 |
C012 | 3 | 2 |
A001 | 2 | 4 |
A002 | 4 | |
: | : | : |
C011 | 1 | 5 |
C012 | 3 | 3 |
A001 | 2 | |
A002 | 4 | |
: | : | : |
C011 | 1 | |
C012 | 3 | |
A001 | 2 | |
A002 | 4 | |
: | : | : |
C011 | 1 | |
C012 | 3 |
この後、3列のリストを、設問4の列を基準にして並べ替えると、設問4が空欄の行がひとつのところに固まります。そして、それらの設問4が空白の行を削除することで、設問1と設問4の対応が各行に記載されたリストができあがります。そして、ピボットテーブルを作成すればよいでしょう。