第11回 - 2003/12/22
実習で使うデータを、以下の手順でダウンロードして、Excelで開いてください。以下の手順は、Internet Explorerを使った場合です。
いろいろな場面でアンケートの集計を行うということもあるだろう。また、世の中にはそうした集計を仕事として請け負うような会社もけっこうある。アンケートは、すでに決まった形式のもの(有名な心理テストなど)もあるけど、普通はその都度違った内容のアンケートを取り、抽出したいデータもその時々で違っている。こうしたデータ処理では、非常に規模の大きなものでは、専用のソフトウエアを作成することもある。しかしながら、表計算ソフトのExcelやあるいはデータベースソフトなどを使って集計処理を行うこともある。また、その集計結果をまとめるのにWordなどのワープロを使うこともある。集計結果では表もあればグラフもあるだろう。いずれにしても、パソコンを駆使する格好の題材であるとも言えるわけだ。
しかしながら、逆にいえば、決まりきったやり方があるわけではなく、目的や調査内容に合わせて、パソコンを独自に駆使して結果を出さないといけない。最終的には統計解析をやることもある。しかしながら、いずれにしても、毎回、パソコンを使いこなすということが必要とされる。
ここで重要なことは、最初からある程度の目星をつけておくことだ。とにかく、入力すれば何とかなるかもしれないが、あるところでいきなり破綻することもある。もちろん、最初からそうしたことができれば文句はないが、幾度かの失敗を乗り越えで、計画的に調査報告を作れるようになってもらいたい。
それで、以下の実例は、実際にあった話をもとに、同じようなデータを構築して例を示す。以下のようにすると、途中で破綻をきたすのだが、それをどうやって克服するかも入り口の部分を説明しておこう。
次のような架空のアンケートがあるとする。内容はいいかげんだけど、まあ、ありがちなアンケートだ。つまり、いくつかの選択肢から選ぶ。また、選択肢は1つだけのこともあるが、複数の選択もありとする問題もある。もちろん、答えるから得たい内容や、あるいは答えやすさなどからこうしたバリエーションができるのは必然的なことである。
環境問題に関するアンケート | |||
設問 1 | あなた 自身 、いわゆる「 環境 問題」にどの 程度関心がありますか | ||
1 - | まったくない | ||
2 - | 少しある | ||
3 - | ややある | ||
4 - | かなりある | ||
5 - | 大いに 関心がある | ||
設問 2 | 環境問題に 関する 討議に 参加したことがありますか | ||
1 - | いいえ | ||
2 - | はい | ||
設問3 | 身近な 環境問題としてごみの 扱いを お尋ねします。あなたは 実際にどうしているのか、1つだけ 答えてください | ||
1 - | ごみの 収集場所や 日にちなどはまったく 意識せず、 好 きなときにごみを 出 している | ||
2 - | 収集場所には 出しているが、 日についてはあまり 意識していない | ||
3 - | ごみの日に収集場所に 出しているが、分別はあまり考えていない | ||
4 - | ごみの 収集場所 に、 決められた 日 に 分別して 出 している | ||
5 - | ごみは 出 ダ していない | ||
設問 4 | ごみはどのように 出せるようになればいいと 考 えるでしょうか、いくつでも お答えください | ||
1 - | 場所や 日にちを 意識しなくてもいいように、いつでも 出 せる 体制が 望まれる | ||
2 - | ごみは 個別収集をして、 収集場所ということ 自体を 撤廃すべき | ||
3 - | 収集場所を 使 う 家庭を 管理して 限定し、 清掃当番を 確実に 平等にすべき | ||
4 - | 不法投棄の 取締りを 強化すべきだ | ||
5 - | 分別が 面倒だしよくわからない。なるべく 分別の 区分は 少なくすべきだ | ||
設問 5 | ごみ 問題の 管理はどこがすべきだと 考えるでしょうか。1つだけ 答えてください | ||
1 - | 自治会 | ||
2 - | 市区町村 | ||
3 - | 都道府県 |
“とにかくExcelに入力すれば数えらるだろう”まあ、あたらずとも遠からずというところである。そこで、誰もが思いつくような入力をしてみた。
「apinfo9_trial.xls」の「アンケートの集計結果」のシートは、このアンケートの結果をワークシートに入力したものである。1人のアンケート回答を、1行に入力した。設問ごとに入力したが、複数回答のある設問4については、複数の列を用意した。
こういうアンケートの集計では、たとえば、設問1の1〜5の選択肢に対して、それぞれ何人の人が答えたかを知りたいと考える。
考えられるのは次のような方法だ。
カウントをするために式の設定をを全部の設問に対して行うのは、いかにも大変だ。しかしながら、そのままではピボットテーブルはどう考えても適用できない。そこで、プログラムを作り展開しなおした。 → 実際にやってみます
プログラムとは次のようなものだ。
ここでのポイントは次の通り
このように展開すると、集計やピボットテーブルを利用できる。
この講義ではプログラムを作ることまでは求めていないが、こうした機能があることを知っておいてもらいたいことがまず1つの重要なポイントである。ただし、プログラム作成はそれほど簡単ではない。それなりにじっくり勉強しないと思ったとおりのものは作成できない。だから、締め切り間際に慌てて勉強しても遅い。だが、アンケートの処理だと、アンケートの回収の間に時間があるので、勉強をしてプログラムをあらかじめ作っておくなどの対処はできるはずだ。
今回の講義のようなアンケートだと、ある設問と別の設問の解答が密接に関連していることがあるかもしれない。こうした統計処理は、相関係数かと思うかもしれないが、実はこの場合は相関係数を求めてもあまり意味はない(なぜだか考えてみよう)。
そうした難しいこと以前に、次のような表を作ってはどうだろうか。
以上のような表を作ってみよう。少なくとも、設問1と設問4に関する表を作ってみること。
難しい統計処理もそれなりに重要だが、こうした地道な処理がそれ以前に重要である。こうして得られた結果を補強するために統計処理を使う場合もある。
トピックは、設問1と設問4の相関関係を見たい場合でしょう。ほかのものは、データの組ができあがっているけど、設問4だけは4列あります。
そこで、4列ある設問4を次のように、認識します。
設問1 | 設問2 | 設問3 | 設問4 | 設問4 | 設問4 | 設問4 | 設問5 | |
A001 | 2 | 4 | 1 | 2 | 4 | 1 | ||
A002 | 4 | 5 | 1 | 5 | 3 | |||
: | : | : | : | : | : | : | : | : |
C011 | 1 | 3 | 1 | 2 | 5 | 2 | ||
C012 | 3 | 4 | 1 | 2 | 3 | 1 |
ここで、設問1のセルを縦に4回分並べます。つまり、設問4の列の数だけ並べるということです。そして、それぞれの設問1の右側に、4列あるそれぞれの設問4のセルを並べます。つまり、以下の図のように、並べ直すということです。もちろん、別のシートに並べなおすのが基本でしょう。ただ、実際の作業は30行くらいある各列の移動などは結構ミスをしやすいものです。変なところにペーストしないようにするなどの注意が必要です。
設問1 | 設問4 | |
A001 | 2 | 2 |
A002 | 4 | 5 |
: | : | : |
C011 | 1 | 2 |
C012 | 3 | 2 |
A001 | 2 | 4 |
A002 | 4 | |
: | : | : |
C011 | 1 | 5 |
C012 | 3 | 3 |
A001 | 2 | |
A002 | 4 | |
: | : | : |
C011 | 1 | |
C012 | 3 | |
A001 | 2 | |
A002 | 4 | |
: | : | : |
C011 | 1 | |
C012 | 3 |
この後、3列のリストを、設問4の列を基準にして並べ替えると、設問4が空欄の行がひとつのところに固まります。そして、それらの設問4が空白の行を削除することで、設問1と設問4の対応が各行に記載されたリストができあがります。そして、ピボットテーブルを作成すればよいでしょう。