第10回 - 2008/1/7
実習で使うデータを、以下の手順でダウンロードして、Excelで開いてください。以下の手順は、Internet Explorerを使った場合です。
いろいろな場面でアンケートの集計を行うということもあるだろう。また、世の中にはそうした集計を仕事として請け負うような会社もけっこうある。アンケートは、すでに決まった形式のもの(有名な心理テストなど)もあるけど、普通はその都度違った内容のアンケートを取り、抽出したいデータもその時々で違っている。こうしたデータ処理では、非常に規模の大きなものでは、専用のソフトウエアを作成することもある。しかしながら、表計算ソフトのExcelやあるいはデータベースソフトなどを使って集計処理を行うこともある。また、その集計結果をまとめるのにWordなどのワープロを使うこともある。集計結果では表もあればグラフもあるだろう。いずれにしても、パソコンを駆使する格好の題材であるとも言えるわけだ。
しかしながら、逆にいえば、決まりきったやり方があるわけではなく、目的や調査内容に合わせて、パソコンを独自に駆使して結果を出さないといけない。最終的には統計解析をやることもある。しかしながら、いずれにしても、毎回、パソコンを使いこなすということが必要とされる。
ここで重要なことは、最初からある程度の目星をつけておくことだ。とにかく、入力すれば何とかなるかもしれないが、あるところでいきなり破綻することもある。もちろん、最初からそうしたことができれば文句はないが、幾度かの失敗を乗り越えで、計画的に調査報告を作れるようになってもらいたい。
それで、以下の実例は、実際にあった話をもとに、同じようなデータを構築して例を示す。以下のようにすると、途中で破綻をきたすのだが、それをどうやって克服するかも入り口の部分を説明しておこう。
次のような架空のアンケートがあるとする。内容はいいかげんだけど、まあ、ありがちなアンケートだ。つまり、いくつかの選択肢から選ぶ。また、選択肢は1つだけのこともあるが、複数の選択もありとする問題もある。もちろん、答えるから得たい内容や、あるいは答えやすさなどからこうしたバリエーションができるのは必然的なことである。
設問 1 | あなた自身 、いわゆる「 環境 問題」にどの程度関心がありますか | |
1 - | まったくない | |
2 - | 少しある | |
3 - | ややある | |
4 - | かなりある | |
5 - | 大いに 関心がある | |
設問 2 | 環境問題に関する討議に参加したことがありますか | |
1 - | いいえ | |
2 - | はい | |
設問3 | 身近な環境問題としてごみの 扱いを お尋ねします。あなたは実際にどうしているのか、1つだけ | |
1 - | ごみの 収集場所や 日にちなどはまったく 意識せず、 好 きなときにごみを 出 している | |
2 - | 収集場所には 出しているが、 日についてはあまり 意識していない | |
3 - | ごみの日に収集場所に 出しているが、分別はあまり考えていない | |
4 - | ごみの 収集場所 に、 決められた 日 に 分別して 出 している | |
5 - | ごみは 出 ダ していない | |
設問 4 | ごみはどのように出せるようになればいいと 考 えるでしょうか、b>いくつでもお答えください | |
1 - | 場所や 日にちを 意識しなくてもいいように、いつでも 出 せる 体制が 望まれる | |
2 - | ごみは 個別収集をして、 収集場所ということ 自体を 撤廃すべき | |
3 - | 収集場所を 使 う 家庭を 管理して 限定し、 清掃当番を 確実に 平等にすべき | |
4 - | 不法投棄の 取締りを 強化すべきだ | |
5 - | 分別が 面倒だしよくわからない。なるべく 分別の 区分は 少なくすべきだ | |
設問 5 | ごみ問題の管理はどこがすべきだと 考えるでしょうか。1つだけ答えてください | |
1 - | 自治会 | |
2 - | 市区町村 | |
3 - | 都道府県 |
“とにかくExcelに入力すれば数えらるだろう”まあ、あたらずとも遠からずというところである。そこで、誰もが思いつくような入力をしてみた。
「apinfo9_trial.xls」の「アンケートの集計結果」のシートは、このアンケートの結果をワークシートに入力したものである。1人のアンケート回答を、1行に入力した。設問ごとに入力したが、複数回答のある設問4については、複数の列を用意した。
こういうアンケートの集計では、たとえば、設問1の1〜5の選択肢に対して、それぞれ何人の人が答えたかを知りたいと考える。
考えられるのは次のような方法だ。
カウントをするために式の設定をを全部の設問に対して行うのは、いかにも大変だ。しかしながら、そのままではピボットテーブルはどう考えても適用できない。そこで、プログラムを作り展開しなおした。 → 実際にやってみます
プログラムとは次のようなものだ。
ここでのポイントは次の通り
このように展開すると、集計やピボットテーブルを利用できる。
この講義ではプログラムを作ることまでは求めていないが、こうした機能があることを知っておいてもらいたいことがまず1つの重要なポイントである。ただし、プログラム作成はそれほど簡単ではない。それなりにじっくり勉強しないと思ったとおりのものは作成できない。だから、締め切り間際に慌てて勉強しても遅い。だが、アンケートの処理だと、アンケートの回収の間に時間があるので、勉強をしてプログラムをあらかじめ作っておくなどの対処はできるはずだ。
今回の講義のようなアンケートだと、ある設問と別の設問の解答が密接に関連していることがあるかもしれない。こうした統計処理は、相関係数かと思うかもしれないが、実はこの場合は相関係数を求めてもあまり意味はない(なぜだか考えてみよう)。
そうした難しいこと以前に、次のような表を作ってはどうだろうか。
以上のような表を作ってみよう。少なくとも、設問1と設問4に関する表を作ってみること。
難しい統計処理もそれなりに重要だが、こうした地道な処理がそれ以前に重要である。こうして得られた結果を補強するために統計処理を使う場合もある。