1999/6/24
実習で使うデータを、以下の手順でダウンロードして、Excelで開いてください。以下の手順は、Internet Explorerを使った場合です。
Excelは表形式の文書を効率的に作成することができますが、そのことを利用してさまざまなデータ集計に利用されています。データ集計で使えるいろいろな機能を紹介します。統計に関連することも出てきますが、統計学の知識がないとわかりづらい機能もあります。
Excelにあるデータ集計の機能はいくつかのパターンに分かれますが、それらをおおむね分類すると次のようになります。
数式を作ることも、基本的ではありますが、集計であることに変わりはありません。比較的、小規模なデータなら、数式だけで処理されることはよくあります。
次の「集計機能」は、リスト形式にデータをワークシートに入力したとき、それらを元データとしてさまざまな集計処理ができるような機能を指します。「データベース機能」などと呼ばれることもあります。
さらに、アドイン(追加ソフト)として、統計処理やソルバーという線形計画法に基づくデータ処理を行うなど、多彩な機能が利用できます。ただし、このジャンルの機能は、Excelの使い方というよりも、統計や線形計画そのものを理解した上でないとつかえないかもしれません。
以下、代表的な関数の、一般的な使い方を説明します。実習用データブックの「集計に使う関数」というシートを開いて、実際に関数を入力しながら、関数の使い方を説明します。→デモ
SUM(引数) | 引数の合計を求める |
AVERAGE(引数) | 引数の平均値を求める |
STDEV(引数) | 引数の標本標準偏差(個数−1で割る方)を求める |
STDEVP(引数) | 引数の標準偏差を求める |
MAX(引数) | 引数の最大値を求める |
MIN(引数) | 引数の最小値を求める |
SUMIF(引数,条件) | 引数の中にある条件に従ったデータの合計を求める |
COUNTIF(引数,条件) | 引数の中にある条件に従ったデータの個数を求める |
RANK(データ,範囲) | データが範囲の中で何番目なのか(つまり、順位)を求める |
リスト形式に作成されたデータの例が、実習用データブックの「集計処理」というワークシートにあります。これをもとに、この架空の売上データを集計するということを行います。実際にExcelを操作しながら説明を行います。→デモ
データの並べ替え(ソート)は簡単にできます。
リスト上でデータの絞込みを行うことができます。オートフィルタという名前がついていますが、その使い方のポイントを説明します。
一定の条件にしたがって、データを集計することができます。集計結果は「アウトライン」という機能で、要約的な表示にしたり、詳細を含めた表示にすることができます。集計処理の方法と、アウトラインの使い方を説明します。
ピボットテーブルは、クロス集計の高機能なものです。(クロス集計-一般には2つの分類をそれぞれ縦横に並べて、交差する部分に合計などを記入する。たとえば、商品ごと、担当者ごとの売上が一覧されるような形式。)複雑な集計を一度にできるなかなか便利な機能です。原理を理解し、うまくデータ処理に結び付けてください。
このレジュメは自宅で作っていますが、もしかしたら、この機能は学校のExcelでは使えないようになっているかもしれませんので、学校に行って確認します。
「ツール」メニューの「分析ツール」から使えます。ない場合には、Excelのセットアップ作業を行い、分析ツールを追加して、「ツール」メニューの「アドイン」を選択し、「分析ツール」のチェックを入れます。
これより、基本統計量や相関係数、各種の検定、分散分析などの機能が利用できます。ただし、これらの統計処理でのややこしい計算を一気にやってくれるということで、その得られた結果の解釈は、利用者が行わないといけません。
処理の仕方ではなく、処理結果が見られるページです。特に統計局のページでは、処理結果をExcelのブックファイルで提供しています。元データまでは提供してくれてはいませんが、集計結果をどのようにまとめればいいのかということについての参考になるでしょう。
次のような架空のアンケートがあるとする。
環境問題に関するアンケート | |||
設問 1 | あなた 自身 、いわゆる「 環境 問題」にどの 程度関心がありますか | ||
1 - | まったくない | ||
2 - | 少しある | ||
3 - | ややある | ||
4 - | かなりある | ||
5 - | 大いに 関心がある | ||
設問 2 | 環境問題に 関する 討議に 参加したことがありますか | ||
1 - | いいえ | ||
2 - | はい | ||
設問3 | 身近な 環境問題としてごみの 扱いを お尋ねします。あなたは 実際にどうしているのか、1つだけ 答えてください | ||
1 - | ごみの 収集場所や 日にちなどはまったく 意識せず、 好 きなときにごみを 出 している | ||
2 - | 収集場所には 出しているが、 日についてはあまり 意識していない | ||
3 - | ごみの日に収集場所に 出しているが、分別はあまり考えていない | ||
4 - | ごみの 収集場所 に、 決められた 日 に 分別して 出 している | ||
5 - | ごみは 出 ダ していない | ||
設問 4 | ごみはどのように 出せるようになればいいと 考 えるでしょうか、いくつでも お答えください | ||
1 - | 場所や 日にちを 意識しなくてもいいように、いつでも 出 せる 体制が 望まれる | ||
2 - | ごみは 個別収集をして、 収集場所ということ 自体を 撤廃すべき | ||
3 - | 収集場所を 使 う 家庭を 管理して 限定し、 清掃当番を 確実に 平等にすべき | ||
4 - | 不法投棄の 取締りを 強化すべきだ | ||
5 - | 分別が 面倒だしよくわからない。なるべく 分別の 区分は 少なくすべきだ | ||
設問 5 | ごみ 問題の 管理はどこがすべきだと 考えるでしょうか。1つだけ 答えてください | ||
1 - | 自治会 | ||
2 - | 市区町村 | ||
3 - | 都道府県 |
「実習データ.xls」の「課題A」のシートは、このアンケートの結果をワークシートに入力したものである。1人のアンケート回答を、1行に入力した。設問ごとに入力したが、複数回答のある設問4については、複数の列を用意した。
こういうアンケートの集計では、たとえば、設問1の1〜5の選択肢に対して、それぞれ何人の人が答えたかを知りたいと考える。
課題A:シート「課題A」のワークシートにある設問1だけについて、1〜5の選択肢それぞれの回答者数を求める関数を、同一のシートの適当な位置に入力すること。
しかしながら、こんなことを全部の設問に対して行うのは、いかにも大変だ。そこで、プログラムを作り(実際にブックにマクロプログラムが作られている。興味のある人はそれを参照)、データを「課題B」シートのように展開しなおした。このように展開すると、集計やピボットテーブルを利用できる。
課題B:「課題B」シートをもとに、ピボットテーブルの機能を利用して、設問ごと、選択肢ごとの回答者数の表を作成すること。新しいワークシートが作られるはずだ。
以上の作業を行ったブックファイルを、課題提出のページからダウンロードできるようにすること。課題の結果は、kadai10-<学籍番号>.xlsとなるようにしてください。<学籍番号>に自分の学籍番号を書きます。こちらでは、右ボタンクリックでダウンロードします。ファイル名に間違えて全角文字を入れないように。