以下の課題のうち、3つを行うこと。結果は、Excelのファイルになると思われるが、その完成したファイルを講師宛てにメールで送ること。
送付するファイルは次の要件を満たしていることを原則とする。
ファイルを添付する場合には、圧縮はしなくてもかまわない。なお、Macintoshで課題を作成した人は、メールの文面でその旨を伝えること。Macintoshを使っていても、上記のファイル名の規則を適用すること。
提出のメールについては次の点を守ること
課題の締め切りは:2002年1月23日とします。( 決定) |
提出結果については、指導が入ることがあります。指導はメールで送ります。ない場合もあります。
受け取ったかどうかは、講義のホームページで随時公開します。
練習問題3-5に緑色で注記した内容の課題を行うこと。つまり、週ごとの商品ごとの売上個数の合計として求める。
ここのリンクにあるデータを、いったんファイルに保存すること。ある講義で同じ事をしている。このデータは、講師が運営している郵便番号検索のページの、2000/9/10〜16の1週間に行われた検索結果を取り出したものである。非常にサイズがでかいファイルなので注意すること。技術的にはWebサーバのログというものだが、そこから適当にデータを省いて、郵便番号検索結果だけを抽出している。簡単に言えば、1回検索を行うと、このテキストファイルに1行がサーバに残るという仕組みである。
このデータをワークシートに展開すること。つまり、行列に分割されてデータが配置されるようにまずデータの読み込みを行うこと。いろいろやり方があるが、データメニューの外部データの取り込みからテキストファイルのインポートなんていうのをやってみてはどうだろうか。
データの各列は次の意味を持つ。1行目に行を作り、見出しを適当に定めること。
列 | 意味 | 備考 |
---|---|---|
1 | IPアドレス | 検索をした人のパソコンのIPアドレス |
2 | fiield2 | (無視してOK) |
3 | field3 | (無視してOK) |
4 | 日付と時刻 | 検索が行われた日付および時刻 |
5 | ページ | この記述でどのタイプの検索が行われたかがわかる。(以下のものと異なるデータもあるが、それは無視することにする)
|
6 | コード | たぶん、全部200 |
7 | バイト数 | 転送したバイト数 |
8 | レスポンス | 検索に要した時間で単位は秒 |
9 | ID | (無視してOK) |
次の値を求めよ
注意:提出するファイルには、元データのワークシートは含める必要はない。というか、サイズが馬鹿でかくなるので含めないでほしい。元データを含むワークシートは削除しておくこと。元データを消しても、ピボットテーブルの結果はそのまま残る。なお、ピボットテーブルの結果を別のところにコピーして、より見やすくレポートを仕上げてもかまわない。
課題2のデータを用いて以下の値を求めよ。
ヒント:日付と時刻の混じったデータから日付だけを取り出すのはINT関数を使う。だが、このサンプルデータの場合には、DAY関数を使ってもよい。時刻を取り出すのはHOUR関数を使う。
注意:提出するファイルには、元データのワークシートは含める必要はない。というか、サイズが馬鹿でかくなるので含めないでほしい。元データを含むワークシートは削除しておくこと。元データを消しても、ピボットテーブルの結果はそのまま残る。なお、ピボットテーブルの結果を別のところにコピーして、より見やすくレポートを仕上げてもかまわない。
課題2のデータを用いて、「地名からの検索」についてのレスポンス時間の統計を取りたい。毎日について、1時間ごとの検索数、レスポンス時間の平均値、標準偏差を表にまとめること。表を工夫して見やすくまとめること。
昼間よりも夜間の方が検索に時間がかかっていないのは明白であるが、これを統計的に検定すること。適当な日と時間のデータを取り出し、検定を行った結果を示すこと。また、検定処理を行った結果を考察して、日本語で説明せよ。
注意:提出するファイルには、元データのワークシートは含める必要はない。というか、サイズが馬鹿でかくなるので含めないでほしい。元データを含むワークシートは削除しておくこと。元データを消しても、ピボットテーブルの結果はそのまま残る。なお、ピボットテーブルの結果を別のところにコピーして、より見やすくレポートを仕上げてもかまわない。
10回目の講義の練習問題10-1および10-2を行うこと。