レポート提出課題 応用情報処理II(2010)

以下の課題のうち、2つを行うこと。結果は、Excelのファイルになると思われるが、その完成したファイルをNetBoxにアップすること。必要なことはExcelのファイル内に記載すること。

送付するファイルは次の要件を満たしていることを原則とする。

ファイルを添付する場合には、圧縮はしなくてもかまわない。なお、Macで課題を作成した人は、メールの文面でその旨を伝えること。Macを使っていても、上記のファイル名の規則を適用すること。

提出したことは、以下の書式のメールで必ず知らせてください。

課題の締め切りは:2011年2月6日(日曜日)とします

日本時間で2月6日中であればいいとします。もちろん、それ以前に提出してもらってもかまいません。遅れた場合には採点できず、不合格になります。

提出結果については、指導が入ることがあります。指導はメールで送ります。ない場合もあります。

受け取ったかどうかは、講義のホームページで随時公開します。


課題1

accessdata2.txtこのリンクにあるテキストデータを、いったんファイルに保存すること。このデータは、講師が運営している郵便番号検索のページの、2005/11/1〜7の1週間に行われた検索結果を取り出したものである。非常にサイズがでかいファイルなので注意すること。技術的にはWebサーバのログというものだが、そこから適当にデータを省いて、郵便番号検索結果だけを抽出している。簡単に言えば、1回検索を行うと、このテキストファイルに1行がサーバに残るという仕組みである。

このデータをワークシートに展開すること。つまり、行列に分割されてデータが配置されるようにまずデータの読み込みを行うこと。いろいろやり方があるが、データメニューの外部データの取り込みからテキストファイルのインポートなんていうのをやってみてはどうだろうか。

データの各列は次の意味を持つ。1行目に行を作り、見出しを適当に定めること。

意味 備考
1 IPアドレス 検索をした人のパソコンのIPアドレス
2,3 ユーザ名/パスワード アクセス制限をしていないので、すべて「-」のはず
4 日付と時刻 検索が行われた日付および時刻
5 ページ この記述でどのタイプの検索が行われたかがわかる。(以下のものと異なるデータもあるが、それは無視することにする)
  • /yubin/getzip.php:市町村名からの検索
  • /yubin/getzip2.php:地名からの検索
6 結果コード 200は正しく結果を表示したことを示す
7 バイト数 転送したバイト数
8 レスポンス 検索に要した時間で単位は秒
9 リファラ このページの前に表示していたページのURL

次の値を求めよ

ヒント:日付と時刻の混じったデータから日付だけを取り出すのはINT関数を使う。だが、このサンプルデータの場合には、DAY関数を使ってもよい。時刻を取り出すのはHOUR関数を使う。

課題2

日本統計年鑑の中にある「16-25 産業大中分類別常用労働者1人平均月間現金給与額」をもとにデータ処理を行ってみることにする。業種別に現金給与総額の違いを年を追って見たいとする。表を整理して、業種別に平成2〜19年の現金給与総額の表を作り、それらの年ごとの変移がわかるようなグラフを作成すること。つまり、横軸は年とする必要があるが、間隔は一定になるようにする。それ以外の集計手法やデータの整理の仕方は任意に行って構わないが、どのような整理をしたのかをきちんと記述すること。

課題3

総務省の統計データのページからたどるとさまざまな統計データが入手できる。たとえば、「統計表データ」というところの「統計でみる都道府県のすがた」をクリックして、ページの下の方にある「K 安 全」をクリックすると、その中には都道府県ごとの消防署の数などの統計データがある。かなりたくさんのデータがあるが、「安全」のワークシートに限らず、総務省のページの中から任意のデータを選んで、自由に注目すべき統計データを選び、「もとデータ」「処理したデータ」「グラフ」を含み、データに関する解説を含んだレポートを作成すること。

演習4

Excelにある「Webクエリ」の機能を学習して利用できるようになっておく(「データ」タブにアイコンがある)。この機能を利用して、適当な書籍売り上げランキング、あるいはCDの売上ランキングのサイトの情報をExcelに取り込めるようにする。そして、最低でも3回分の更新結果を取得して、縦方向に書籍あるいはCDタイトルを並べ、横方向に「公開日」等をならべ、それらが交わったところには、それぞれのランキングでの順位を記述する。ただし、縦方向は、調査した回数の中でのランキングの順に並べること。たとえば、3回の調査で、2位、4位、1位であれば、平均して7÷3=2.3....、5位、2位、12位なら19÷3=6.3...のような数値を求める。ランキング外の数値は無視する。たとえば、12位、24位、ランク外となっていれば、36÷2=18を数値として使うようにする。