レポート提出課題 応用情報処理II(2008)

以下の課題のうち、2つを行うこと。結果は、Excelのファイルになると思われるが、その完成したファイルをNetBoxにアップすること。必要なことはExcelのファイル内に記載すること。

送付するファイルは次の要件を満たしていることを原則とする。

ファイルを添付する場合には、圧縮はしなくてもかまわない。なお、Macで課題を作成した人は、メールの文面でその旨を伝えること。Macを使っていても、上記のファイル名の規則を適用すること。

提出したことは、以下の書式のメールで必ず知らせてください。

課題の締め切りは:2009年1月26日(月曜日)とします

日本時間で1月26日中であればいいとします。もちろん、それ以前に提出してもらってもかまいません。遅れた場合には採点できず、不合格になります。

提出結果については、指導が入ることがあります。指導はメールで送ります。ない場合もあります。

受け取ったかどうかは、講義のホームページで随時公開します。


課題1

練習問題3-5に緑色で注記した内容の課題を行うこと。つまり、週ごとの商品ごとの売上個数の合計を求めること。なお、この会社は週は水曜日から始まり火曜日で終わることになっている。また、年間の週番号の数え方として、「その年の最初の水曜日を含む週を1とする」という規則になっている。最終的には、この規則にのっとって、週番号と商品のクロス集計を作成すること。

課題2

accessdata2.txtこのリンクにあるテキストデータを、いったんファイルに保存すること。このデータは、講師が運営している郵便番号検索のページの、2005/11/1〜7の1週間に行われた検索結果を取り出したものである。非常にサイズがでかいファイルなので注意すること。技術的にはWebサーバのログというものだが、そこから適当にデータを省いて、郵便番号検索結果だけを抽出している。簡単に言えば、1回検索を行うと、このテキストファイルに1行がサーバに残るという仕組みである。

このデータをワークシートに展開すること。つまり、行列に分割されてデータが配置されるようにまずデータの読み込みを行うこと。いろいろやり方があるが、データメニューの外部データの取り込みからテキストファイルのインポートなんていうのをやってみてはどうだろうか。

データの各列は次の意味を持つ。1行目に行を作り、見出しを適当に定めること。

意味 備考
1 IPアドレス 検索をした人のパソコンのIPアドレス
2,3 ユーザ名/パスワード アクセス制限をしていないので、すべて「-」のはず
4 日付と時刻 検索が行われた日付および時刻
5 ページ この記述でどのタイプの検索が行われたかがわかる。(以下のものと異なるデータもあるが、それは無視することにする)
  • /yubin/getzip.php:市町村名からの検索
  • /yubin/getzip2.php:地名からの検索
6 結果コード 200は正しく結果を表示したことを示す
7 バイト数 転送したバイト数
8 レスポンス 検索に要した時間で単位は秒
9 リファラ このページの前に表示していたページのURL

次の値を求めよ

ヒント:日付と時刻の混じったデータから日付だけを取り出すのはINT関数を使う。だが、このサンプルデータの場合には、DAY関数を使ってもよい。時刻を取り出すのはHOUR関数を使う。

課題4

厚生労働省統計表データベースシステムの中にある「第13表 産業大中分類別常用労働者1人平均月間現金給与額」をもとにデータ処理を行ってみることにする。業種別に現金給与総額の違いを年を追って見たいとする。表を整理して、業種別に平成15〜17年の現金給与総額の表を作り、それらの年ごとの変移がわかるようなグラフを作成すること。

課題5

総務省の統計データのページからたどるとさまざまな統計データが入手できる。たとえば、「統計表データ」というところの「統計でみる都道府県のすがた」をクリックして、ページの下の方にある「K 安 全」をクリックすると、その中には都道府県ごとの消防署の数などの統計データがある。かなりたくさんのデータがあるが、「安全」のワークシートに限らず、総務省のページの中から任意のデータを選んで、自由に注目すべき統計データを選び、「もとデータ」「処理したデータ」「グラフ」を含み、データに関する解説を含んだレポートを作成すること。

演習6

Excelにある「Webクエリ」の機能を学習して利用できるようになっておく(「データ」メニューの「外部データの取り込み」にメニューがある)。この機能を利用して、適当な書籍売り上げランキング、あるいはCDの売上ランキングのサイトの情報をExcelに取り込めるようにする。そして、最低でも3回分の更新結果を取得して、縦方向に書籍あるいはCDタイトルを並べ、横方向に「公開日」等をならべ、それらが交わったところには、それぞれのランキングでの順位を記述する。ただし、縦方向は、調査した回数の中でのランキングの順に並べること。たとえば、3回の調査で、2位、4位、1位であれば、平均して7÷3=2.3....、5位、2位、12位なら19÷3=6.3...のような数値を求める。ランキング外の数値は無視する。たとえば、12位、24位、ランク外となっていれば、36÷2=18を数値として使うようにする。