レポート提出課題 応用情報処理II(2013)

以下の課題のうち、必須のもの1つと、それ以外の2つを行うこと。課題はExcelのワークシートで作業する事になると思われるが、うち1つはExcelのブックとその内容をまとめたWordの文書ファイルで提出する。3つ以上課題をする人は少なくとも1つはExcelとWordで提出する。その完成したファイルをNetBoxにアップすること。Excelで提出する場合、必要なことはExcelのファイル内に記載すること。

送付するファイルは次の要件を満たしていることを原則とする。

ファイルを添付する場合には、圧縮はしなくてもかまわない。なお、Macで課題を作成した人は、メールの文面でその旨を伝えること。Macを使っていても、上記のファイル名の規則を適用すること。

提出したことは、以下の書式のメールで必ず知らせてください。

課題の締め切りは:2014年2月4日(火曜日)とします(仮)

成績を教務に提出する期限を、例年と同じくらいであると仮定して、日程を決めました。締め切りが「確定」した場合、締め切りが前後する可能性は0ではありません。

日本時間で2月4日中であればいいとします。もちろん、それ以前に提出してもらってもかまいません。遅れた場合には採点できず、不合格になります。

提出結果については、指導が入ることがあります。指導はメールで送ります。ない場合もあります。

受け取ったかどうかは、講義のホームページで随時公開します。


必須課題

第9回の講義で「ネ申エクセル問題」についての論文とその内容を紹介した。論文に書かれている内容のうち、「ネ申エクセル問題」はどういう問題で、何をすれば解決できるのかを要約すること。これらを受けて、自分自身は何ができるのかを考え、その意見を述べること。この問題については、ワープロのファイルでの提出とする。長さはA4で1枚程度を目指せば良いが、過剰に少なくない限りは分量は問わない。

選択課題1

accessdata2.txtこのリンクにあるテキストデータを、いったんファイルに保存すること。このデータは、講師が運営している郵便番号検索のページの、2005/11/1〜7の1週間に行われた検索結果を取り出したものである。非常にサイズがでかいファイルなので注意すること。技術的にはWebサーバのログというものだが、そこから適当にデータを省いて、郵便番号検索結果だけを抽出している。簡単に言えば、1回検索を行うと、このテキストファイルに1行がサーバに残るという仕組みである。

このデータをワークシートに展開すること。つまり、行列に分割されてデータが配置されるようにまずデータの読み込みを行うこと。いろいろやり方があるが、データタブの外部データの取り込みにあるテキストファイルなんていうのをやってみてはどうだろうか。

データの各列は次の意味を持つ。1行目に行を作り、見出しを適当に定めること。

意味 備考
1 IPアドレス 検索をした人のパソコンのIPアドレス
2,3 ユーザ名/パスワード アクセス制限をしていないので、すべて「-」のはず
4 日付と時刻 検索が行われた日付および時刻
5 ページ この記述でどのタイプの検索が行われたかがわかる。(以下のものと異なるデータもあるが、それは無視することにする)
  • /yubin/getzip.php:市町村名からの検索
  • /yubin/getzip2.php:地名からの検索
6 結果コード 200は正しく結果を表示したことを示す
7 バイト数 転送したバイト数
8 レスポンス 検索に要した時間で単位は秒
9 リファラ このページの前に表示していたページのURL

次の値を求めよ

ヒント:日付と時刻の混じったデータから日付だけを取り出すのはINT関数を使う。だが、このサンプルデータの場合には、DAY関数を使ってもよい。時刻を取り出すのはHOUR関数を使う。

選択課題2

日本統計年鑑の中にある「賃金」のカテゴリにあるデータ(16-9〜19)をもとにデータ処理を行ってみることにする。自分の好きなデータを使って、時系列のデータと、何らかの分類区分ごとのデータを探して整理して、少なくとも2つのグラフを作成すること。そして、どのデータを使い、何のグラフを作成したのかを説明し、加えてグラフから読み取れる傾向分析を記載すること。

選択課題3

総務省の統計データのページからたどるとさまざまな統計データが入手できる。たとえば、「統計でみる都道府県のすがた 2013」というリンクをクリックし、左の「目次」をクリックし、「I 社会生活統計指標」をクリックすると、統計データが含まれるワークシートがダウンロードできる。その中にはたとえば、「安全」のワークシートには、都道府県ごとの消防署の数などの統計データがある。かなりたくさんのデータがあるが、「安全」のワークシートに限らず、総務省のページの中から任意のデータを選んで、自由に注目すべき統計データを選び、「もとデータ」「処理したデータ」「グラフ」を含み、データに関する解説を含んだレポートを作成すること。

選択課題4

Excelにある「Webクエリ」の機能を学習して利用できるようになっておく(「データ」タブにアイコンがある)。この機能を利用して、適当な書籍売り上げランキング、あるいはCDの売上ランキングのサイトの情報をExcelに取り込めるようにする。そして、最低でも3回分の更新結果を取得して、縦方向に書籍あるいはCDタイトルを並べ、横方向に「公開日」等をならべ、それらが交わったところには、それぞれのランキングでの順位を記述する。ただし、縦方向は、調査した回数の中でのランキングの順に並べること。たとえば、3回の調査で、2位、4位、1位であれば、平均して7÷3=2.3....、5位、2位、12位なら19÷3=6.3...のような数値を求める。ランキング外の数値は無視する。たとえば、12位、24位、ランク外となっていれば、36÷2=18を数値として使うようにする。

選択課題5

ある食品製造会社では、大好評のお菓子「ネコも大好き〜マグロパイ」を製造しているが、次のような制約があるとする。

直営店での売り上げは、土日が多く平日は少ないものとする。つまり、火〜金は一定、土曜日曜も一定だが、土日の売り上げは平日の売り上げに対して一定の倍率であるとする。このとき、Excelのワークシート上で製造計画を立てる。なるべく破棄する製品が少なく(破棄数)なり、かつ、売れるはずなのに入荷できなかった数(機会損失数)を減らすことがができるかを考えることにする。なお、何らかの数値(たとえば土日の売り上げ数と平日の減少率など)については固定しなければならないが、どこかのセルに入れて変化できるようにする。