専門演習2012年度演習記録
(作成:西郷 浩;掲示開始:2012年4月1日;最終更新:2013年1月23日)
専門演習(3年生 第18期生)
l 曜日・時限・教室:火3・7-407
l 教科書:
Ø [1] Everit, B. S., and Hothorn, T. (大門 貴志・吉川 俊博・手良向 聡 訳)『Rによる統計解析ハンドブック 第2版』メディカル・パブリケーションズ
l 評価:presentation + project
l 出席確認:あり
l 講義記録:
1. 4月10日:自己紹介、ゼミのルールの説明、教科書の割り当て、幹事の選出
Ø 運営幹事:170、171
Ø 旅行幹事:172、174
Ø 会計幹事:173
2. 4月17日:西郷によるデモ
3. 4月24日:教科書[1]の輪読
Ø 166・171・176:第1章 R概論
4. 5月8日:教科書[1]の輪読
Ø 170、173、175:第2章 グラフィカル表示を用いたデータ解析
5. 5月15日:教科書[1]の輪読
Ø 170、173、175:第2章 グラフィカル表示を用いたデータ解析
Ø 169、172、174:第3章 単純な推測
6. 5月22日:教科書[1]の輪読
Ø 169、172、174:第3章 単純な推測
7. 5月29日:教科書[1]の輪読
Ø 169、172、174:第3章 単純な推測
Ø 167、168、177:第4章 条件つき推測
8. 6月5日:教科書[1]の輪読
Ø 167、168、177:第4章 条件つき推測
9. 6月12日:教科書[1]の輪読
Ø 167、168、177:第4章 条件つき推測
Ø 169、172、168:第5章 分散分析
10. 6月19日:休講(補講:夏合宿)
11. 6月26日:教科書[1]の輪読
Ø 169、172、168:第5章 分散分析
Ø 171、173、176:第6章 線形単回帰と線形重回帰
12. 7月3日:教科書[1]の輪読
Ø 171、173、176:第6章 線形単回帰と線形重回帰
13. 7月10日:教科書[1]の輪読
Ø 171、173、176:第6章 線形単回帰と線形重回帰
Ø 166、174、177:第7章 ロジスティック回帰モデルと一般化線形モデル
14. 7月17日:教科書[1]の輪読
Ø 166、174、177:第7章 ロジスティック回帰モデルと一般化線形モデル
Ø 167、170、175:第8章 密度推定
15. 7月24日:教科書[1]の輪読
Ø 167、170、175:第8章 密度推定
16. 9月21日—24日:千葉県白子町(教科書[1]輪読+4年生のゼミ論中間報告。4年生の記録も参照)
遅刻・欠席・早退:なし
Ø 9月21日14:00-17:00
@ 173、174、177:第9章 再帰分割法
A 168、170、176:第10章 散布図平滑化法と一般化加法モデル
Ø 9月21日19:00-22:00:4年生の報告
Ø 9月22日9:00-12:00:レクリエーション(体育館)
Ø 9月22日14:00-17:00
@ 167、171、175:第11章 生存時間解析
A 166、169、172:第12章 経時的データの解析I
Ø 9月22日19:00-21:00 レクリエーション(花火)
Ø 9月23日9:00-12:00 4年生の報告
Ø 9月23日13:30-17:00 4年生の報告
Ø 9月23日 18:00- BBQ+コンパ
Ø 9月24日9:00 レクリエーション(テニス)
17. 10月2日:教科書[1]
Ø 167、170、176:第13章 経時データの解析II
18. 10月9日:教科書[1]の輪読
Ø 167、170、176:第13章 経時データの解析II
Ø 166、168、175:第14章 同時推測と多重比較
19. 10月16日:教科書[1]の輪読
Ø 166、168、175:第14章 同時推測と多重比較
Ø 169、171、174:第15章 メタアナリシス
20. 10月23日:教科書[1]の輪読
Ø 169、171、174:第15章 メタアナリシス
Ø 172、173、177:第16章 主成分分析
21. 10月30日:教科書[1]の輪読
Ø 172、173、177:第16章 主成分分析
Ø 167、168、171:第17章 多次元尺度構成法
22. 11月6日:教科書[1]の輪読
Ø 169、172、176:第18章 クラスター分析
23. 11月13日:教科書[1]の輪読
Ø 169、172、176:第18章 クラスター分析
24. 11月20日:教科書[1]の問題演習
Ø 166、171、176:第1章 R概論 の練習問題
Ø 170、173、175:第2章 グラフィカル表示を用いたデータ解析 の練習問題
25. 11月27日:教科書[1]の問題演習
Ø 170、173、175:第2章 グラフィカル表示を用いたデータ解析 の練習問題
Ø 169、172、174:第3章 単純な推測 の練習問題
Ø 167、168、177:第4章 条件つき推測 の練習問題
26. 12月4日:教科書[1]の問題演習
Ø 169、172、174:第3章 単純な推測 の練習問題
Ø 167、168、177:第4章 条件つき推測 の練習問題
27. 12月8日(土)13:30—18:30 ゼミ論報告会@1-309
Ø 第17期生の箇所参照
Ø レポート:
@ 内容:ゼミ論報告の中から以下に指定される数の報告を選び、内容を要約して論評せよ。出席者:1;事前連絡欠席者:2;無断欠席者:10.
A 提出期限:2012年12月31日
B 提出方法:Course N@vi への添付ファイル
C 用紙・分量:A4用紙1枚程度
28. 12月11日:教科書[1]の問題演習
Ø 169、172、174:第3章 単純な推測 の練習問題
Ø 169、172、168:第5章 分散分析
29. 12月18日:教科書[1]の問題演習
Ø 169、172、168:第5章 分散分析
Ø 171、173、176:第6章 線形単回帰と線形重回帰
30. 1月8日:教科書[1]の問題演習
Ø 173、171、176:第6章 線形単回帰と線形重回帰
Ø 166、174、177:第7章 ロジスティック回帰モデルと一般化線形モデル
31. 1月22日:教科書[1]の問題演習
Ø 166、174、177:第7章 ロジスティック回帰モデルと一般化線形モデル
Ø 167、170、175:第8章 密度推定
32. 1月29日:教科書[1]の問題演習、レポート提出
Ø レポート提出
Ø レポートの構成
@ 分析の目的
A データの説明
B 分析と考察
C 結論
D 参考文献
書式など:A4・横書き。最初のページに、(1)表題、(2) 作成者の番号・氏名、(3)提出or作成年月日、を記すこと。図表には、番号と表題をつけること。
Ø ゼミ論計画書(4年生の第1回演習で提出)
@ テーマ(目的)
A 利用データ
B 利用データの基本分析
C 分析手法
D 参考文献
書式など:A4・横書き。最初のページに、(1)表題、(2) 作成者の番号・氏名、(3)提出or作成年月日、を記すこと。図表には、番号と表題をつけること。提出期限:2012年度第1回ゼミ
専門演習(4年生 第17期生)
l 曜日・時限・教室:火4・7-407
l 内容:ゼミ論作成の指導
l 評価:presentation + ゼミ論
l 出席確認:あり
l 講義記録:
1. 4月10日:3年次レポートの返却、ゼミ論計画書提出、ゼミ論中間報告
@ 153「日本の鉄道の利用状況分析」
Ø 内容:鉄道会社のデータを使った回帰分析
Ø 課題:(1)国土交通省のデータの探索、(2)ヒストグラムの作成、(3)文献の探索(例:宇都宮浄人(2012)『鉄道復権』新潮社
A 151「多変量解析による財務諸表分析」
Ø 内容:業績を4つの因子によって評価し、その因子を統合したときの業績評価を判別する判別関数を作成する。
Ø 課題:(1)指標の統合の模索、(2)上の内容に記した考えに沿った試算、(3)多項回帰利用の可能性
2. 4月17日:ゼミ論中間報告
@ 152「ラテン・アメリカ諸国の経済成長率に関する比較分析」
Ø 内容:経済成長率を被説明変数、出生率などを説明変数とした回帰分析
Ø 課題:経済成長の経済学的・人口学的要因の整理、時系列データの利用(横断面データの結合)
A 150「都道府県別の賃金の違いに関する統計的分析」
Ø 内容:都道府県別現金給与額(1か月、男女計、)の平均年齢と平均勤続年数、所定内労働時間、超過労働時間、最低賃金率への回帰
Ø 課題:格差の規定、文献の探索
B 154「ナンバーズ3に関する統計的分析」
Ø 内容:ナンバーズ3の基本的な仕組み、当選番号の度数分布、一桁ずつの数値の度数分布、乱数の検定
Ø 課題:掛け金からみた、選択番号のクセの発見
3. 4月24日:ゼミ論中間報告
@ 158「為替レートの予測:時系列モデルとニューラルネットワーク」
Ø 内容:分単位で計測した為替レートの10分後の予測、2011年度末レポートの内容の報告(ARIMAモデルによる為替レートの予測)と、ゼミ論の計画
Ø 課題:為替レートの予測に適した時系列モデルの選択、高頻度データの特徴の考察
4. 5月8日:ゼミ論中間報告
@ 159「コンビニエンスストアに関する統計的分析(仮)」
Ø 内容:コンビニエンスストア協会のデータの分析、都道府県別企業別コンビニエンスストア出店数の相関分析・クラスター分析
Ø 課題:業態別価格分布の比較
A 161「日本の広告媒体の変遷とその効果について」
Ø 内容:テーマ、利用データ、モデルの概略についての説明
Ø 課題:特定サービス産業実態調査データの時系列分析
5. 5月15日:ゼミ論中間報告
@ 162「自動車販売数の変動要因分析」
Ø 内容:日本自動車工業会データにもとづく乗用車販売台数の時系列データの提示、販売台数と保有年数との相関
Ø 課題:自動車需要モデルに関する過去の文献の探索、価格データ(ゼミOBのCD-ROM)の利用
A 163「プロサッカーリーグの秋春制移行について
Ø 内容:2011年Jリーグデータ(試合ごとの入場者数と気温、など)の相関、upsetの分析
Ø 課題:変数の工夫(upsetのような)、文献の探索(スポーツを産業として捉えたもの)
6. 5月22日:ゼミ論中間報告
@ 150「都道府県賃金に関する統計的分析」
Ø 内容:企業規模別・性別・年齢階級別都道府県賃金比較
Ø 課題:地域差価格指数の利用、残差の都道府県別比較
A 165「アルバイト先ビクトリーカフェの売り上げ予測」
Ø 内容:3年分のデータによる月次の売上高・粗利・経費・利益の時系列的な特徴、売上高のTCSI分解
Ø 課題:データの追加(10年分)、変数の定義の継続性の確認、データの使用許可
7. 5月 29日:ゼミ論中間報告
@ 151「多変量解析による財務諸表分析」
Ø 内容:因子分析による業績評価→判別分析による業績評価関数の推定
Ø 課題:推定サンプルと試験サンプルとの区別(交差検証法)
A 152「人口ボーナスと経済成長」
Ø 内容:「15-64歳人口/(15歳未満人口+65歳以上人口)」を人口ボーナス指数としたときの、GDPとボーナス指数との相関分析
Ø 課題:日本における人口ボーナス(消費水準に基づく)と人口ボーナス指数(年齢構成にもとづく)との関係、成長指標の選択(一人当たりGDP、一人当たりGDP成長率)、成長指標と人口ボーナス指数との相関(時差相関も含む)
8. 6月5日:ゼミ論中間報告
@ 153「鉄道に関する統計的分析」
Ø 内容:国土交通省データ(鉄道の旅客・貨物輸送、交通センサス、駅の乗降客数など)の分析
Ø 課題:自動車による輸送との競合関係の分析、駅の乗降客数の分析(下り始発駅からの距離以外の要因の考察)
A 154「アパレル業界の現状に関する統計的分析」
Ø 内容:被服・履物への支出額やファーストリテーリングの販売額の時系列的な変化
Ø 課題:家計調査による被服・履物の需要分析、工業統計表などの利用
9. 6月12日:ゼミ論中間報告
@ 158「為替レートの予測:時系列モデルとニューラルネットワーク」
Ø 内容:為替レート(分)階差データへの時系列モデル(AR、ARIMA、GARCH)の当てはめ
Ø 課題:時系列データの特徴(定常性、移動平均・移動分散、など)に応じた時系列モデルの選択
10. 6月30日(土)10:40-12:10@7-407(6月19日の補講):ゼミ論中間報告
@ 162「国内新車市場の考察」
Ø 内容:価格と性能(燃費、排気量、全幅、ハイブリッド)との相関
Ø 課題:データセットの拡大、変数の選択
A 161「日本の広告媒体と効果の変化について」
Ø 内容:特定サービス産業実態調査と電通データとの比較
Ø 課題:長期の系列(電通データ)による時系列分析
B 163「プロサッカーリーグの秋春制移行について」
Ø 内容:箱ヒゲ図による観客数の分布比較
Ø 課題:観客数予測モデルの推定、外挿の問題(秋春制における1月と2月)、海外(秋春制導入)における観客数の年間パターン
11. 6月26日:ゼミ論中間報告
@ 164「ナンバーズ3に関する統計的分析」
Ø 内容:賭け方のクセに関する統計的分析
Ø 課題:ストレートに関して、数値の特徴(奇遇など)にもとづく箱ヒゲ図の作成
A 165「アルバイト先ビクトリーカフェの売り上げ予測」
Ø 内容:7年分の売上高のTCSI分解、ACFの推定
Ø 課題:季節性の除去方法の検討
12. 7月3日:ゼミ論中間報告
A 150「都道府県別賃金に関する統計的分析」
Ø 内容:地域差物価指数の反映、地域ごとのダミー変数の導入、完全失業率の導入
Ø 課題:地域差物価指数のデフレータとしての利用、残差の検討
B 151「多変量解析による財務諸表分析」
Ø 内容:因子得点による判別分析
Ø 課題:テストデータにおける因子得点の計算方法
C 152「ラテン・アメリカにおける人口ボーナスの影響」
Ø 内容:人口ボーナス指数と経済成長率、一人当たりGDPの相関
Ø 課題:人口ボーナスの定義の確認(小川論文)、人口ボーナスと従属年齢人口比との比較
13. 7月10日:ゼミ論中間報告
@ 153「日本の鉄道利用状況の分析」
Ø 内容:時系列データによる旅客・貨物輸送の構成比の分析
Ø 課題:データの整理、乗降客数モデルの推定
A 154「ナンバーズ3に関する統計的分析」
Ø 内容:ストレート、ボックスにおける数字の奇・偶に関するボックスプロットによる比較
Ø 課題:3カード・ワンペア・それ以外の頻度の確認、ストレート、ボックス以外の分析
B 156「アパレル業界の現状に関する統計的分析」
Ø 内容:家計調査、消費者物価指数をもちいた被服・履物の需要分析
Ø 課題:被服・履物の支出の実質化、1990年における大変化の確認、供給側のデータの分析
14. 7月 17日:ゼミ論中間報告
@ 158「為替レートの予測:時系列モデルとニューラルネットワーク」
Ø 内容:データの非定常性、自己相関(単・偏)、分散の不均一性の確認
Ø 課題:分散の不均一性に対応した分析手法(例:ARCH)による分析
@ 161 「日本の広告媒体と効果の変化について」
Ø 内容:民間データの時系列グラフ
Ø 課題:VARモデルによる因果関係(広告・売り上げ)の検証
15. 7月24日:ゼミ論中間報告
@ 162国内新車市場の考察」
Ø 内容:ハイブリッド車における価格と燃費、その他の変数との関係
Ø 課題:ハイブリッド車と他のタイプの車の比較、対数変換
A 163 プロサッカーリーグの秋春制移行について」
Ø 内容:1年全節の観客数(今期入場者割合によって指標化)の月別分布
Ø 課題:予測モデルの確立
B 165 (準備せず。最終日を勘違い。秋学期に補填)
Ø 内容:
Ø 課題:
16. 9月21日—24日:千葉県白子町(教科書[1]輪読+4年生のゼミ論中間報告。3年生の記録も参照)
Ø 9月21日19:00-22:00
@ 150「都道府県別の賃金に関する統計的分析」
ü 内容:企業規模・性・年齢階級別都道府県賃金の格差に関する分析、重回帰分析、回帰木による分析
ü 課題:地域差指数による名目賃金の実質化
A 151「多変量解析による財務諸表分析」
ü 内容:抽出した因子による判別分析
ü 課題:回帰推定量またはバートレット法による因子の推定
B 162「国内新車市場の考察」
ü 内容:Yahoo! 自動車 のデータによる自動車販売価格要因の考察
ü 課題:説明変数選択のための概念構成(何が自動車価格に影響をおよぼすのかを整理する)
Ø 9月22日9:00-12:00 リクリエーション(体育館)
Ø 9月22日14:00-17:00 3年の報告
Ø 9月22日19:00-21:00 レクリエーション(花火)
Ø 9月23日9:00-12:00:4年生のゼミ論中間報告
@ 161「日本の広告媒体と効果の変化について」
ü 内容:特定サービス産業実態調査や電通のデータによる、広告媒体別広告費の時系列的な変化の比較
ü 課題:分布ラグモデルやVARモデルによる広告効果・因果関係の分析
A 152「ラテン・アメリカの人口ボーナス期」
ü 内容:GDPと人口の構成・社会保障制度との関係、従属人口指数と経済成長との関係
ü 課題:人口ボーナスの定義の確認(一次配当)
B 156「アパレル産業の現状に関する統計的分析」
ü 内容:供給データの分析(商業販売統計)、需要データの分析(家計調査による被服・履物の需要分析)
ü 課題:実質化のやり直し、1990年以前と1991年以降とに分けた分析
Ø 9月23日13:30-17:00:4年生のゼミ論中間報告
@ 158「為替レートの予測:時系列モデルとニューラルネットワーク」
ü 内容:ARモデル、単位根検定、GARCHモデル
ü 課題:ニューラルネットワークモデルの適用
A 153「日本の鉄道利用状況の分析(仮)」
ü 内容:国土交通省、JR・私鉄の乗降客データの回帰分析
ü 課題:共分散構造分析による潜在変数の導入
B 160「出版物に関する統計的分析」
ü 内容:書籍・雑誌販売額の時系列データ、社会生活基本調査による趣味としての読書の分析
ü 課題:社会生活基本調査によるコーホート分析、供給側データの分析
C 154「ナンバーズ3 に関する統計的分析」
ü 内容:箱ヒゲ図による当選番号、当選金額の分析、乱数の検定
ü 課題:別の乱数の検定、ミニの分析
Ø 9月23日:13:00-16:00:レクリエーション
Ø 9月24日:10:00-12:00:レクリエーション(テニス)
17. 10月2日:個別相談
18. 10月9日:ゼミ論中間報告
@ 150「都道府県別の賃金に関する統計的分析」
Ø 内容:実質賃金(地域差物価指数使用)を目的変数とした回帰分析
Ø 課題:実質化の効果(格差は縮小したか?)、地域ダミーによる格差の検証
A 151「多変量解析による財務諸表分析」
Ø 内容:データの追加による予測モデルの安定化
Ø 課題:外れ値の除外、因子得点の推定
19. 10月16日:ゼミ論中間報告
@ 152(11月13日に報告)
Ø 内容:
Ø 課題:
A 153「日本の鉄道利用状況の分析」
Ø 内容:JR線の各駅の条項人員の分析
Ø 課題:対数変換の利用、分析の発展
17. 10月23日:ゼミ論中間報告
@ 156「アパレル業界の現状に関する統計的分析」
Ø 内容:家計調査データにもとづく需要分析(被服・履物の実質化のやり直し)、供給データ(SPA比率)
Ø 課題:1973年(第1次石油危機)の扱い、一般化加法モデルによる推定
A 154「ナンバーズ3に関する統計的分析」
Ø 内容:適合度検定、間隔検定、販売額の時系列的な推移当選割合の時系列的な推移
Ø 課題:「適合しすぎ」の検定
20. 10月30日:ゼミ論中間報告
@ 158「為替レートの予測:時系列モデルとニューラルネットワーク」
Ø 内容:ニューラルネットワークモデルによる為替レート(分次、日次)の予測、SRIの使用
Ø 課題:論文のまとめ(日次データの深追いはしないこと)
A 160「出版物に関する統計的分析」
Ø 内容:社会生活基本調査(H3年からH23年まで)によるコーホート分析
Ø 課題:就業状態の追加、供給側のデータの追加、論文のまとめ
21. 11月6日:ゼミ論中間報告
@ 162「国内新車市場の考察」
Ø 内容:データクリーニング(ハイブリッド車と他のタイプとの比較の観点から)、対数変換、AIC
Ø 課題:交互作用の導入(タンクとハイブリッド)
22. 11月13日:
@ 161「日本の広告媒体と効果の変化について」
Ø 内容:VARモデルの広告費とGDPへの当てはめ
Ø 課題:VARモデルによるGranger因果性の検証
A 152「ラテン・アメリカの人口ボーナス期」
Ø 内容:社会保障費・人口ボーナスの交互作用のGDP成長率への影響
Ø 課題:日本のデータを利用しての人口ボーナス(従属人口指数)および他の変数と経済成長率との関係の分析、ラテン・アメリカにおける人口データと経済成長率との関係分析、社会保障データがあるラテン・アメリカにおける経済成長率と人口データおよび社会保障データとの関係の分析
23. 11月20日:ゼミ論執筆指導(希望者のみ研究室にて;15:45まで)
24. 11月27日:ゼミ論執筆指導(希望者のみ研究室にて)
25. 12月 4日:ゼミ論提出
Ø 提出者: 8名
Ø 遅延提出: 2名
26. 12月 7日12:00:ゼミ論報告会用ハンドアウト原稿提出(添付ファイル)
Ø 提出者:
Ø ハンドアウトの構成
I. 分析の目的
II. データの説明
III. 分析と結果の考察
IV. 結論
V. 参考文献
Ø 書式など:A4用紙で2ページないし4ページ、最初のページに、(1)表題、(2) 作成者の番号・氏名、(3)提出or作成年月日、を記すこと。図表には、番号と表題をつけること。
27. 12月8日(土)13:30—18:30 ゼミ論報告会@1-309:
Ø 報告会プログラム
I. はじめに(西郷) 13:30-13:35
II. 報告
@ 150「都道府県別の賃金に関する統計的分析」13:35-14:00
A 156「アパレル業界の現状に関する統計的分析」14:00-14:25
B 162「国内深謝販売価格の分析: “ハイブリッドカーである” ことの価値」14:25-14:50
C 休憩 14:50-15:00
D 153「首都圏の鉄道利用状況の分析」15:00-15:20
E 160「出版物に関する統計的分析」15:20-15:45
F 156「財務諸表を用いた小売業の業績予測」15:45-16:15
G 休憩 16:15-16:30
H 154「ナンバーズ3に関する統計的分析」16:30-16:55
I 158「為替レートの予測:時系列モデルとニューラルネットワーク」16:55-17:25
J 161「日本の広告の効果と媒体間の効果の差」17:25-17:50
K 152「ラテンアメリカの人口ボーナス期」17:50-18:15
III. 第18期生ゼミ論抱負 18:15-18:25
IV. おわりに(西郷)18:25-18:30
(終了後、忘年会)
Ø レポート:
I. 内容:自分のもの以外のゼミ論報告の中からひとつを選び、内容を要約して論評せよ。
II. 提出期限:2012年12月31日
III. 提出方法:Course N@vi への添付ファイル
IV. 用紙・分量:A4用紙1枚程度
28. 12月11日:ゼミ論執筆指導(希望者のみ研究室にて)
29. 12月18日:ゼミ論執筆指導(希望者のみ研究室にて)
30. 1月8日:ゼミ論執筆指導(希望者のみ研究室にて)
31. 1月22日:ゼミ論執筆指導(希望者のみ研究室にて)
32. 1月29日:ゼミ論再提出
以上