専門演習2016年度演習記録
(作成:西郷 浩;掲示開始:2016年4月1日;最終更新:2017年1月24日)
専門演習(3年生 第22期生)
l 曜日・時限・教室:火3・3-609
l 教科書:
Ø [1] Lander, J. P. (高柳慎一・牧山幸史・蓑田高志訳)(2015)『みんなのR:データ分析と統計解析の新しい教科書』マイナビ
Ø [2] 末吉正成、里洋平、酒巻隆治、小林雄一郎、大城信晃(2014)『Rではじめるビジネス統計分析』翔泳社
l 評価:presentation + project
l 出席確認:あり
l 講義記録:
1. 4月12日:ゼミのルールの説明、教科書の割り当て、幹事の選出、教科書[1]の輪読
Ø 第1章、第2章、第3章(文字列まで)
2. 4月19日:教科書[1]の輪読
Ø 第3章、第4章、第5章
3. 4月26日:教科書[1]の輪読
Ø 第5章、第6章
4. 5月10日:教科書[1]の輪読
Ø 第6章、第7章
5. 5月17日:教科書[1]の輪読
Ø 第8章、第9章、第10章、第11章
6. 5月24日:教科書[1]の輪読
Ø 第11章、第14章
7. 5月31日:休講(補講:夏合宿)
8. 6月7日:教科書[1]の輪読
Ø 第12章、第13章
9. 6月14日:教科書[1]の輪読
Ø 第13章、第14章
10. 6月21日:
Ø 第15章
11. 6月28日:教科書[1]の輪読
Ø 第15章、第16章
12. 7月5日:教科書[1]の輪読
Ø 第16章
13. 7月12日:教科書[1]の輪読
Ø 第16章、第17章
14. 7月19日:教科書[1]の輪読
Ø 第17章、第18章
15. 7月26日:教科書[1]の輪読
Ø 第18章
16. 9月13日--14日@リフレフォーラム(東大島):教科書[1] 輪読+4年生のゼミ論中間報告。4年生の記録も参照。
遅刻・欠席・早退:なし
Ø 9月13日14:00-17:00:教科書[1] 輪読
@ 第18章
Ø 9月13日19:00-22:00:4年生のゼミの中間報告
Ø 9月14日9:00-12:00:4年生のゼミの中間報告
Ø 9月14日13:00-14:30:リクリエーション
Ø 9月14日14:30-16:00:コンパ
Ø 9月14日16:10:解散
17. 10月4日:教科書[1]
Ø 第18章
18. 10月11日:教科書[1]の輪読
Ø 第18章
19. 10月18日:教科書[1]の輪読
Ø 第18章、第19章
20. 10月25日:教科書[1]の輪読
Ø 第20章、第21章
21. 11月1日:教科書[1]の輪読
Ø 第21章、第22章
22. 11月8日:教科書[1]の輪読
Ø 第22章
23. 11月15日:教科書[1], [2]の輪読
Ø [1]第22章
Ø [2]第2章
24. 11月22日:教科書[2]の輪読
Ø [2]第3章
25. 11月29日:教科書[2]の輪読
Ø [2]第4章
26. 12月6日:教科書[2]の輪読
Ø [2]第5章
27. 12月13日:教科書[2]の輪読
Ø [2]第6章 correspondence analysis まで
28. 12月17日:ゼミ論報告会(4年生の記録参照)
Ø レポート:
@ 内容:ゼミ論報告の中から以下に指定される数の報告を選び、内容を要約して論評せよ。
A 提出期限:2016年12月31日23:59
B 提出方法:Course N@vi への添付ファイル(PDF)
C 用紙・分量:A4用紙1枚程度
29. 12月20日:教科書[2]の輪読
Ø [2]第6章
30. 1月10日:教科書[2]の輪読
Ø [2]第7章
31. 1月17日:教科書[3]の輪読
Ø [2]第8章
32. 1月24日:教科書[3]の輪読
Ø [2]第8章(redo)
Ø レポート提出(期限:2017年1月31日23:59@Course N@vi)
Ø レポートの構成
@ 分析の目的
A データの説明
B 分析と考察
C 結論
D 参考文献
書式など:A4・横書き。最初のページに、(1)表題、(2) 作成者の番号・氏名、(3)提出or作成年月日、を記すこと。図表には、番号と表題をつけること。
Ø ゼミ論計画書(4年生の第1回演習で提出)
@ テーマ(目的)
A 利用データ
B 利用データの基本分析
C 分析手法
D 参考文献
書式など:A4・横書き。最初のページに、(1)表題、(2) 作成者の番号・氏名、(3)提出or作成年月日、を記すこと。図表には、番号と表題をつけること。提出期限:2016年度第1回ゼミ
専門演習(4年生 第21期生)
l 曜日・時限・教室:火4・3-609
l 内容:ゼミ論作成の指導
l 評価:presentation + ゼミ論
l 出席確認:あり
l 講義記録:
運営幹事:;旅行幹事:
1. 4月12日:ゼミ論計画書提出、ゼミ論中間報告
@ 200「サヤ取りにおける機械学習的手法の有効性」
Ø 内容:サヤ取りの概念、分析手法の説明
Ø 課題:回帰式を中心とした既存の手法の説明
A 207「衆議院選挙の投票率決定要因に関する分析」
Ø 内容:投票率指数の紹介
Ø 課題:投票率指数の分解の試算
2. 4月19日: ゼミ論中間報告
@ 202(欠席)
Ø 内容:
Ø 課題:
A 203「羽田空港と成田空港の選択決定要因分析」
Ø 内容:『日本の空港と国際観光』愛知大学経営総合科学研究所叢書36の内容紹介
Ø 課題:『観光白書』で利用されている統計とその内容の確認
B 204(欠席)
Ø 内容:
Ø 課題:
3. 4月26日
@ 205「余暇時間の統計的分析(仮題)」
Ø 内容:総務省「社会生活基本調査」をもちいた生活時間の分析
Ø 課題:生活時間のコーホート分析、文献の探索
A 201「過疎に関する統計的分析(仮題)」
Ø 内容:都道府県別人口の推移、過疎の法的定義
Ø 課題:人口学と人口の地域移動の分析
B 199「広告効果の統計的測定」
Ø 内容:B to B と B to C との広告効果の相違の測定
Ø 課題:マーケティングにおける広告モデルの探索、データの吟味
4. 5月10日:ゼミ論中間報告
@ 202「地価と人口の関係に関する統計的分析」
Ø 内容:住宅地の価格と人口との関連
Ø 課題:住宅地価格モデルの推定、商業地・工業地の価格決定要因の考察
A 204「インバウンド需要の国別将来予測」
Ø 内容:観光目的訪日外国人数の国別内訳、中国からの訪日者数の推移とGDP
Ø 課題:観光需要方程式の設定、観光白書で利用されているデータの確認
5. 5月17日:ゼミ論中間報告
@ 200「サヤ取りにおける機械学習的手法の有効性」
Ø 内容:ブートストラップ法による(スプレッドの経験分布に基づく)サヤ取り手法の改良
Ø 課題:スプレッドの自己相関係数の確認、残差の非正規性の確認
A 203「羽田空港と成田空港の選択決定要因分析」
Ø 内容:観光白書で使われているデータの確認
Ø 課題:観光庁「訪日外国人消費動向調査」の精査
B 207「衆議院総選挙 都道府県別投票率の分析」
Ø 内容:年齢調整済み投票率(期待投票率)順位と現実の投票率順位との関係分析
Ø 課題:順位に変換する前のデータによる散布図の作成
6. 5月24日:ゼミ論中間報告
@ 205「日本人の余暇における行動分析」
Ø 内容:コーホート(世代)別にみたテレビの視聴時間の変化
Ø 課題:年齢を横軸としたグラフの描画
A 201「わが国における過疎化の統計的分析」
Ø 内容:東京都と島根県における人口の自然増・社会増の変化
Ø 課題:人口移動モデルの探索
7. 5月31日:休講(補講:夏合宿)
8. 6月 7日:ゼミ論中間報告
@ 199 「業界別広告の効果」
Ø 内容:データの提示、散布図の作成、当期効果モデル vs 繰り越し効果モデル(B to Cは前者、B to B は後者と予想。相関の強弱、弾力性の大小による検証)
Ø 課題:当期効果モデルの推定、繰り越し効果モデルの推定、マーケティングにおける広告分析の探索
A 202(欠席)
1. 内容:
2. 課題:
B 204(欠席)
Ø 内容:
Ø 課題:
9. 6月14日:ゼミ論中間報告
@ 200「サヤ取りにおける機械学習的手法の有効性」
Ø 内容:スプレッドの正規性の検証、ADFテスト、SVR、RF
Ø 課題:スプレッドの自己相関関数の確認、線形回帰・非線形回帰の予測値の確認
A 203「羽田空港と成田空港の選択決定要因分析」
Ø 内容:国土交通省「空港管理状況調書」データの分析、観光庁「訪日外国人消費動向調査」の分析(空港別・国別訪日外国人数)
Ø 課題:旅行目的別行き先の分析による、観光地としての都道府県の特性の整理
B 202 and/or 204(キャンセル)
Ø 内容:
Ø 課題:
10. 6月21日:ゼミ論中間報告
@ 201 「地方の過疎化の要因と、それに対する諸施設の影響度合いの調査」
Ø 内容:青森県・鹿児島県の人口の変化の様子、地域特性の指標、地域間相互作用の分析モデル
Ø 課題:地域特性の指標の整理、地域間相互作用の分析モデルの適用
A 205 (欠席)
Ø 内容:
Ø 課題:
B 207「衆議院総選挙 都道府県別投票率の分析」
Ø 内容:期待投票率と実際の投票率との散布図
Ø 課題:期待投票率と実際の投票率の乖離の整理
11. 6月28日:ゼミ論中間報告
@ 207「衆議院総選挙 都道府県別投票率の分析」
Ø 内容:都道府県別投票率の要因分解(投票率h – 投票率全国 = (投票率h – 期待投票率h) + (期待投票率h – 期待投票率全国) + (期待投票率全国 – 投票率全国)
Ø 課題:(投票率h – 期待投票率h) と (期待投票率h – 期待投票率全国) およびそれらの時間的変化の考察
A 199(欠席)
Ø 内容:
Ø 課題:
B 202(欠席)
Ø 内容:
Ø 課題:
C 204(欠席)
Ø 内容:
Ø 課題:
12. 7月5日:ゼミ論中間報告
@ 200「サヤ取りにおける機械学習的手法の有効性」
Ø 内容:残差の自己相関の確認(線形モデル、Random Forest)
Ø 課題:モデルの当てはまり具合の検証、lasso の利用の検討
A 203「羽田空港と成田空港の選択決定要因分析」
Ø 内容:観光目的を利用した都道府県の特徴づけの試み
Ø 課題:データを用いた分析(重力モデルなど)
B 199「売上高の対広告費弾力性分析」
Ø 内容:対広告費弾力性の試算
Ø 課題:散布図による外れ値の有無の確認、時差相関、企業分析
13. 7月12日:ゼミ論中間報告
@ 201「地方過疎化の要因と、それに対する諸施策の影響度合いの調査」
Ø 内容:地方特性指標のまとめ、流出入の提示
Ø 課題:モデル分析
A 205「日本人の余暇における行動分析」
Ø 内容:年齢別テレビ等の視聴時間、移動、休養、学習、趣味、スポーツに費やす時間の推移
Ø 課題:性別・就業状態・学歴の導入、余暇以外の生活時間の推移の確認、調査票の確認、社会生活基本調査調査票Bの利用の検討
B 202 and/or 204(欠席)
Ø 内容:
Ø 課題:
14. 7月19日:ゼミ論中間報告
@ 199 (欠席)
Ø 内容:
Ø 課題:
A 202「土地価格の統計的分析」
Ø 内容:都道府県別住宅地平均価格と人口、一人当たり県民所得との関係
Ø 課題:分析のやり直し
B 204「インバウンド需要の国別将来予測」
Ø 内容:国別のインバウンド数とGDP、人口、世界遺産数、言語、地域の関係
Ø 課題:回帰分析、変数変換
15. 7月 26日:ゼミ論中間報告
@ 202「土地価格についての統計的分析」
Ø 内容:都道府県別住宅地平均価格を被説明変数、人口と一人当たり県民所得を説明変数とした回帰式の推定(対数変換も試す)
Ø 課題:人口要因の表現の工夫(人口密度、森林を除く面積による人口密度、など)、供給要因の考慮、工業地・商業地の価格の分析
A 207「衆議院総選挙 都道府県別の投票率の分析」
Ø 内容:年齢別投票率格差の効果xと年齢構成格差の効果yの提示(第41回選挙から、第47回選挙まで)
Ø 課題:都道府県別の(x, y)の変化の提示、投票率推定モデルの構築
B 200「サヤ取りにおける機械学習的手法の有効性」
Ø 内容:City Bank と Bank of America の価格の散布図(シフトあり)、Gaussian 基底関数における移動分散の導入
Ø 課題:回帰式における外れ値の検出と回帰式自体のシフトの検出との組み合わせの検討
16. 9月13日--14日@リフレフォーラム(東大島):ゼミ論中間報告+3年生の教科書[1] 輪読。3年生の記録も参照。
Ø 9月13日14:00-17:00:3年生の教科書[1]輪読(第22期生の記録参照)
Ø 9月13日19:00-22:00:ゼミ論中間報告
@ 207「衆議院選挙 都道府県別投票率の分析」
ü 内容:都道府県別投票率要因分解
ü 課題:散布図の中の位置・時間的な動きによる都道府県の分類、投票率モデルの推定
A 204「日本の観光余力についての考察」
ü 内容:日本と諸外国のインバウンドの説明要因(人口、GDP、世界遺産数、島国など)の散布図の提示
ü 課題:重回帰分析の適用
B 200「機械学習を利用したサヤ取りの分析」
ü 内容:サヤ取りの原理、従来のアルゴリズム、ルックバック期間の選択、random forest の利用、2乗(分散)の時間依存性の利用
ü 課題:リスクの検知方法の高度化、
Ø 9月14日9:00-12:00:ゼミ論中間報告
C 205「日本人の余暇における行動分析」
ü 内容:1996年から2011年までの年齢別・性別生活時間の推移
ü 課題:生活時間予測モデル(説明変数:暦年・年齢・性別・就業状態・曜日など)の推定
D 202「土地価格についての統計的分析」
ü 内容:住宅地価格モデルの推定(人口と人口密度との選択、など)、工業地価格モデルの推定
ü 課題:工業地価格モデルにおける説明変数の選択(規模・面積などによる相対化の必要性の有無)、商業地価格モデルの推定
E 203「羽田空港と成田空港の選択要素分析」
ü 内容:重力モデルの推定、集計ロジットモデルの推定
ü 課題:乗法型モデルの推定、集計ロジットモデル推定のためのデータ(インバウンドについての移動手段選択データの入手可能性)
Ø 9月14日13:00-14:30:リクリエーション
Ø 9月14日14:30-16:00:コンパ
ü 9月14日16:10:解散
17. 10月4日:ゼミ論中間報告
今後の予定の確認
@ 200「ノンパラメトリック手法によるサヤ取りの分析
Ø 内容:サヤ取りにおけるRandom Forest 有効性に関する考察
Ø 課題:論文の執筆
A 203「経路選択の決定要因に関する統計的分析」(仮題)
Ø 内容:重力モデルの推定、国内移動における経路選択モデル推定についての構想の紹介
Ø 課題:国内移動における経路選択モデル推定
18. 10月11日:ゼミ論中間報告
@ 204「日本の観光余力についての考察」
Ø 内容:観光客数を被説明変数とした重回帰分析の推定
Ø 課題:対数変換、残差分析(必要な説明要因についての考察)、説明変数のさらなる探索
A 202「土地価格についての統計的分析」
Ø 内容:内容:工業地の価格分析、商業地の価格分析
Ø 課題:課題:変数の相対化の徹底(一事業所当たり出荷額、など)
19. 10月18日:ゼミ論中間報告
@ 205「日本人余暇における行動分析」
Ø 内容:余暇行動時間の予測モデルの推定(暦年、年齢、性別、就業状態、学歴を説明変数とする)
Ø 課題:曜日と交互作用の導入、行動者時間の分析
A 207「衆議院選挙都道府県別投票率の分析」
Ø 内容:修正投票率による都道府県のクラスター分析
Ø 課題:2種類の修正投票率の利用、投票率予測モデルの推定
20. 10月25日:ゼミ論中間報告
@ 200「ノンパラメトリック手法によるサヤ取りの分析」
Ø 内容:論文の構成
Ø 課題:論文の執筆
A 203「経路選択の決定要因に関する統計的分析」(仮題)
Ø 内容:ロジット分析
Ø 課題:サンプルサイズの確保
21. 11月1日:ゼミ論中間報告
@ 202 「土地価格についての統計的分析」
Ø 内容:住宅地の地価の分析(説明変数への高齢化率の追加)
Ø 課題:地価決定要因の枠組みの整理(宅地、工業地、商業地)
A 204 「日本の観光余力についての考察」
Ø 内容:重回帰分析
Ø 課題:変数選択
22. 11月8日:ゼミ論中間報告
@ 207「衆議院議員総選挙 都道府県別投票率の分析」
Ø 内容:クラスター分析(2つの投票率)、回帰分析
Ø 課題:年齢調整の方法についての工夫
A 205「日本人余暇における行動分析」
Ø 内容:曜日、交互作用、べき乗の追加
Ø 課題:係数の解釈、外れ値への対応
23. 11月15日:ゼミ中間報告
@ 200「ノンパラメトリック手法によるサヤ取りの分析」
Ø 内容:手法の比較方法(SPA検定)
Ø 課題:論文の執筆
A 203「競合交通機関における選択要因分析」
Ø 内容:ロジットモデルの推定
Ø 課題:ロジットモデルの推定(被説明変数の設定の確認)
B 204「日本の観光余力についての考察」
Ø 内容:新しい変数の追加、変数選択、論文の構成
Ø 課題:論文の執筆
24. 11月22日:ゼミ中間報告
@ 205「日本人余暇における行動分析」
Ø 内容:論文の構成、外れ値の同定とそれへの対応
Ø 課題:タイトルの推敲
A 207「衆議院議員総選挙 都道府県別投票率の分析」
Ø 内容:投票率を目的変数とした回帰分析、論文の構成
Ø 課題:論文の執筆
B 202「土地価格についての統計的分析」
Ø 内容:治安に関する変数(犯罪率)の追加、論文の構成
Ø 課題:治安に関する変数の再吟味
25. 11月29日:ゼミ論執筆指導(希望者のみ研究室にて)
26. 12月6日:ゼミ論提出
27. 12月13日:ゼミ論報告会用ハンドアウト原稿提出
Ø ハンドアウトの構成
I. 分析の目的
II. データの説明
III. 分析と結果の考察
IV. 結論
V. 参考文献
Ø 書式など:A4用紙で2ページないし4ページ、最初のページに、(1)表題、(2) 作成者の番号・氏名、(3)提出or作成年月日、を記すこと。図表には、番号と表題をつけること。
28. 12月17日(土)ゼミ論報告会(場所:3-914)
Ø 報告会プログラム
I. はじめに(西郷) 14:40-14:45
II. 報告
@ 14:45-15:15 204「世界の観光需要に関する要因分析と日本の位置」
A 15:15-15:45 205「日本の余暇時間における行動分析」
B 15:45-16:15 200「Nonparametric Pairs Trading with International ETFs」
16:15-16:30 休憩
C 16:30-17:00 203「競合交通機関における選択要素」
D 17:00-17:30 207「衆議院議員総選挙 都道府県別投票率の分析」
E 17:30-18:00 202「国内土地価格に影響を与える要素の分析」
III. 第22期生ゼミ論抱負 18:00-18:05
IV. おわりに(西郷)18:05-18:15
(終了後、忘年会)
Ø レポート:
I. 内容:自分のもの以外のゼミ論報告の中からひとつを選び、内容を要約して論評せよ。
II. 提出期限:2016年12月31日23:59
III. 提出方法:Course N@vi への添付ファイル(PDF)
IV. 用紙・分量:A4用紙1枚程度
29. 12月20日:ゼミ論執筆指導(希望者のみ研究室にて)
30. 1月10日:ゼミ論執筆指導(希望者のみ研究室にて)
31. 1月17日:ゼミ論執筆指導(希望者のみ研究室にて)
32. 1月24日:ゼミ論再提出
プレ演習(2年生 第23期生)
l 曜日・時限・教室:土1@3-915
l 内容:統計検定2級の問題検討
l 評価:出席状況
l 出席確認:あり
l 講義記録:
1. 10月29日:統計検定2級(2016年6月21日実施)の問題の検討
2. 11月19日:統計検定2級(2015年11月29日実施)の問題の検討
3. 12月3日:統計検定2級(2016年11月27日実施)の反省
以上