経済経営のデータサイエンス
経済経営分野の統計教育は歴史と伝統のある裾の広い分野であり、計量経済学を核とした経済経営データ分析の体系がある。機械学習やAIの進展がデータ分析の視点と範囲を広げている昨今においては、経済経営分野でもこれらを積極的に取り入れることが求められている。本書はこのような状況のもと、統計学を基礎としながら新しいデータ分析の手法を体得することを意図して書かれた。
本書は、確率統計の基礎知識を前提とし、統計学入門を履修した大学2年次以降の学部生、大学院生および経済経営のデータ分析に関心を寄せる実務家を対象としている。主にビジネスデータで活用されてきた多変量解析と呼ばれる伝統的手法に加えて、ベイジアンネットワークやLASSOなど代表的な機械学習やAI手法を、初等レベルで経済経営データを分析しながら学ぶ。各章の例題で使われたデータと分析のRコードはダウンロードして利用できる。各章の理解に際しては、自身でデータ分析を実践し、データから情報を抽出することがいかに容易で面白いかをぜひ体得してほしい。
1.1 単回帰モデル
1.2 重回帰モデル
1.3 最小二乗推定量の性質
第2章 変量間の関係を調べる:回帰モデルの統計的推測
2.1 最小二乗推定量の標本分布
2.2 t検定
2.3 F検定
第3章 モデルの複雑さをコントロールする:正則化
3.1 行列表記
3.2 多重共線性
3.3 正則化
3.4 バイアスと分散
第4章 高次元回帰モデルを効率的に推定する:Lasso
4.1 Lasso推定量の性質
4.2 adaptive Lasso
4.3 実証分析
第5章 高次元における統計的推測:多重検定
5.1 debiased Lasso推定量
5.2 多重検定
第6章 統計手法が正しく機能するか調べる:モンテカルロ実験
6.1 期待値の検定のモンテカルロ実験
6.2 回帰係数の検定のモンテカルロ実験
6.3 現代の統計学におけるモンテカルロ実験
第7章 コンピューターの力で難題を解決する:ブートストラップ
7.1 期待値の検定のブートストラップ
7.2 回帰係数の検定のブートストラップ
7.3 現代の統計学におけるブートストラップ
第8章 データを可視化する:主成分分析,因子分析,多次元尺度構成法
8.1 主成分分析
8.2 因子分析
8.3 多次元尺度構成法
8.4 補論:主成分分析の数理
第9章 集団を分類する:クラスター分析,ナイーブ・ベイズ分類,決定木
9.1 クラスター分析
9.2 ナイーブ・ベイズ分類
9.3 決定木
9.4 補論:共役事前分布とベイズ確率モデル
第10章 判別して要因を探る:ロジスティック回帰,判別分析
10.1 ロジスティク回帰
10.2 判別分析
第11章 原因を推定する:ベイジアンネットワーク
11.1 ベイジアンネットワークとは
11.2 ベイジアンネットワークの使い方
11.3 分析事例:ダイレクトマーケティング分析
第12章 文書から話題を見つける:トピックモデル
12.1 文書データの分析
12.2 トピックモデル
12.3 LDA:潜在ディリクレ配分法
12.4 STM:構造トピックモデル
第13章 好みを見つける:推薦システム
13.1 推薦システム
13.2 協調フィルタリング
13.3 分析事例:映画の推薦
13.4 より進んだトピック
参考文献
略 解
索 引