統計的因果推論の理論と実装

―潜在的結果変数と欠測データ―

紙 + 電子書籍
統計的因果推論の理論と実装
著者 高橋 将宜 著・ 石田 基広 監修・ 市川 太祐 編・ 高橋 康介 編・ 高柳 慎一 編・ 福島 真太朗 編・ 松浦 健太郎
分野 数学  > 統計  > データ解析
数学  > データサイエンス
情報・コンピュータ  > プログラミング・言語  > R
シリーズ 数学  > Wonderful R
発売日 2022/02/14
ISBN 9784320112452
体裁 B5・340頁
定価 3,850円 (本体3,500円 + 税10%)
  • この本の
    内容
  • 目次
  • 関連情報

本書は、統計的因果推論の理論(数理的メカニズム)と実装(Rによる数値解析)の両方を統一的にカバーしたものである。具体的には、ハーバード大学統計学科のDonald B. Rubinの提唱した潜在的結果変数の枠組みによる統計的因果推論を扱う。また、データの一部が観測されない場合の因果推論も扱っており、これは類書にはほとんどみられない本書の特徴である。

本書の数理的な理論解説は、できるだけ高校数学の範囲内で理解できるように工夫した。微積分や線形代数も、ほぼ登場しない。さらに、必要な数学的知識は、登場する箇所で解説を加えた。また、Rを使った数値計算により、数学が苦手な人にも統計的因果推論のメカニズムを理解してもらえるように工夫している。そして、数式とRコードとの対応関係をRの初心者も理解できるように、できるだけ1行ごとに完結するコードを書くよう心がけた。

さらに、Rを使って統計的因果推論の実証研究を行うための実践的な内容も盛り込んでいる。本書の解析結果は、シミュレーション結果を除いて、すべて、本書の中に記載されているRコードを使って再現できるようにした。そして、本書で使用したデータはすべて、本書のサポートページからダウンロードして使用できるので、本書記載のRコードと一緒に活用することで、統計的因果推論を実践的に学ぶことができる。

Chapter 1 統計的因果推論の基礎の基礎
1.1 統計的因果推論の考え方を学ぶための具体例
 1.1.1 白髪と薄毛の関係
 1.1.2 ごま油と長寿の関係
 1.1.3 インターネット広告と売上高の関係
 1.1.4 身長と体重の関係
 1.1.5 「アスピリンと頭痛」および「性別と髪の長さ」の例
1.2 統計的因果推論とは
1.3 反事実モデル
1.4 操作なくして因果なし
1.5 人種差別と就職活動の関係
1.6 身長と体重の関係の続き
1.7 グレンジャー因果
1.8 Rubin流とPearl流の因果推論
1.9 Rに関することがら
 1.9.1 Rのインストール
 1.9.2 本書のRコードについて
 1.9.3 Rへのデータの読み込み方法
 1.9.4 forループ

Chapter 2 潜在的結果変数の枠組み
2.1 潜在的結果変数の枠組み:具体例
2.2 潜在的結果変数の枠組み:理論
2.3 処置効果1:個体因果効果
2.4 処置効果2:平均処置効果
2.5 処置効果3:処置群の平均処置効果
2.6 交絡因子
 2.6.1 インフルエンザと新薬Xの関係における交絡
 2.6.2 方向付き非巡回グラフ(DAG)
2.7 無作為抽出と無作為割付け
2.8 無作為割付けによる分析の例
2.9 内的妥当性と外的妥当性
2.10 2標本t検定

Chapter 3 統計的因果推論における重要な仮定
3.1 SUTVA
3.2 確率
3.3 条件付き確率と独立性
3.4 条件付き期待値
3.5 識別性の条件
3.6 実験研究における平均処置効果(ATE)の推定
3.7 独立性と条件付き独立性:シンプソンのパラドックス
3.8 共変量の役割
3.9 回帰分析と共分散分析

Chapter 4 推測統計の基礎:標準誤差と信頼区間
4.1 標準誤差
 4.1.1 母集団データ
 4.1.2 標本抽出と標本平均
 4.1.3 標本平均のばらつき
 4.1.4 中心極限定理
 4.1.5 t統計量
4.2 信頼区間
 4.2.1 90%信頼区間の例
 4.2.2 信頼区間によるt検定
 4.2.3 信頼区間による対応のある場合の2標本t検定
 4.2.4 信頼区間による対応のない場合の2標本t検定

Chapter 5 回帰分析の基礎
5.1 回帰モデルの基礎の基礎
5.2 数値例で理解する最小二乗法
5.3 種明かし:最小二乗法による切片と傾きの公式
5.4 条件付き期待値としての回帰モデル
5.5 最小二乗法による切片と傾きの公式(補遺)

Chapter 6 図で理解する重回帰モデルの基礎
6.1 データ
6.2 分散
6.3 ESSとUSS
6.4 決定係数
6.5 回帰係数の標準誤差と回帰の標準誤差
6.6 三変数のバレンティン・ベン図
6.7 三変数の重回帰モデル
6.8 因果ダイアグラムによる考察
6.9 共分散分析(再考)
6.10 実験研究における共分散分析の活用

Chapter 7 最小二乗法による重回帰モデルの仮定と診断1
7.1 仮定1:誤差項の期待値ゼロ
7.2 仮定2:パラメータ(母数)における線形性
 7.2.1 使用するデータの設定に関する情報
 7.2.2 線形モデルによる推定
 7.2.3 変数変換
 7.2.4 対数変換後の回帰係数の解釈
 7.2.5 変数の線形性と母数の線形性の違い
 7.2.6 多変量における診断方法
7.3 仮定3:誤差項の条件付き期待値ゼロ
 7.3.1 不要な変数をモデルに取り入れる問題
 7.3.2 中間変数をモデルに取り入れる問題

Chapter 8 最小二乗法による重回帰モデルの仮定と診断2
8.1 仮定4:完全な多重共線性がないこと
 8.1.1 多重共線性
 8.1.2 多重共線性の診断:VIF
 8.1.3 共変量における多重共線性
8.2 仮定5:誤差項の分散均一性
 8.2.1 不均一分散の影響
 8.2.2 不均一分散の診断
 8.2.3 不均一分散への対処法1:加重最小二乗法
 8.2.4 不均一分散への対処法2:不均一分散に頑健な標準誤差
8.3 仮定6:誤差項の正規性
8.4 不均一分散の場合の回帰係数の分散の導出(補遺)

Chapter 9 交互作用項のある共分散分析
9.1 共分散分析の仮定
9.2 交互作用項のある共分散分析
 9.2.1 平均処置効果
 9.2.2 標準誤差
 9.2.3 簡便な推定方法
9.3 統制すべき共変量に関するまとめ
 9.3.1 第6章から第9章での指摘事項
 9.3.2 その他の事項
9.4 共分散分析の限界
9.5 共分散分析と傾向スコアの優劣

Chapter 10 傾向スコア
10.1 バランシングスコア
10.2 傾向スコア
10.3 傾向スコア定理
10.4 傾向スコアのモデル化
 10.4.1 二値の結果変数のモデリング
 10.4.2 Rによる確認
 10.4.3 ロジスティック回帰モデル
 10.4.4 傾向スコアの算出
10.5 傾向スコアのモデル化の例
10.6 RパッケージMatchItによる傾向スコアのモデル化

Chapter 11 傾向スコアマッチング:ATTの推定
11.1 比較政治学における「よく似たシステムデザイン」
11.2 統計的因果推論における「マッチング」
11.3 推定対象
11.4 使用するデータ
11.5 ナイーブな比較と共分散分析
11.6 復元によるマッチングと非復元によるマッチング
11.7 距離
11.8 マッチング方法
11.9 Rによる復元抽出の傾向スコアマッチング:ATTの推定
11.10 標準誤差について
11.11 傾向スコアによるバランシングの評価
11.12 シミュレーションによる性能比較
11.13 傾向スコアをマッチングに使うべきでない?
11.14 質的研究のためのマッチング

Chapter 12 傾向スコアによる層化解析法および重み付け法:ATEの推定
12.1 傾向スコアによる層化解析法
 12.1.1 標本調査における層化抽出法
 12.1.2 層化解析法とは
 12.1.3 層の数
 12.1.4 Rによる傾向スコア層化解析:ATEの推定
 12.1.5 傾向スコアによるバランシングの評価
 12.1.6 シミュレーションによる性能比較
12.2 傾向スコアによる重み付け法
 12.2.1 標本調査における重み付け法
 12.2.2 Rによる傾向スコアの重み付け法:ATEの推定

Chapter 13 操作変数法の基礎
13.1 操作変数のイメージ図
13.2 操作変数の定義
13.3 Rによる操作変数推定量
13.4 二段階最小二乗法1:操作変数が1個の場合
13.5 二段階最小二乗法2:操作変数が複数個の場合
13.6 内生変数と外生変数
13.7 Rによる二段階最小二乗法
13.8 二値変数の場合の二段階最小二乗法
13.9 よくない操作変数
13.10 操作変数の妥当性の検証

Chapter 14 操作変数法による非遵守への対処
14.1 非遵守(ノンコンプライアンス)
14.2 遵守者と非遵守者の4つの種類
14.3 使用するデータ
14.4 単調性の仮定と推定対象
14.5 無作為化奨励デザインと4つの推定量
14.6 Rによる無作為化奨励デザインの分析
14.7 仮定の妥当性

Chapter 15 回帰不連続デザインの基礎
15.1 使用するデータと状況設定
15.2 平均処置効果と共分散分析
15.3 外挿の問題
15.4 閾値における局所的な平均処置効果
15.5 回帰不連続デザインによる解析
15.6 回帰不連続デザインの図解
15.7 回帰不連続デザインの理論
15.8 回帰不連続デザインの現状

Chapter 16 回帰不連続デザインの応用
16.1 使用するデータ:選挙における現職の利点
16.2 図を使った解析
16.3 数値による分析
16.4 Rパッケージrdrobustによる解析:基本編
16.5 カーネル密度推定
16.6 カーネル関数の選択
16.7 バンド幅の選択
16.8 RDプロット

Chapter 17 回帰不連続デザインの仮定および実践
17.1 連続性の仮定と強制変数の操作
 17.1.1 強制変数の操作の仮定の緩和条件
 17.1.2 グラフによる連続性の仮定の診断
 17.1.3 フォーマルな検定による連続性の仮定の診断
17.2 Rパッケージrdrobustによる分析:上級編
 17.2.1 使用するデータ
 17.2.2 データの可視化
 17.2.3 連続性の仮定の診断
 17.2.4 解析1:共変量なし
 17.2.5 共変量の追加
 17.2.6 解析2:共変量あり

Chapter 18 ファジーな回帰不連続デザイン
18.1 ファジーな回帰不連続デザイン
18.2 使用するデータ
18.3 RによるファジーRDD

Chapter 19 欠測データ処理の基礎
19.1 欠測のメカニズム
19.2 単一代入法
19.3 多重代入法とそのアルゴリズム
19.4 多重代入法を用いた解析の流れ
19.5 結果の統合方法
19.6 Rパッケージmiceによる解析方法
19.7 適合性の問題
19.8 多重代入法の診断方法
19.9 実験研究における欠測値の処理
19.10 交互作用項のある重回帰モデルにおける欠測値処理

Chapter 20 統計的因果推論における欠測データ
20.1 傾向スコアマッチングにおける欠測値の処理
20.2 操作変数法における欠測値の処理
20.3 回帰不連続デザインにおける欠測値の処理

Chapter 21 統計的因果推論手法としての多重代入法
21.1 先行研究
21.2 多重代入法による平均因果効果の推定
21.3 多重代入法による個体因果効果の推定

おわりに

参考文献

索引

Shopping
ご注文

3,850円
(本体3,500円 + 税10%)

ネット書店で購入

電子書籍

価格は各電子書籍店にてご確認ください。

電子書籍店で購入