樹木構造接近法

書籍情報
シリーズ名Rで学ぶデータサイエンス 全20巻 【9】巻
ISBN978-4-320-11056-4
判型B5 
ページ数232ページ
発行年月2013年10月
本体価格3,500円
樹木構造接近法 書影
樹木構造接近法

 コンピュータを基盤におく情報処理環境および計算環境が整備されるに伴い,ゲノム・データ,マーケティング・データといった,「ビッグデータ」から有用な知見を発見することに注目が集まっている。
  本書でとり扱う樹木構造接近法は,上記の要件を解決するための統計的方法の一つである。分類回帰樹木(CART: Classification And Regression Trees)法に代表される樹木構造接近法は,解析結果が,樹木図(デンドログラム)で与えられることから,解釈が平易な点で有用である。そのため,多くの統計パッケージに実装されており,医学,環境科学,生態学,計量経済学,認知心理学といった様々な分野のなかで応用例が報告されている。また,多数の樹木の統合形式で与えられるアンサンブル樹木法は,高い予測確度をもつことから,統計的機械学習法などの分野で脚光を浴びている。
  他方,本邦において,樹木構造接近法およびアンサンブル樹木法をとり扱った成書は皆無である。そのため,本書では,これらの方法の数理的基盤から,統計解析環境Rでの適用方法までをとり扱っている。前者では,樹木構造接近法に絡む統計的方法について幅広くとり扱うことに留意している。また,後者では,それらの方法を応用するうえでの適用上の留意点および,複数のパッケージが存在する場合には,それらの違いについて詳細に述べている。また,Rのパッケージに含まれない統計量・グラフィクスについては,新たな関数を開発している。これらの関数は,実際の統計的データ解析の場面で応用できるように,汎用性に留意して構成されている。さらに,最近の方法などについても幅広く紹介している。

目次

第1章 分類回帰樹木(CART)法とその周辺
1.1 はじめに
1.2 CART法の概略と記法
1.3 CART法
1.4 RによるCART法の例示
1.5 多変量回帰樹木法
1.6 その他の拡張手法

第2章 検定統計量に基づく樹木
2.1 検定統計量に基づく樹木の概要
2.2 条件付き推測樹木
2.3 ハイブリッド型樹木法

第3章 多変量適応型回帰スプライン法とその周辺
3.1 多変量適応型回帰スプライン(MARS)法
3.2 柔軟判別分析
3.3 論理回帰法

第4章 データ・ピーリング法とその周辺
4.1 データ・ピーリング法
4.2 アソシエーション・ルール分析

第5章 ブースティング法に基づくアンサンブル樹木法
5.1 AdaBoost法
5.2 多重加法型回帰樹木法

第6章 ブートストラップ法に基づくアンサンブル樹木法
6.1 Bagging法
6.2 RandomForest法

補遺A 線形モデル
A.1 重回帰分析
A.2 一般化線形モデル

補遺B 利用したパッケージ一覧

補遺C データ集合の一覧

索引