刊行中のシリーズ



Rで学ぶデータサイエンス

金 明哲:編集

刊行の趣旨

データサイエンスは,理論だけではなく,実際のデータを操作・解析・マイニングを行わなければならない。そのためには,基礎理論を理解し,その理論に基づいてツールを用いて実現しなければならない。そのツールとして近年フリーであるRが急速に普及している。Rには,すでに数千のフリーパッケージが公開されている。また,Rに関する訳書・和書は20冊を超えているが,初級レベルのものがほとんどである。また,データサイエンスは,理工系だけではなく,非理工系や多くの専門分野で用いるようになっている。非理数系の人の中には,数理的な基礎が弱く,直接厳密な数理理論からデータサイエンスに入門するのが困難である方がほとんどである。そのような方々にとっては,実践的に入門を行い,数理理論を徐々に理解するのも一つの方法である。数理に強い方,弱い方などに関係なく幅広く,長く利用できる本を提供することが本シリーズを企画する目的である。


1.カテゴリカルデータ解析
(2010年4月配本予定)
2.多次元データ解析法
(2009年8月24日配本)
3.ベイズ統計データ解析 4.ブートストラップ入門
5.パターン認識
(2009年10月22日配本)
6.マシンラーニング
(2009年6月8日配本)
7.空間データ解析
(2010年5月配本予定)
8.ネットワーク分析
(2009年9月24日配本)

(各巻タイトルは予告なく変更される可能性があります。)




1.カテゴリカルデータ解析
藤井良宜 著
B5


●内容
 連続なデータに対する解析方法については,さまざまな本が出版されている。しかし,カテゴリカルなデータについては,カイ2乗検定やフィッシャーの直接確率法などの基本的な解析手法について述べられているものは多いが,すこし発展的な手法については詳しく述べられているものはあまりない。この本では,ロジスティック回帰分析や対数線形モデルや樹形モデルによる解析などの発展的な方法についてもRによる解析方法を説明する。さらに,単に解析のやり方を説明するだけではなく,社会科学を中心に研究されている方や数理に弱い方でも解析手法の選択ができるように,できるだけ各手法の目的や原理のポイントを簡潔に説明し,具体的な解析例も提示するよう心がけている。

●目次
第1章 カテゴリカルデータの取り扱い
第2章 カテゴリカルデータの集計とグラフ表示
第3章 比率に関する分析
第4章 2元分割表の解析
第5章 3元分割表の解析
第6章 ロジスティック回帰分析
第7章 ポアソン回帰分析
第8章 対数線形モデルによる解析
第9章 対応分析
第10章 樹形モデル
第11章 数量化の諸方法
新刊
ページトップへ



2.多次元データ解析法
中村永友 著
B5,264頁,3500円

●内容
 本書は,多次元データ解析法に関する基礎的な考え方を解説し,同時にその理論とデータ分析の方法について述べたものである。さらに,データ解析環境であるR言語でのこれらの手法の使い方を解説している。本書の対象となる読者は,データ解析の基礎を学ぼうとするすべての方々である。
 取り上げたデータ解析法は,線形回帰モデル,判別分析法,ロジスティック回帰モデル,主成分分析法,対応分析法,因子分析法,正準相関分析法,多次元尺度法,クラスター分析法である。基本的なデータの扱い方,R言語の基礎事項を確認してから本編に入っている。本書はこのシリーズの中では最も基本的な手法を扱い,これらの手法をしっかり身につけるために,丁寧な解説をしている。

※2009年8月25日 初版1刷発行の正誤表

●目次
第1章 統計学の基礎
第2章 Rの基礎
第3章 線形回帰モデル
第4章 判別分析
第5章 ロジスティック回帰モデル
第6章 主成分分析法
第7章 対応分析法
第8章 因子分析法
第9章 正準相関分析法
第10章 多次元尺度法
第11章 クラスター分析法
新刊
注文する
ページトップへ



3.ベイズ統計データ解析
姜 興起 著
B5

●内容
 今日,複雑な構造をもつ種々の問題を考察するうえで,ベイズ的方法は非常に有効なアプローチとして認識されている。ベイズ統計解析では,とくにモデリングの技法とパラメータ推定に関する計算法の占める比重が大きく,本書を通読することで,そうしたベイズ統計学の基礎知識が深まるよう配慮している。また,本書は応用の側面も重視しており,分析方法の解説と併せてRによるプログラムを提示する。具体的には,MCMCなどの計算技術,状態空間モデルを用いた季節調整モデル,時変係数ARモデルに関する解析法などを解説し,Rで編成したプログラムを紹介する。応用例としては,ヒューマンインタフェースにおけるデータ解析のためのベイズ型モデル,経済構造の変化を伴う動的生産関数モデルの構築などを取り上げる。さらに,付録としてRの基礎知識とプログラム集を記載しておく。

●目次
第1章 ベイズ統計解析の基本
1.1 ベイズ統計学の概要
2.2 事前分布とその利用
3.3 ベイズ統計解析の応用
第2章 回帰モデルに関するベイズ推測
2.1 線形回帰モデルのベイズ推測
2.2 関数的回帰についてのベイズ推測
2.3 条件付き回帰モデルについてのベイズ推測
2.4 相関係数についてのベイズ推測
第3章 複雑なモデルのための計算法
3.1 ベイズ推測と積分
3.2 事後分布の近似計算
3.3 モンテカルロ法による数値積分
3.4 リジェックションサンプリング
3.5 インポータンスサンプリング
第4章 MCMC法
4.1 マルコフ連鎖
4.2 MCMC法
4.3 ギブスサンプリング
4.4 メトロポリス-ヘイスティングズ・アルゴリズム
第5章 階層的なベイズモデル
5.1 階層的なベイズモデルの基本
5.2 個別推定と同時推定
5.3 事後分布に関する推測
5.4 ベイズ型線形モデルについてのベイズ推測
第6章 判別分析とパターン認識
6.1 判別分析の概要
6.2 正規分布を持つ線形判別モデル
6.3 ベイズ的判別分析
6.4 サポートベクターマシンへのベイズ的接近
第7章 状態空間モデルによるベイズ解析
7.1 状態空間モデルの基本
7.2 カルマンフィルタ
7.3 平滑化のアルゴリズム
7.4 状態の長期予測
第8章 トレンドの推定と季節調整
8.1 トレンド推定のベイズ型モデル
8.2 季節調整のベイズ型モデル
8.3 定常AR成分を含む季節調整モデル
8.4 より複雑な季節調整モデル
第9章 時変係数ARモデル
9.1 時変分散の推定
9.2 時変係数ARモデル
9.3 時変スペクトルの推定
9.4 時変ARモデルの応用
第10章 時変係数VARモデル
10.1 時変係数VARモデル
10.2 時変共分散の推定
10.3 時変クロススペクトルの推定
10.4 時変VARモデルの応用
第11章 非ガウス型モデル
11.1 状態空間モデルの一般化
11.2 モンテカルロ法による状態の推定
11.3 モンテカルロ法による平滑化
第12章 ヒューマンインタフェースにおけるデータ解析の事例
12.1 Fittsのモデル
12.2 Fittsのモデルの改良
12.3 モデルの拡張と一般化
12.4 数値例
第13章 動的生産関数解析の事例
13.1 モデルの構築
13.2 パラメータの推定
13.3 数値例
【付録A】 Rの基礎知識
【付録B】 プログラム集
新刊
ページトップへ



4.ブートストラップ入門
汪 金芳・桜井裕仁 著
B5


●内容
 本書は,ブートストラップ法に関する基礎的な理論と考え方,および,それらを現実のデータ解析に如何に応用するかをまとめた解説書である。ブートストラップ法とは,手元のデータからサンプリングを行うリサンプリング(標本再抽出)法の一種であり,複雑な数式を知らなくとも,推定量の分散をはじめとする種々の統計的誤差の推定や統計量の分布の推定などを行える,計算機指向型統計手法である。
  本書では,実用上有用な母集団分布が未知の場合のブートストラップ法を中心として解説し,各種の推定量や信頼区間の構成法をはじめとして,回帰分析法,モンテカルロ検定・並べ替え検定・ブートストラップ検定などを含む仮説検定法,時系列データへの適用法,効率的リサンプリング法などを紹介する。また,紹介した方法に対応するRのサンプルコードやデータ解析例なども示されており,ブートストラップ法を理解するのに役立つであろう。

●目次
第1章 Rの使用準備とデータ解析の基礎
第2章 ブートストラップ法の概説
第3章 信頼区間の構成
第4章 仮説検定
第5章 回帰分析
第6章 時系列データ解析
第7章 効率的リサンプリング法
新刊
ページトップへ



5.パターン認識
(ISBN978-4-320-01925-6)
金 明哲 編
金森敬文・竹之内高志・村田 昇 著
B5,288頁,3700円

●内容
 パターン認識とは,対象の特徴量から対象が属するカテゴリを推測する方法をさす。本書では,フリーソフトウェアであるRを利用して,パターン認識のさまざまな方法を解説している。手法としては,判別分析,ロジスティック回帰,k平均法,k近傍法,階層的クラスタリングといった古典的な方法から,サポートベクターマシンやブースティングといった比較的最近の話題まで取り上げている。各章は独立に読むことができるように構成され,簡単な例題をRを用いて実際に解析しながら読み進むことにより,パターン認識の基本的な考え方を身に着けることができる。また付録としてRの基本的な操作の説明と,アルゴリズムの実装例を紹介している。

※Rで学ぶパターン認識の本に掲載されているRのプログラムをデモ用にまとめました。
LZH形式とZIP形式の圧縮ファイルをご用意しましたのでご使用環境にあわせてダウンロードしてください。ファイルを適当なところで展開してRを起動し,source(“script.r”) とすれば使い方が表示されます。
demo.lzh demo.zip


まえがき (PDFファイル)

●目次 (詳細目次 PDFファイル)
第1章 判別能力の評価
第2章 k-平均法
第3章 階層的クラスタリング
第4章 混合正規分布モデル
第5章 判別分析
第6章 ロジスティック回帰
第7章 密度推定
第8章 k-近傍法
第9章 学習ベクトル量子化
第10章 決定木
第11章 サポートベクターマシン
第12章 正則化とパス追跡アルゴリズム
第13章 ミニマックス確率マシン
第14章 集団学習
第15章 2値判別から多値判別へ
新刊
注文する
ページトップへ



6.マシンラーニング
(ISBN978-4-320-01926-3)
辻谷将明・竹澤邦夫 著
B5,244頁,3500円

●内容
 マシンラーニングは,データから有益な情報を発掘することを目的とした技術である。その内容は多岐に渡り,長い歴史を持つ一方,近年,長足の進歩を遂げた。それらの中で本書は,重回帰,ノンパラメトリック回帰,樹形モデル,判別分析,一般化加法モデル,ニューラルネットワーク,サポートベクターマシン,生存時間解析などを扱っている。
 フリーソフトウェア「R」を活用すれば,これらの手法の実用性が増す。基本的な概念の構築から最新の手法を駆使した解析までをRプログラムを提示しながら解説している。また,それぞれの手法の統計学的な内容とRプログラムの利用法を並行して理解することができる。そのため,Rのマニュアルや出力結果を親しみにくいと感じマシンラーニングの実践を躊躇していた方々も,本書によってそうした逡巡から解放されるであろう。

※本書で掲載されているRコマンドを以下からダウンロードできます。LZH形式とZIP形式の圧縮ファイルをご用意たしましたので,ご使用環境にあわせてダウンロードしてください。
r_program.lzh r_program.zip

※組み見本 p31 p83 p198


本シリーズの編集にあたって・まえがき (PDFファイル)

●目次 (詳細目次 PDFファイル)
第1章 序論
第2章 重回帰
第3章 ノンパラメトリック回帰
第4章 Fisherの判別分析
第5章 一般化加法モデル(GAM)による判別
第6章 樹形モデルとMARS
第7章 ニューラルネットワーク
第8章 サポートベクターマシン(SVM)
第9章 生存時間解析
新刊
注文する
ページトップへ



7.空間データ解析
谷村 晋 著
B5

●内容
 本書は,地理空間データに関する基礎理論と分析手法について述べた解説書である。理論的背景の解説に加えて,フリーソフトウェアのデータ解析環境Rによる事例解説により,読者が自分自身の手で実践的に理論・方法・技術を確認できるように構成されている。本書の対象は,地球統計学,計量地理学,地理空間情報学を目指す学生のみならず,位置情報が関与するさまざまな分野,環境学,疫学・公衆衛生学,犯罪科学,経済学,生態学,都市計画学,マーケティング,その他の実務家,専門家,学生を幅広く対象としている。
 本書は,地理空間データの特性,データの構造モデル,カーネル密度推定法・クリギング・経験的ベイズ推定法を含むさまざまな視覚化の理論・方法,空間クラスターの検出など地理空間分布パターンに関する分析手法,道路などのネットワーク分析,空間回帰モデルなど地域要因を伴う空間モデリング,立地分析について解説するほか,付録として,空間集計や空間計測など地理空間データ操作の解説なども収録している。

●目次
第1章 地理空間データ
1.1 データ構造モデル
1.2 R における地理空間データ
1.3 地理空間データの取得
1.4 地理空間データをめぐる諸問題
第2章 地理空間データの可視化
2.1 はじめに
2.2 彩色設計
2.3 地図の種類
2.4 凡例、方位記号、縮尺記号
2.5 空間的属性の分類方法
2.6 密度変換による視覚化
2.7 空間補間法による視覚化
2.8 地域統計指標の補正
2.9 共変量による補正
2.10 属性のクラスタ分類と視覚化
2.11 おわりに
第3章 地理空間分布パターン
3.1 地点データ
3.2 面域データ
3.3 その他の分析手法
3.4 属性値つき地点データ
3.5 おわりに
第4章 ネットワーク分析
4.1 直線距離と移動距離
4.2 最短経路の検出
第5章 地理空間相関分析
5.1 空間誤差モデル
5.2 空間的同時自己回帰モデル
5.3 空間的条件付き自己回帰モデル
5.4 地理的加重回帰モデル
第6章 立地分析
付 録
新刊
ページトップへ



8.ネットワーク分析
(ISBN978-4-320-01928-7)
金 明哲 編
鈴木 努 著
B5,192頁,3300円

●内容
 ネットワーク分析とは,さまざまな対象を点と線からなるネットワークとして表現し,その構造的な特徴を探る研究方法である。ネットワーク分析はこれまで,人間関係や集団間の関係を扱う社会学,人類学,心理学などの人文社会科学,またグラフ理論と呼ばれる数学とそれを応用した情報科学やオペレーションズ・リサーチなどの工学分野で発展してきた。近年ではそれらの領域を横断し,さらに物理学や生物学の領域をも含む「ネットワーク科学」として,学問的な関心だけでなく一般的な注目も集めるようになってきている。本書は,データ分析用のフリーソフトであるR を使って,ネットワーク分析の理論と実際の分析法を学ぶことを目的としている。

※本書で掲載されているRコマンドを以下からダウンロードできます。LZH形式とZIP形式の圧縮ファイルをご用意たしましたので,ご使用環境にあわせてダウンロードしてください。
NetworkAnalysisSampleCodes.zip   NetworkAnalysis Sample Codes.lzh


  ※2009年9月25日 初版1刷発行の正誤表

まえがき (PDFファイル)

●目次 (詳細目次 PDFファイル)
はじめに
第1章 ネットワークデータの入力
1.1 ネットワークとグラフ
1.2 隣接行列
1.3 辺リスト
1.4 ファイルの読み込み
1.5 多重グラフ
1.6 重み付きグラフ
1.7 二部グラフ
第2章 最短距離
2.1 最短経路と最短距離
2.2 幅優先探索
2.3 ダイクストラ法
2.4 ウォーシャル・フロイド法
2.5 snaの場合
2.6 igraphの場合
2.7 到達可能性行列
第3章 ネットワーク構造の諸指標
3.1 密度
3.2 推移性
3.3 相互性
3.4 分析例
第4章 中心性
4.1 点中心性
4.2 離心中心性・近接中心性
4.3 次数中心性
4.4 固有ベクトル中心性
4.5 PageRank
4.6 ボナチッチのパワー中心性
4.7 媒介中心性
4.8 情報中心性
4.9 集中度
4.10 二部グラフの中心性
4.11 分析例
第5章 ネットワーク構造の分析
5.1 サブグループ
5.2 構造同値性
5.3 ストラクチュラル・ホール
第6章 ネットワークの類似性
6.1 関係構造の類似性
6.2 中心化の類似性
第7章 ネットワーク指標の有意性検定
7.1 ネットワーク分析における統計的仮説検定
7.2 QAP検定
7.3 CUG検定
第8章 モチーフ
8.1 モチーフ
8.2 トライアド・センサス
第9章 複雑ネットワーク
9.1 複雑ネットワーク
9.2 ランダムグラフ
9.3 スモールワールド・ネットワーク
9.4 スケールフリー・ネットワーク
第10章 ネットワーク分析とベイジアン・アプローチ
10.1 認知ネットワークからのネットワークの推定
10.2 ベイジアン・ネットワーク
第11章 グラフ描画
11.1 2次元グラフ
11.2 3次元グラフ
11.3 グラフィックスの保存
付録A Rの基礎知識
付録B 数学の基礎知識
新刊
注文する
ページトップへ





TOPページへ戻る
Copyright (C) 2009 KYORITSU SHUPPAN CO.,LTD.