| Rで学ぶデータサイエンス
金 明哲:編集 ●刊行の趣旨 |
![]() |
| 1.カテゴリカルデータ解析 (2010年4月21日配本) |
2.多次元データ解析法 (2009年8月24日配本) |
3.ベイズ統計データ解析 (2010年7月23日配本) |
4.ブートストラップ入門 |
| 5.パターン認識 (2009年10月22日配本) |
6.マシンラーニング (2009年6月8日配本) |
7.地理空間データ分析 (2010年7月23日配本) |
8.ネットワーク分析 (2009年9月24日配本) |
| 9.樹木構造接近法 | 10.一般化線形モデル | 11.画像処理と解析 | 12.統計データの視覚化 |
| 13.マーケティング・モデル | 14.計量政治分析 | 15.経済データ分析 | 16.金融時系列 |
| 17.社会調査データ解析 |
| 1.カテゴリカルデータ解析 藤井良宜 著 B5,192頁,3300円 ●内容 連続なデータに対する解析方法については,さまざまな本が出版されている。しかし,カテゴリカルなデータについては,カイ2乗検定やフィッシャーの直接確率法などの基本的な解析手法について述べられているものは多いが,すこし発展的な手法については詳しく述べられているものはあまりない。この本では,ロジスティック回帰分析や対数線形モデルや樹形モデルによる解析などの発展的な方法についてもRによる解析方法を説明する。さらに,単に解析のやり方を説明するだけではなく,社会科学を中心に研究されている方や数理に弱い方でも解析手法の選択ができるように,できるだけ各手法の目的や原理のポイントを簡潔に説明し,具体的な解析例も提示するよう心がけている。 ※本書で掲載されているRのコードを以下からダウンロードできます。LZH形式とZIP形式の圧縮ファイルをご用意しましたので,ご使用環境にあわせてダウンロードしてください。 bunsekifile_final.lzh bunsekifile_final.zip まえがき (PDFファイル) ●目次 (詳細目次 PDFファイル)
|
![]() |
| ページトップへ |
| 2.多次元データ解析法 中村永友 著 B5,264頁,3500円 ●内容 本書は,多次元データ解析法に関する基礎的な考え方を解説し,同時にその理論とデータ分析の方法について述べたものである。さらに,データ解析環境であるR言語でのこれらの手法の使い方を解説している。本書の対象となる読者は,データ解析の基礎を学ぼうとするすべての方々である。 取り上げたデータ解析法は,線形回帰モデル,判別分析法,ロジスティック回帰モデル,主成分分析法,対応分析法,因子分析法,正準相関分析法,多次元尺度法,クラスター分析法である。基本的なデータの扱い方,R言語の基礎事項を確認してから本編に入っている。本書はこのシリーズの中では最も基本的な手法を扱い,これらの手法をしっかり身につけるために,丁寧な解説をしている。 ※2009年8月25日 初版1刷発行の正誤表 ●目次
|
![]() |
| ページトップへ |
| 3.ベイズ統計データ解析 (ISBN978-4-320-01923-2) 金 明哲 編 姜 興起 著 B5,248頁,3500円 ●内容 今日,複雑な構造をもつ種々の問題を考察するうえで,ベイズ的方法は非常に有効なアプローチとして認識されている。ベイズ統計解析では,とくにモデリングの技法とパラメータ推定に関する計算法の占める比重が高く,Rとの相性が非常によい。著者は,本書を通読することで,ベイズ統計学に関する理解が深まるよう配慮している。また,本書は応用の側面も重視しており,分析方法の解説および応用例と併せてRによるプログラムを提示する。具体的には,まず,ベイズモデルの基本概念,ベイズ型線形モデルの手法,ベイズ統計解析のためのモンテカルロ法,マルコフ連鎖サンプリング法,および状態空間モデルを説明する。そして,経済時系列の季節調整,時変係数ARモデルおよび時変係数VARモデルなどの状態空間モデルによる時系列解析法を解説し,Rで編成したプログラムを紹介する。さらに,応用例として,時変構造をもつ生産関数モデルの構築,ヒューマンインタフェースのパフォーマンス評価のためのベイズ型モデルなどを取り上げる。 ※本書で掲載されているプログラムと関連データを以下からダウンロードできます。LZH形式とZIP形式の圧縮ファイルをご用意しましたので,ご使用環境にあわせてダウンロードしてください。 r3.lzh r3.zip まえがき (PDFファイル) ●目次 (詳細目次 PDFファイル)
|
![]() |
| ページトップへ |
| 4.ブートストラップ入門 汪 金芳・桜井裕仁 著 B5 ●内容 本書は,ブートストラップ法に関する基礎的な理論と考え方,および,それらを現実のデータ解析に如何に応用するかをまとめた解説書である。ブートストラップ法とは,手元のデータからサンプリングを行うリサンプリング(標本再抽出)法の一種であり,複雑な数式を知らなくとも,推定量の分散をはじめとする種々の統計的誤差の推定や統計量の分布の推定などを行える,計算機指向型統計手法である。 本書では,実用上有用な母集団分布が未知の場合のブートストラップ法を中心として解説し,各種の推定量や信頼区間の構成法をはじめとして,回帰分析法,モンテカルロ検定・並べ替え検定・ブートストラップ検定などを含む仮説検定法,時系列データへの適用法,効率的リサンプリング法などを紹介する。また,紹介した方法に対応するRのサンプルコードやデータ解析例なども示されており,ブートストラップ法を理解するのに役立つであろう。 ●目次
|
![]() |
| ページトップへ |
| 5.パターン認識 (ISBN978-4-320-01925-6) 金森敬文・竹之内高志・村田 昇 著 B5,288頁,3700円 ●内容 パターン認識とは,対象の特徴量から対象が属するカテゴリを推測する方法をさす。本書では,フリーソフトウェアであるRを利用して,パターン認識のさまざまな方法を解説している。手法としては,判別分析,ロジスティック回帰,k平均法,k近傍法,階層的クラスタリングといった古典的な方法から,サポートベクターマシンやブースティングといった比較的最近の話題まで取り上げている。各章は独立に読むことができるように構成され,簡単な例題をRを用いて実際に解析しながら読み進むことにより,パターン認識の基本的な考え方を身に着けることができる。また付録としてRの基本的な操作の説明と,アルゴリズムの実装例を紹介している。 ※Rで学ぶパターン認識の本に掲載されているRのプログラムをデモ用にまとめました。 文字コードをutf-8,shift-jis,eucに変換 したものを,それぞれLZH形式とZIP形式の圧縮ファイルにしましたので,ご使用環境にあわせてダウンロードしてください。ファイルを適当なところで展開してRを起動し,source("script.r") とすれば使い方が表示されます。 demo_utf.zip demo_utf.lzh demo_sjis.zip demo_sjis.lzh demo_euc.zip demo_euc.lzh まえがき (PDFファイル) ●目次 (詳細目次 PDFファイル)
|
![]() |
| ページトップへ |
| 6.マシンラーニング (ISBN978-4-320-01926-3) 辻谷将明・竹澤邦夫 著 B5,244頁,3500円 ●内容 マシンラーニングは,データから有益な情報を発掘することを目的とした技術である。その内容は多岐に渡り,長い歴史を持つ一方,近年,長足の進歩を遂げた。それらの中で本書は,重回帰,ノンパラメトリック回帰,樹形モデル,判別分析,一般化加法モデル,ニューラルネットワーク,サポートベクターマシン,生存時間解析などを扱っている。 フリーソフトウェア「R」を活用すれば,これらの手法の実用性が増す。基本的な概念の構築から最新の手法を駆使した解析までをRプログラムを提示しながら解説している。また,それぞれの手法の統計学的な内容とRプログラムの利用法を並行して理解することができる。そのため,Rのマニュアルや出力結果を親しみにくいと感じマシンラーニングの実践を躊躇していた方々も,本書によってそうした逡巡から解放されるであろう。 ※本書で掲載されているRコマンドを以下からダウンロードできます。LZH形式とZIP形式の圧縮ファイルをご用意たしましたので,ご使用環境にあわせてダウンロードしてください。 r_program.lzh r_program.zip ※組み見本 p31 p83 p198 本シリーズの編集にあたって・まえがき (PDFファイル) ●目次 (詳細目次 PDFファイル)
|
![]() |
| ページトップへ |
| 7.地理空間データ分析 (ISBN978-4-320-01927-0) 谷村 晋 著 B5,258頁,3700円 ●内容 本書は,地理空間データに関する基礎理論と分析手法について述べた解説書である。理論的背景の解説に加えて,フリーソフトウェアのデータ解析環境Rによる事例解説により,読者が自分自身の手で実践的に理論・方法・技術を確認できるように構成されている。本書の対象は,地球統計学,計量地理学,地理空間情報学を目指す学生のみならず,位置情報が関与するさまざまな分野,環境学,疫学・公衆衛生学,犯罪科学,経済学,生態学,都市計画学,マーケティング,その他の実務家,専門家,学生を幅広く対象としている。 ※本書で掲載されているRのコードを以下からダウンロードできます。LZH形式とZIP形式の圧縮ファイルをご用意しましたので,ご使用環境にあわせてダウンロードしてください。 R-Code_2nd.lzh R-Code_2nd.zip まえがき (PDFファイル) ●目次 (詳細目次 PDFファイル)
|
![]() |
| ページトップへ |
| 8.ネットワーク分析 (ISBN978-4-320-01928-7) 鈴木 努 著 B5,192頁,3300円 ●内容 ネットワーク分析とは,さまざまな対象を点と線からなるネットワークとして表現し,その構造的な特徴を探る研究方法である。ネットワーク分析はこれまで,人間関係や集団間の関係を扱う社会学,人類学,心理学などの人文社会科学,またグラフ理論と呼ばれる数学とそれを応用した情報科学やオペレーションズ・リサーチなどの工学分野で発展してきた。近年ではそれらの領域を横断し,さらに物理学や生物学の領域をも含む「ネットワーク科学」として,学問的な関心だけでなく一般的な注目も集めるようになってきている。本書は,データ分析用のフリーソフトであるR を使って,ネットワーク分析の理論と実際の分析法を学ぶことを目的としている。 ※本書で掲載されているRコマンドを以下からダウンロードできます。LZH形式とZIP形式の圧縮ファイルをご用意たしましたので,ご使用環境にあわせてダウンロードしてください。 NetworkAnalysisSampleCodes.zip NetworkAnalysis Sample Codes.lzh ※2009年9月25日 初版1刷発行の正誤表 まえがき (PDFファイル) ●目次 (詳細目次 PDFファイル)
|
![]() |
| ページトップへ |
| 9.樹木構造接近法 下川敏雄・杉本知之・後藤昌司 著 B5 ●内容 自動交互作用検出法に端を発する樹木構造接近法は,情報技術の発展やニーズの拡大(例えば,データ・マイニングやケモメトリックス)により,急速にその版図を広げている。このような流れのなかで,分類回帰樹木法,あるいは多変量適応型回帰スプライン法などの多くの手法が提案され,その効用を発揮している。さらに,近年では,多重加法型回帰樹木法,あるいはRandomForest法といったアンサンブル学習法の研究および開発が盛んに行われている。 これらの手法は,統計解析環境Rのなかに実装されており,多くの応用例が報告されているものの,これらの手法の説明および適用方法に関する専門的な和書は出版されていない。本書では,樹木構造接近法のRにおける適用方法および応用例を中心に議論する。このとき,Rでは多くの樹木構造接近法およびアンサンブル型学習法のパッケージが提案されているため,個々の方法の違いおよび,診断方法についても触れる。また,生存時間解析における樹木構造接近法の適用方法についても説明する。 ●目次
|
![]() |
| ページトップへ |
| 10.一般化線形モデル 粕谷英一 著 B5 ●内容 一般化線形モデルは,各種の統計的方法を,回帰を拡張した統一的な枠組みのもとで扱うもので,線形重回帰,分散分析,ロジスティック回帰,対数線形モデル(分割表の分析),ポアソン回帰,ガンマ回帰などを含む。現在,さまざまな分野で広く使われ,多くの統計ソフトウェアが対応している。本書では,フリーソフトウェアであるRを利用して,一般化線形モデルの基本的な使用法を最尤法による検定や推定などを含めて解説するとともに,一般化線形モデルを実際の場面で使用する際に遭遇することの多い混合モデルやパラメトリック・ブートストラップ,擬似尤度などの手法を解説している。簡単な例題をRを用いて実際に解析しながら読んでいくことにより,尤度と最尤法の基本的な考え方を身につけることができる。また,多くの統計ソフトウェアでは対応されていない特徴を持つデータや仮説に対して,一般化線形モデルを拡張して対応する方法も解説している。 ●目次
|
![]() |
| ページトップへ |
| 11.画像処理と解析 勝木健雄・蓬来祐一郎 著 B5 ●内容 本書では,Rを使って画像処理の基礎を概説するとともに,Rの特徴をいかした実用的な画像処理の手法を紹介する。Rはシンプルで学びやすい言語体系であり,高度な画像処理が驚くほど簡潔に記述できる。このため,本書を通じて,Rのユーザだけでなく,プログラミングそのものになじみのなかった読者にも,画像処理をより身近に感じてもらえるのではないかと思う。また,並列処理による高速化や,バイナリファイルの操作,他言語との連携方法などを取り挙げ,画像処理を他のシステムで行ってきた経験者にも興味を持ってもらえるような内容を目指す。 ●目次
|
![]() |
| ページトップへ |
| 12.統計データの視覚化 山本義郎・飯塚誠也・藤野友和 著 B5 ●内容 統計解析環境Rの普及により,高度な統計解析から,身近な統計解析まで広く利用することができる,環境が手に入りやすくなった。統計解析を実施する場合には,実際のデータを観察する際および,解析結果を解釈し,提示する際に,統計グラフが有用になる場面が多い。本書では,探索データ解析のためのデータの視覚化法としてのグラフ表現から,高度な解析結果としてのグラフ表示まで,Rで実現可能な幅広い統計グラフについて解説を与える。 ●目次
|
![]() |
| ページトップへ |
| 13.マーケティング・モデル 里村卓也 著 B5 ●内容 マーケティング・モデルはマーケティング・サイエンスの中で最も多くの研究がなされている分野である。マーケティング・モデルに関する教科書は多く出版されているが,それらの多くは理論,数理モデルおよびその活用について解説するものであり,実際に数理モデルにデータを適用して分析を行う部分はカバーされていない。マーケティング・リサーチに関してExcelやSPSS,Rを用いた分析手法について解説しているものもあるが,これらの本は基本的な統計分析手法についてカバーしているのみである。マーケティング・モデルの研究を実際に行う場合,数理モデルの構築と現実の分析を行うことの間にギャップがある。マーケティング・モデルに対する研究ニーズは経済・経営の学部・大学院だけでなく,理工学部・大学院にもある。さらに実務家からも先端的分析手法を活用することに対するニーズは高い。そこで,本書はマーケティング・モデルの基礎的手法から比較新しい高度な手法まで,データ解析環境R を用いた分析についての解説を行う。なお,統計的解説は必要最低限に留め,マーケティング・モデルの研究を行う際にどのようにRを活用すればよいのかに主眼を置く。 ●目次
|
![]() |
| ページトップへ |
| 14.計量政治分析 飯田 健 著 B5 ●内容 計量政治分析に関する教科書はこれまでほとんど出版されておらず,計量政治学を学ぶ者は計量経済学の教科書で勉強するよりほかなかった。その一方で,計量政治分析に対する需要は近年,大学院生をはじめとする若手政治学者の間でますます高まりつつある。本書はそのギャップを埋めるべく,比較的初歩的な手法からレベルの高い学術誌への論文執筆にも使用できるような高度な手法まで,データ解析環境R を用いて解説を行う。 ●目次
|
![]() |
| ページトップへ |
| 15.経済データ分析 野田英雄・姜 興起・金 明哲 著 B5 ●内容 本書はRによる経済データ分析の入門書である。経済統計に関する大部分の入門書は,内閣府や日本銀行などで作成される主要経済データを網羅的に紹介したテキスト,もしくは計量経済学の初歩的解説に重点を置いたテキストのいずれかであるのが現状といえる。経済統計に関心をもつ読者の多くは,主要な経済データや統計学の基礎知識に加え,「コンピュータを活用してどのように経済データ分析を行うのか」といった定量的な経済分析のノウハウも学びたいと思われる。したがって,本書は実践的な応用面も重視している。 ●目次
|
![]() |
| ページトップへ |
| 16.金融時系列 中川 満 著 B5 ●内容 本書は金融時系列データの様々な代表的解析法を,Rを使用しながら学ぶことを目指している。目標は,それぞれのモデルの意味を理解し,応用できるようになることである。そのために必要な理論の解説もできるだけ平易に行いたい。守備範囲としては,金融実務においても活用範囲が広い,線形時系列モデル,ARCH,GARCHおよびその拡張モデル群,極値分布とそのValue at Riskへの応用,主成分分析とファクターモデル,多変量時系列モデル,多変数ヴォラティリティモデル,MCMCを考えている。 ●目次
|
![]() |
| ページトップへ |
| 17.社会調査データ解析 鄭躍軍・金 明哲 著 B5 ●内容 社会調査は,人間社会の営みに不可欠な情報を収集・分析するための重要な方法の1つである。社会調査で扱う情報としては,量的データよりも質的データが多く,独自の統計解析法が開発されている。本書は,社会調査データの主な解析方法について説明し,Rによる具体的な分析手順を解説する。この本の重要な特徴は,著者が蓄積してきた実際の社会調査データを通して,それぞれの解析の進め方及び分析結果の読み方について詳しく提示することである。 ●目次
|
![]() |
| ページトップへ |
| Copyright (C) 2010 KYORITSU SHUPPAN CO.,LTD. |