| Rで学ぶデータサイエンス
金 明哲:編集 ●刊行の趣旨 |
![]() |
| 1.カテゴリカルデータ解析 (2010年4月21日配本) |
2.多次元データ解析法 (2009年8月24日配本) |
3.ベイズ統計データ解析 (2010年7月23日配本) |
4.ブートストラップ入門 (2011年12月20日配本) |
| 5.パターン認識 (2009年10月22日配本) |
6.マシンラーニング (2009年6月8日配本) |
7.地理空間データ分析 (2010年7月23日配本) |
8.ネットワーク分析 (2009年9月24日配本) |
| 9.樹木構造接近法 | 10.一般化線形モデル | 11.デジタル画像処理 (2011年11月22日配本) |
12.統計データの視覚化 |
| 13.マーケティング・モデル (2010年12月7日配本) |
14.計量政治分析 | 15.経済データ分析 | 16.金融時系列 |
| 17.社会調査データ解析 (2011年9月20日配本) |
18.生物資源解析(仮) | 19.経営と信用リスクのデータ科学 | 20.シミュレーションで理解する回帰分析 |
| 1.カテゴリカルデータ解析 (ISBN978-4-320-01921-8) 藤井良宜 著 B5,192頁,3300円 ●内容 連続なデータに対する解析方法については,さまざまな本が出版されている。しかし,カテゴリカルなデータについては,カイ2乗検定やフィッシャーの直接確率法などの基本的な解析手法について述べられているものは多いが,すこし発展的な手法については詳しく述べられているものはあまりない。この本では,ロジスティック回帰分析や対数線形モデルや樹形モデルによる解析などの発展的な方法についてもRによる解析方法を説明する。さらに,単に解析のやり方を説明するだけではなく,社会科学を中心に研究されている方や数理に弱い方でも解析手法の選択ができるように,できるだけ各手法の目的や原理のポイントを簡潔に説明し,具体的な解析例も提示するよう心がけている。 ※本書で掲載されているRのコードを以下からダウンロードできます。LZH形式とZIP形式の圧縮ファイルをご用意しましたので,ご使用環境にあわせてダウンロードしてください。 bunsekifile_final.lzh bunsekifile_final.zip まえがき (PDFファイル) ●目次 (詳細目次 PDFファイル)
|
![]() |
| ページトップへ |
| 2.多次元データ解析法 (ISBN978-4-320-01922-5) 中村永友 著 B5,264頁,3500円 ●内容 本書は,多次元データ解析法に関する基礎的な考え方を解説し,同時にその理論とデータ分析の方法について述べたものである。さらに,データ解析環境であるR言語でのこれらの手法の使い方を解説している。本書の対象となる読者は,データ解析の基礎を学ぼうとするすべての方々である。 取り上げたデータ解析法は,線形回帰モデル,判別分析法,ロジスティック回帰モデル,主成分分析法,対応分析法,因子分析法,正準相関分析法,多次元尺度法,クラスター分析法である。基本的なデータの扱い方,R言語の基礎事項を確認してから本編に入っている。本書はこのシリーズの中では最も基本的な手法を扱い,これらの手法をしっかり身につけるために,丁寧な解説をしている。 ※2009年8月25日 初版1刷発行の正誤表 ●目次
|
![]() |
| ページトップへ |
| 3.ベイズ統計データ解析 (ISBN978-4-320-01923-2) 金 明哲 編 姜 興起 著 B5,248頁,3500円 ●内容 今日,複雑な構造をもつ種々の問題を考察するうえで,ベイズ的方法は非常に有効なアプローチとして認識されている。ベイズ統計解析では,とくにモデリングの技法とパラメータ推定に関する計算法の占める比重が高く,Rとの相性が非常によい。著者は,本書を通読することで,ベイズ統計学に関する理解が深まるよう配慮している。また,本書は応用の側面も重視しており,分析方法の解説および応用例と併せてRによるプログラムを提示する。具体的には,まず,ベイズモデルの基本概念,ベイズ型線形モデルの手法,ベイズ統計解析のためのモンテカルロ法,マルコフ連鎖サンプリング法,および状態空間モデルを説明する。そして,経済時系列の季節調整,時変係数ARモデルおよび時変係数VARモデルなどの状態空間モデルによる時系列解析法を解説し,Rで編成したプログラムを紹介する。さらに,応用例として,時変構造をもつ生産関数モデルの構築,ヒューマンインタフェースのパフォーマンス評価のためのベイズ型モデルなどを取り上げる。 ※本書で掲載されているプログラムと関連データを以下からダウンロードできます。LZH形式とZIP形式の圧縮ファイルをご用意しましたので,ご使用環境にあわせてダウンロードしてください。 r3.lzh r3.zip まえがき (PDFファイル) ●目次 (詳細目次 PDFファイル)
|
![]() |
| ページトップへ |
| 4.ブートストラップ入門 (ISBN978-4-320-11013-7) 汪 金芳・桜井裕仁 著 B5,248頁,3500円 ●内容 本書は,ブートストラップ法と呼ばれる統計的推測法の基本的な考え方と使い方を系統的に解説した本邦初の入門書である。ブートストラップ法の魅力の1つは,複雑な理論や数式に基づく解析を,コンピュータを用いた大量の反復計算に置き換えて実行できることにある。本書では,実用上有用な母集団分布が未知の場合のブートストラップ法を中心として解説し,各種の推定量についての精度の推定法や信頼区間の構成法をはじめとして,回帰分析法,モンテカルロ検定・並べ替え検定・ブートストラップ検定などを含む仮説検定法,時系列データへの適用法,効率的リサンプリング法などを紹介している。また,紹介した方法に対応するRのサンプルプログラムやデータ解析例なども示されており,統計学の初学者だけではなく,実務家や大学院生,また研究者にとってもブートストラップ法を理解するのに役立つであろう。 本書で掲載されているプログラムと関連データを以下からダウンロードできます。LZH形式とZIP形式の圧縮ファイルをご用意しましたので,ご使用環境にあわせてダウンロードしてください。 ご使用される前に,圧縮ファイルを解凍していただき,最初に必ず00readme.txtをお読み下さい。 r-bootstrap.lzh r-bootstrap.zip まえがき (PDFファイル) ●目次 (詳細目次 PDFファイル)
|
![]() |
| ページトップへ |
| 5.パターン認識 (ISBN978-4-320-01925-6) 金森敬文・竹之内高志・村田 昇 著 B5,288頁,3700円 ●内容 パターン認識とは,対象の特徴量から対象が属するカテゴリを推測する方法をさす。本書では,フリーソフトウェアであるRを利用して,パターン認識のさまざまな方法を解説している。手法としては,判別分析,ロジスティック回帰,k平均法,k近傍法,階層的クラスタリングといった古典的な方法から,サポートベクターマシンやブースティングといった比較的最近の話題まで取り上げている。各章は独立に読むことができるように構成され,簡単な例題をRを用いて実際に解析しながら読み進むことにより,パターン認識の基本的な考え方を身に着けることができる。また付録としてRの基本的な操作の説明と,アルゴリズムの実装例を紹介している。 ※Rで学ぶパターン認識の本に掲載されているRのプログラムをデモ用にまとめました。 文字コードをutf-8,shift-jis,eucに変換 したものを,それぞれLZH形式とZIP形式の圧縮ファイルにしましたので,ご使用環境にあわせてダウンロードしてください。ファイルを適当なところで展開してRを起動し,source("script.r") とすれば使い方が表示されます。 demo_utf.zip demo_utf.lzh demo_sjis.zip demo_sjis.lzh demo_euc.zip demo_euc.lzh まえがき (PDFファイル) ●目次 (詳細目次 PDFファイル)
|
![]() |
| ページトップへ |
| 6.マシンラーニング (ISBN978-4-320-01926-3) 辻谷将明・竹澤邦夫 著 B5,244頁,3500円 ●内容 マシンラーニングは,データから有益な情報を発掘することを目的とした技術である。その内容は多岐に渡り,長い歴史を持つ一方,近年,長足の進歩を遂げた。それらの中で本書は,重回帰,ノンパラメトリック回帰,樹形モデル,判別分析,一般化加法モデル,ニューラルネットワーク,サポートベクターマシン,生存時間解析などを扱っている。 フリーソフトウェア「R」を活用すれば,これらの手法の実用性が増す。基本的な概念の構築から最新の手法を駆使した解析までをRプログラムを提示しながら解説している。また,それぞれの手法の統計学的な内容とRプログラムの利用法を並行して理解することができる。そのため,Rのマニュアルや出力結果を親しみにくいと感じマシンラーニングの実践を躊躇していた方々も,本書によってそうした逡巡から解放されるであろう。 ※本書で掲載されているRコマンドを以下からダウンロードできます。LZH形式とZIP形式の圧縮ファイルをご用意たしましたので,ご使用環境にあわせてダウンロードしてください。 r_program.lzh r_program.zip ※組み見本 p31 p83 p198 本シリーズの編集にあたって・まえがき (PDFファイル) ●目次 (詳細目次 PDFファイル)
|
![]() |
| ページトップへ |
| 7.地理空間データ分析 (ISBN978-4-320-01927-0) 谷村 晋 著 B5,258頁,3700円 ●内容 本書は,地理空間データに関する基礎理論と分析手法について述べた解説書である。理論的背景の解説に加えて,フリーソフトウェアのデータ解析環境Rによる事例解説により,読者が自分自身の手で実践的に理論・方法・技術を確認できるように構成されている。本書の対象は,地球統計学,計量地理学,地理空間情報学を目指す学生のみならず,位置情報が関与するさまざまな分野,環境学,疫学・公衆衛生学,犯罪科学,経済学,生態学,都市計画学,マーケティング,その他の実務家,専門家,学生を幅広く対象としている。 ※本書で掲載されているRのコードを以下からダウンロードできます。LZH形式とZIP形式の圧縮ファイルをご用意しましたので,ご使用環境にあわせてダウンロードしてください。 R-Code_2nd.lzh R-Code_2nd.zip ※本書の正誤表 まえがき (PDFファイル) ●目次 (詳細目次 PDFファイル)
|
![]() |
| ページトップへ |
| 8.ネットワーク分析 (ISBN978-4-320-01928-7) 鈴木 努 著 B5,192頁,3300円 ●内容 ネットワーク分析とは,さまざまな対象を点と線からなるネットワークとして表現し,その構造的な特徴を探る研究方法である。ネットワーク分析はこれまで,人間関係や集団間の関係を扱う社会学,人類学,心理学などの人文社会科学,またグラフ理論と呼ばれる数学とそれを応用した情報科学やオペレーションズ・リサーチなどの工学分野で発展してきた。近年ではそれらの領域を横断し,さらに物理学や生物学の領域をも含む「ネットワーク科学」として,学問的な関心だけでなく一般的な注目も集めるようになってきている。本書は,データ分析用のフリーソフトであるR を使って,ネットワーク分析の理論と実際の分析法を学ぶことを目的としている。 ※本書で掲載されているRコマンドを以下からダウンロードできます。LZH形式とZIP形式の圧縮ファイルをご用意たしましたので,ご使用環境にあわせてダウンロードしてください。 NetworkAnalysisSampleCodes.zip NetworkAnalysis Sample Codes.lzh ※2009年9月25日 初版1刷発行の正誤表 まえがき (PDFファイル) ●目次 (詳細目次 PDFファイル)
|
![]() |
| ページトップへ |
| 9.樹木構造接近法 下川敏雄・杉本知之・後藤昌司 著 B5 ●内容 自動交互作用検出法に端を発する樹木構造接近法は,情報技術の発展やニーズの拡大(例えば,データ・マイニングやケモメトリックス)により,急速にその版図を広げている。このような流れのなかで,分類回帰樹木法,あるいは多変量適応型回帰スプライン法などの多くの手法が提案され,その効用を発揮している。さらに,近年では,多重加法型回帰樹木法,あるいはRandomForest法といったアンサンブル学習法の研究および開発が盛んに行われている。 これらの手法は,統計解析環境Rのなかに実装されており,多くの応用例が報告されているものの,これらの手法の説明および適用方法に関する専門的な和書は出版されていない。本書では,樹木構造接近法のRにおける適用方法および応用例を中心に議論する。このとき,Rでは多くの樹木構造接近法およびアンサンブル型学習法のパッケージが提案されているため,個々の方法の違いおよび,診断方法についても触れる。また,生存時間解析における樹木構造接近法の適用方法についても説明する。 ●目次
|
![]() |
| ページトップへ |
| 10.一般化線形モデル 粕谷英一 著 B5 ●内容 一般化線形モデルは,各種の統計的方法を,回帰を拡張した統一的な枠組みのもとで扱うもので,線形重回帰,分散分析,ロジスティック回帰,対数線形モデル(分割表の分析),ポアソン回帰,ガンマ回帰などを含む。現在,さまざまな分野で広く使われ,多くの統計ソフトウェアが対応している。本書では,フリーソフトウェアであるRを利用して,一般化線形モデルの基本的な使用法を最尤法による検定や推定などを含めて解説するとともに,一般化線形モデルを実際の場面で使用する際に遭遇することの多い混合モデルやパラメトリック・ブートストラップ,擬似尤度などの手法を解説している。簡単な例題をRを用いて実際に解析しながら読んでいくことにより,尤度と最尤法の基本的な考え方を身につけることができる。また,多くの統計ソフトウェアでは対応されていない特徴を持つデータや仮説に対して,一般化線形モデルを拡張して対応する方法も解説している。 ●目次
|
![]() |
| ページトップへ |
| 11.デジタル画像処理 (ISBN978-4-320-01978-2) 勝木健雄・蓬来祐一郎 著 B5,258頁,3700円 ●内容 本書では,Rを使って画像処理の基礎を概説するとともに,Rの特徴をいかした実用的な画像処理の手法を紹介する。Rはシンプルで学びやすい言語体系であり,高度な画像処理が驚くほど簡潔に記述できる。このため,本書を通じて,Rのユーザーだけでなく,プログラミングそのものになじみのなかった読者にも画像処理をより身近に感じてもらえるのではないかと思う。また,並列処理による高速化や他言語との連携方法などを取り挙げ,画像処理を他のシステムで行ってきた経験者にも興味を持ってもらえるような内容を目指した。 ※本書に掲載されているRコマンドとサンプル画像を以下のサイトからRのパッケージとして配布しています。ご使用環境にあわせてダウンロードしてください。 https://code.google.com/p/rimagebook/ まえがき (PDFファイル) ●目次 (詳細目次 PDFファイル)
|
![]() |
| ページトップへ |
| 12.統計データの視覚化 山本義郎・飯塚誠也・藤野友和 著 B5 ●内容 統計解析環境Rの普及により,高度な統計解析から,身近な統計解析まで広く利用することができる,環境が手に入りやすくなった。統計解析を実施する場合には,実際のデータを観察する際および,解析結果を解釈し,提示する際に,統計グラフが有用になる場面が多い。本書では,探索データ解析のためのデータの視覚化法としてのグラフ表現から,高度な解析結果としてのグラフ表示まで,Rで実現可能な幅広い統計グラフについて解説を与える。 ●目次
|
![]() |
| ページトップへ |
| 13.マーケティング・モデル (ISBN978-4-320-01929-4) 里村卓也 著 B5,180頁,3300円 ●内容 市場や消費者を分析し,マーケティング意思決定に役立てるマーケティング・モデルをRを用いて利用・開発するための解説書。マーケティング・モデルのコンセプトから利用方法,モデル構築とRを用いたデータ分析の方法までを解説。マーケティング・モデルの基礎的手法から新しい手法まで,データ解析環境Rを用いた分析について扱う。 ※本書で掲載されているRのコードを以下からダウンロードできます。LZH形式とZIP形式の圧縮ファイルをご用意しましたので,ご使用環境にあわせてダウンロードしてください。 MarketingModels.lzh MarketingModels.zip まえがき (PDFファイル) ●目次 (詳細目次 PDFファイル)
|
![]() |
| ページトップへ |
| 14.計量政治分析 飯田 健 著 B5 ●内容 計量政治分析に関する教科書はこれまでほとんど出版されておらず,計量政治学を学ぶ者は計量経済学の教科書で勉強するよりほかなかった。その一方で,計量政治分析に対する需要は近年,大学院生をはじめとする若手政治学者の間でますます高まりつつある。本書はそのギャップを埋めるべく,比較的初歩的な手法からレベルの高い学術誌への論文執筆にも使用できるような高度な手法まで,データ解析環境R を用いて解説を行う。 ●目次
|
![]() |
| ページトップへ |
| 15.経済データ分析 野田英雄・姜 興起・金 明哲 著 B5 ●内容 本書はRによる経済データ分析の入門書である。経済統計に関する大部分の入門書は,内閣府や日本銀行などで作成される主要経済データを網羅的に紹介したテキスト,もしくは計量経済学の初歩的解説に重点を置いたテキストのいずれかであるのが現状といえる。経済統計に関心をもつ読者の多くは,主要な経済データや統計学の基礎知識に加え,「コンピュータを活用してどのように経済データ分析を行うのか」といった定量的な経済分析のノウハウも学びたいと思われる。したがって,本書は実践的な応用面も重視している。 ●目次
|
![]() |
| ページトップへ |
| 16.金融時系列 中川 満 著 B5 ●内容 本書は金融時系列データの様々な代表的解析法を,Rを使用しながら学ぶことを目指している。目標は,それぞれのモデルの意味を理解し,応用できるようになることである。そのために必要な理論の解説もできるだけ平易に行いたい。守備範囲としては,金融実務においても活用範囲が広い,線形時系列モデル,ARCH,GARCHおよびその拡張モデル群,極値分布とそのValue at Riskへの応用,主成分分析とファクターモデル,多変量時系列モデル,多変数ヴォラティリティモデル,MCMCを考えている。 ●目次
|
![]() |
| ページトップへ |
| 17.社会調査データ解析 (ISBN978-4-320-01969-0) 鄭 躍軍・金 明哲 著 B5,288頁,3700円 ●内容 本書は,社会調査データによく用いられる解析方法に焦点を絞り,諸方法の概要を説明したうえで,Rによる具体的な分析手順および出力結果を解説する。本書の最大の狙いは,社会調査・数理心理実験の実務者・現役大学生を対象に,「データを中心に物語る」という視点から,社会調査の基本的な考え方と実践的なデータ解析方法を示すことにある。 ※本書で掲載されているプログラムと関連データを以下からダウンロードできます。LZH形式とZIP形式の圧縮ファイルをご用意しましたので,ご使用環境にあわせてダウンロードしてください。 r17.lzh r17.zip ※本書の正誤表 まえがき (PDFファイル) ●目次 (詳細目次 PDFファイル)
|
![]() |
| ページトップへ |
| 18.生物資源解析(仮) 北門利英 著 B5 ●内容 本書では,生物資源を対象としたデータ解析において利用される統計的手法および統計的モデリング法を解説する。基礎編にて統計的推測の基礎概念について述べ,それを基に生物学的パラメータの推測や遺伝データの解析など生物資源解析の様々な事例へと展開する。近年,生物資源を対象とした研究においてもRを利用した統計解析が利用される機会が多くなってきたが,読者が理論的裏付けを基に,Rパッケージの利用およびRによるプログラミングを通した実践的な解析が可能となるよう解説する。 ●目次 基礎編
応用編
|
![]() |
| ページトップへ |
| 19.経営と信用リスクのデータ科学 董 彦文 著 B5 ●内容 本書は,企業の実務者および経営・経済分野の大学生・大学院生を対象として,次のことを特徴として経営分析における統計解析と人工知能手法の活用を体系的に学習する教科書を提供する。 (1)数多くの統計解析手法の中から,Excel上では簡単に利用できない,かつ実用性の高いものを選んで,経営分野の実例を用いながらわかりやすく解説する。 (2)SPSSなどの高価なパッケージではなく, Rというフリーツールを活用し,経営分析分野における統計解析と人工知能手法の活用を学習する。 (3)信用リスク評価に関しては,学者・研究者が重点的に研究している確率モデルではなく,一般企業において実用できる信用格付けモデルに重点を置き,信用リスク評価の手法を体系的に解説する。 (4)金融機関以外の一般企業における利用可能性を考慮し,財務データに基づいた従来の手法だけでなく,企業内部の日常取引データを活用し,取引先企業の信用評価を行う手法および信用リスク評価システムの構築方法も説明する。 (5)統計解析と人工知能手法だけでなく,これらの手法の利用に際して,ビジネス上の必要性,また解析結果の解釈を実務者の視点から説明する。これにより他の統計・人工知能関連図書と差別をつける。 ●目次
|
![]() |
| ページトップへ |
| 20.シミュレーションで理解する回帰分析 竹澤邦夫 著 B5 ●内容 従来の統計学の学習法は,最低限度の数式を用いて推定量や統計量の数々に関する概略を把握した後,パソコン上の統計ソフトウエアを用いて実際のデータを解析することによって実務的な技術を身につけると同時に統計学の概念に対する理解を深める,というものが主流であった。しかし,統計学で用いられる数式に,乱数を用いて作成したシミュレーション・データを代入して結果を観察すれば,性質が分かっているデータが与える統計量の振る舞いを知ることができる。これによって統計学で用いられる数式の意味と性質を直感的に把握できるため,統計学における概念に容易に親しむことができる。 そこで,本書は,Rプログラムを用いて統計学の基礎的な概念に関するシミュレーションを行うことによって,統計学の基礎的な概念を理解することを目指す。例えば,ある性質を持つ母集団から特定の数のサンプルを抽出した場合,5パーセントの確率である条件を満たす,ということが解析的に明らかになっている場合,その母集団からサンプルを取り出す作業を1000回行うシミュレーションを実行し,1000回の内,50回に近い回数だけ,ある条件が満たされることを確認する。こうしたシミュレーションを手元のパソコンで実行することによって,当該の概念を鮮明に把握し,自信を持ってそれを利用することができるようになり,更には,その概念の利用範囲にまで思い至ることが可能になる。こうしたシミュレーションは解析的な理論や証明に替わるものではないけれども,数式の意味を抽象的に理解するだけではなく,その実用上の意義を習得する上で大きな役割を果たす。 ●目次
|
![]() |
| ページトップへ |
| Copyright (C) 2011 KYORITSU SHUPPAN CO.,LTD. |