データ分析プロセス

データ分析プロセス
著者 金 明哲 編福島 真太朗 著
分野 数学  > データサイエンス
シリーズ 数学  > シリーズ Useful R 全10巻 2
発売日 2015/06/26
ISBN 9784320123656
体裁 B5・232頁
定価 3,960円 (本体3,600円 + 税10%)
  • この本の
    内容
  • 目次
  • 関連情報
通常、データ分析というと、多変量解析、機械学習、時系列解析などの手法が取り上げられることが多い。しかし、実際のデータ分析では、適切なビジネス目標に基づいて分析計画を立案したうえでデータを収集・蓄積し、データ加工やデータ変換などの前処理を実行した後に分析手法を適切に適用し、得られた知見の活用方法について検討する必要がある。本書では、このようなデータ分析プロセスを実現できるようになることを目指して、収集・蓄積したデータに前処理を行い、データから相関やパターンなどの知見を抽出するための基本的な考え方や処理について、Rの実装方法を交えて説明する。
第1章 データ分析のプロセス
1.1 データ分析で直面する課題の例
1.2 データ分析のプロセス
1.3 CRISP-DM
1.4 KDDプロセス
1.5 本書の目的と構成

第2章 基本的なデータ操作
2.1 データの入出力
2.2 データフレームのハンドリング
2.3 データテーブルのハンドリング

第3章 前処理・変換
3.1 データの記述・要約
3.2 欠損値への対応
3.3 外れ値の検出と対応
3.4 連続データの離散化
3.5 属性選択
3.6 次元削減

第4章 パターンの発見
4.1 予測モデルの構築
4.2 頻出パターンの発見

第5章 データ分析の例
5.1 分析計画の立案
5.2 データの理解
5.3 データの加工
5.4 予測モデルの構築

付録A 主な予測アルゴリズムの概要
A.1 決定木
A.2 ランダムフォレスト
A.3 サポートベクタマシン

付録B caretパッケージで利用できるアルゴリズム

付録C ELKIの使用方法

参考文献

索  引
本書掲載のプログラムおよびダウンロードして利用するデータ

本書で紹介したプログラムおよびダウンロードして利用するデータです。ZIP形式の圧縮ファイルをご用意しましたので,解凍後ご使用ください。

補足資料

ZIP形式の圧縮ファイルをご用意しましたので,解凍後ご使用ください。

Shopping
ご注文

3,960円
(本体3,600円 + 税10%)

ネット書店で購入

  • Amazon
  • 紀伊國屋書店ウェブストア
  • 楽天ブックス
  • honto
  • HMV&BOOKS online
  • ヨドバシ.com
  • Honya Club.com
  • TSUTAYA オンラインショッピング
  • e-hon 全国書店ネットワーク
  • セブンネットショッピング
  • bookfanプレミアム