データマイニングと集合知―基礎からWeb,ソーシャルメディアまで― 

書籍情報
シリーズ名未来へつなぐ デジタルシリーズ 【11】巻
ISBN978-4-320-12311-3
判型B5 
ページ数254ページ
発行年月2012年07月
本体価格2,800円
データマイニングと集合知 書影
データマイニングと集合知

データマイニングは一言でいえば,応用が対象とする大量のデータの中から,頻出するパタンや意味のある構造を発見することである。伝統的には,バスケット分析や,顧客の分類,クラスタリングを基にしたマーケティング,クレジットの不正利用の発見などに応用されている。また新しいところでは,WebページやXMLドキュメントの分類やクラスタリング,検索,センサネットワークを用いた人間の行動予測や快適性を考慮した省エネルギー化への貢献,地理情報への応用,生物情報学への応用など,データマイニングの応用分野は拡大し続けている。
本書はデータマイニングの基本概念や基本タスクとそのためのアルゴリズムをわかりやすく説明する。また,大規模化した現代のデータ(いわゆる“ビッグデータ”)の特徴である3つのV(大きさ,多様性,速度)を意識して,発展的な手法も合わせて説明する。さらには最近注目されている集合知を,ソーシャルメディアに対するマイニングという観点から説明することを試みる。学生,若い技術者や研究者をはじめとして,現代的なデータマイニングに関心のある方に幅広く受け入れられるだろう。

目次

第1章 データマイニングの基本概念
1.1 データマイニングとは
1.2 関連技術と問題意識
1.3 データマイニングのタスク
1.4 基本的なデータ構造
1.5 データの質
1.6 データマイニングの応用分野
1.7 データマイニングシステム
1.8 本書の構成

第2章 相関ルールのマイニング~基本編
2.1 応用
2.2 基本概念
2.3 相関ルールの種類
2.4 アプリオリアルゴリズムの概要
2.5 相関ルールの生成

第3章 相関ルールのマイニング~発展編
3.1 アプリオリアルゴリズムの効率化
3.2 相関ルールの拡張
3.3 相関ルールから相関分析へ
3.4 スケーラビリティへの対策
3.5 系列パタンのマイニング

第4章 クラスタリング~基本編
4.1 応用
4.2 データ構造
4.3 距離
4.4 クラスタリングとアルゴリズム
4.5 パーティショニングに基づくクラスタリング
4.6 階層的クラスタリング
4.7 クラスタリング結果の評価

第5章 クラスタリング~展開編と外れ値検出
5.1 クラスタリングの展開
5.2 外れ値検出

第6章 分類~基本編
6.1 基本概念
6.2 決定木
6.3 情報量基準

第7章 分類~発展
7.1 スケーラビリティ
7.2 その他の分類手法
7.3 k-最近傍法

第8章 アンサンブル学習
8.1 分類器の評価方法
8.2 代表的なアンサンブル学習

第9章 Webの構造マイニング
9.1 Webマイニング
9.2 構造マイニング

第10章 Webの内容マイニング
10.1 検索エンジン
10.2 情報検索技術
10.3 ページの分類
10.4 ページのクラスタリング
10.5 ページの要約

第11章 Webの履歴マイニングと情報抽出,深層Webのマイニング
11.1 Webの履歴マイニング
11.2 情報抽出
11.3 深層Webのマイニング

第12章 メディアマイニング
12.1 XML,木構造,グラフのマイニング
12.2 マルチメディアマイニング
12.3 ストリームマイニング

第13章 可視化
13.1 基本概念
13.2 可視化理論
13.3 可視化の応用

第14章 集合知
14.1 動機
14.2 インタラクションの多様性を集約
14.3 ソーシャルタギング
14.4 クラウド・ソーシングの検索サービスへの適用
14.5 ウィキペディア
14.6 ソーシャルメディアのマイニング