情報検索の基礎

書籍情報
ISBN978-4-320-12322-9
判型B5 
ページ数496ページ
発行年月2012年06月
本体価格8,000円
情報検索の基礎 書影
情報検索の基礎

あなたが普段使っている検索エンジン,
その真髄は本書の中にある!


 近年の情報爆発にともなって,膨大な情報から必要な情報を探し出す検索技術が,ますます重要になり,また大きく変化,発展してきた。本書は,従来の古典的な情報検索から,最近のウェブの情報検索までの基礎をわかりやすく扱った,網羅的で最先端の入門書である。最初に,文書の前処理,インデックス付け,逆インデックス,重み付け,スコア付け,検索システムの評価といった,情報検索の基礎,特にサーチエンジンに関わる話題をとりあげる。次に,より先進的な話題として,適合フィードバックやクエリー拡張を用いた検索の強化手法,構造化された文書からの情報検索,文書のスコア付けにおける確率論の応用といった話題をとりあげる。その後に,カテゴリー集合への分類問題,クラスタリングの問題といった,様々な形の機械学習と数値手法を取り扱う。最後に,ウェブサーチの問題を扱う。情報検索に関わる,マーケティングから情報管理,コンピュータや言語情報に関連した理学系,工学系,経営系の学生・研究者・技術者にとって有用な1冊となるだろう。
[原著名:Introduction to Information Retrieval]

目次

1 論理検索
1.1 情報検索問題の例
1.2 逆インデックス構築の最初の試み
1.3 論理クエリーの処理
1.4 拡張された論理モデル対ランク付けされた検索
1.5 引用文献と参考図書

2 用語語彙とポスティングリスト
2.1 文書輪郭と文字列解読
2.2 用語の語彙を決定する
2.3 スキップポインターによる高速なポスティングリストの共通集合操作
2.4 位置ポスティングとフレーズクエリー
2.5 引用文献と参考図書

3 辞書と融通のきく検索
3.1 辞書検索の構成
3.2 ワイルドカードクエリー
3.3 スペル修正
3.4 音声上の修正
3.5 引用文献と参考図書

4 インデックスの構築
4.1 ハードウェア概説
4.2 ブロックソートインデックス
4.3 シングルパスインメモリーインデックス
4.4 分散インデックス
4.5 動的インデックス
4.6 他のタイプのインデックスについて
4.7 引用文献と参考図書

5 インデックスの圧縮
5.1 検索システムにおける用語の統計的性格
5.2 辞書の圧縮
5.3 ポスティングファイルの圧縮
5.4 引用文献と参考図書

6 スコア付け,用語重み付け,ベクトル空間モデル
6.1 パラメーターおよびゾーンインデックス
6.2 用語頻度と重み付け
6.3 スコア付けのベクトル空間モデル
6.4 改良型tf-idf関数
6.5 引用文献と参考図書

7 検索システム全体のスコア計算
7.1 効果的なスコア付けとランキング
7.2 情報検索システムのコンポーネント
7.3 ベクトル空間スコア付けとクエリー演算子の相互作用
7.4 引用文献と参考図書

8 情報検索の評価
8.1 情報検索システムの評価
8.2 一般的に使われているテストコレクション
8.3 ランクなし検索集合の評価
8.4 ランク付き検索結果の評価
8.5 関連性の評価
8.6 さらに広い観点から:システムの質とユーザーの実用性
8.7 検索結果のスニペット
8.8 引用文献と参考図書

9 適合フィードバックとクエリー拡張
9.1 適合フィードバックと疑似適合フィードバック
9.2 クエリー改良のためのグローバルな手法
9.3 引用文献と参考図書

10 XML検索
10.1 基本的なXML概念
10.2 XML検索の課題
10.3 XML検索のベクトル空間モデル
10.4 XML検索の評価
10.5 テキスト中心のXML検索対データ中心のXML検索
10.6 引用文献と参考図書

11 確率的情報検索
11.1 基本的な確率論の復習
11.2 確率ランキング原理
11.3 バイナリー独立モデル
11.4 評価といくらかの拡張
11.5 引用文献と参考図書

12 情報検索のための言語モデル
12.1 言語モデル
12.2 クエリー尤度モデル
12.3 情報検索における言語モデル手法と他の手法との対比
12.4 拡張言語モデル手法
12.5 引用文献と参考図書

13 テキストの分類とナイーブベイズ
13.1 テキスト分類問題
13.2 ナイーブベイズテキスト分類
13.3 ベルヌーイモデル
13.4 ナイーブベイズの性質
13.5 特徴選択
13.6 テキスト分類の評価
13.7 引用文献と参考図書

14 ベクトル空間分類
14.1 文書の表現とベクトル空間での関係性の指標
14.2 ロッキオ分類
14.3 k最近傍法
14.4 線形分類器対非線形分類器
14.5 クラス数が2より多い分類
14.6 バイアス-バリアンス・トレードオフ
14.7 引用文献と参考図書

15 サポートベクターマシンと文書の機械学習
15.1 サポートベクターマシン―線形分離可能な場合
15.2 サポートベクターモデルへの拡張
15.3 テキスト文書の分類における問題
15.4 アドホック情報検索での機械学習手法
15.5 引用文献と参考図書

16 フラットクラスタリング
16.1 情報検索でのクラスタリング
16.2 問題設定
16.3 クラスタリングの評価
16.4 K平均法
16.5 モデルに基づいたクラスタリング
16.6 引用文献と参考図書

17 階層的クラスタリング
17.1 階層的凝集クラスタリング
17.2 単一リンククラスタリングと完全リンククラスタリング
17.3 グループ平均凝集クラスタリング
17.4 重心クラスタリング
17.5 階層的凝集クラスタリングの最適性
17.6 分割可能クラスタリング
17.7 クラスターラベル付け
17.8 実装上の注意
17.9 引用文献と参考図書

18 行列の分解と潜在意味インデックス
18.1 線形代数の復習
18.2 用語文書行列と特異値分解
18.3 低階数近似
18.4 潜在意味インデックス
18.5 引用文献と参考図書

19 ウェブ検索の基礎
19.1 背景と歴史
19.2 ウェブの特徴
19.3 経済モデルとしての宣伝
19.4 検索のユーザーエクスペリエンス
19.5 インデックスのサイズと推定
19.6 ほぼ複製とシングリング
19.7 引用文献と参考図書

20 ウェブのクローリングとインデックス付け
20.1 概説
20.2 クローリング
20.3 インデックスを分散化する
20.4 接続サーバー
20.5 引用文献と参考図書

21 リンク解析
21.1 グラフとしてのウェブの世界
21.2 PageRank
21.3 ハブと権威者
21.4 引用文献と参考図書