アクセスランキング

01位
Rプログラミング本格入門―達人データサイエンティストへの道― 
02位
統計的自然言語処理の基礎
03位
カメムシの母が子に伝える共生細菌―必須相利共生の多様性と進化― 
04位
速習 強化学習―基礎理論とアルゴリズム― 
05位
グラフ理論とフレームワークの幾何
  • ニュースメール
  • アフターサービス
  • 教科書献本のご案内
  • facebook
  • 構造計画研究所

統計的自然言語処理の基礎

書籍情報
ISBN978-4-320-12421-9
判型B5 
ページ数640ページ
発売予定2017年11月28日
本体価格11,000円
統計的自然言語処理の基礎 書影
統計的自然言語処理の基礎

新刊

 統計的自然言語処理を徹底的に論じた教科書
 原著が刊行されたのは18年ほど前になるので,本書の内容の一部は歴史的な記録となっており,現在の状況に照らして異なる含意を読み取るべき言及もある。そのような若干の注意書きを要するとはいえ,本書の重要性,今日性は高い。
 学問的基礎の記述の豊かさに加えて,マルコフモデルや確率文脈自由文法など,統計的自然言語処理の基盤となる概念について,丁寧な式の導出を含めたわかりやすい説明がなされている。そのような理論的基盤と合わせて,n-グラムモデルにおけるスムージングや分類学習における過学習など,実際に研究を進める上では重要でありながら,えてして短めの注意書きになりがちな部分についても,十分な量が割かれている。
 「今」の自然言語処理研究をその基礎から正しく理解し,その上に新たな積み上げを行うための基盤を提供してくれる良書となっている。
[原著名:Foundations of Statistical Natural Language Processing]

目次

I編 前提知識

1章 導  入
1.1 言語に対する合理主義的方法論と経験主義的方法論
1.2 科学的意義
1.3 言語の曖昧性:なせ自然言語処理は困難なのか
1.4 汚れ仕事
1.5 さらに学ぶために
1.6 練習問題

2章 数学的基礎
2.1 確率論の基礎
2.2 情報理論の要点
2.3 さらに学ぶために

3章 言語学の要点
3.1 品詞と形態論
3.2 句構造
3.3 意味論と語用論
3.4 その他の分野
3.5 さらに学ぶために
3.6 練習問題

4章 コーパスに基づく研究
4.1 準備
4.2 テキストの観察
4.3 データのマークアップ
4.5 練習問題


II編 語

5章 連  語
5.1 頻度
5.2 平均と分散
5.3 仮説検定
5.4 相互情報量
5.5 連語とは何か
5.6 さらに学ぶために

6章 統計的推論:スパースなデータ上のn-グラムモデル
6.1 ビン:同値類の形成
6.2 統計的推定
6.3 推定値を組み合わせる
6.4 結論
6.5 さらに学ぶために
6.6 練習問題

7章 語義の曖昧性解消
7.1 方法論に関する準備
7.2 教師あり曖昧性解消
7.3 辞書に基づく曖昧性解消
7.4 教師なし曖昧性解消
7.5 単語の意味とは何か?
7.6 さらに学ぶために
7.7 練習問題

8章 語彙獲得
8.1 評価指標
8.2 動詞の下位範疇化
8.3 付加の曖昧性
8.4 選択選好
8.5 意味的類似性
8.6 統計的自然言語処理における語彙獲得の役割
8.7 さらに学ぶために


III編 文  法

9章 マルコフモデル
9.1 マルコフモデル
9.2 隠れマルコフモデル
9.3 HMMについての三つの基本的な問題
9.4 HMM:実装,性質,変種
9.5 さらに学ぶために

10章 品詞のタグ付け
10.1 タグ付けのための情報源
10.2 マルコフモデルによるタグ付け器
10.3 隠れマルコフモデルによるタグ付け器
10.4 変換に基づくタグの学習
10.5 別の方法,英語以外の言語
10.6 タグ付けの正解率とタグ付け器の適用先
10.7 さらに学ぶために
10.8 練習問題

11章 確率文脈自由文法
11.1 PCFGのいくつかの特徴
11.2 PCFGの三つの基本的な問題
11.3 系列の確率
11.4 内側外側アルゴリズムの問題点
11.5 さらに学ぶために
11.6 練習問題

12章 確率的構文解析
12.1 いくつかの概念
12.2 いくつかのアプローチ
12.3 さらに学ぶために
12.4 練習問題


IV編 応用と技法

13章 統計的アライメントと機械翻訳
13.1 テキストアライメント
13.2 語のアライメント
13.3 統計的機械翻訳
13.4 さらに学ぶために

14章 クラスタリング
14.1 階層的クラスタリング
14.2 非階層的クラスタリング
14.2.1 K平均法
14.2.2 EMアルゴリズム
14.3 さらに学ぶために
14.4 練習問題

15章 情報検索におけるいくつかの話題
15.1 情報検索に関する背景知識
15.2 ベクトル空間モデル
15.3 タームの分布のモデル
15.4 潜在意味インデキシング
15.5 談話分割
15.6 さらに学ぶために
15.7 練習問題

16章 テキスト分類
16.1 決定木
16.2 最大エントロピーモデル
16.3 パーセプトロン
16.4 k最近傍分類
16.5 さらに学ぶために

簡易統計表

参考文献

訳者あとがき

索  引