• 教科書献本のご案内
  • ニュースメール
  • アフターサービス
  • facebook
  • 構造計画研究所

犯罪捜査のためのテキストマイニング―文章の指紋を探り,サイバー犯罪に挑む計量的文体分析の手法― 

書籍情報
ISBN978-4-320-12442-4
判型A5 
ページ数240ページ
発売日2019年01月11日
本体価格3,200円
犯罪捜査のためのテキストマイニング 書影
犯罪捜査のためのテキストマイニング

新刊

本邦初,犯罪捜査のためのテキストマイニング技術を解説。近年,サイバー空間を舞台とした犯罪が増加傾向にある。電子掲示板への書き込みや電子メールの送信による脅迫,名誉毀損,業務妨害などの犯罪は,いつでもどこでも誰にでも容易に実行できてしまうとともに,証拠が残りにくく,また他人への「なりすまし」も容易である。このようなサイバー犯罪は,犯人の特定をはじめとして,その犯人性の立証が比較的困難といった特徴を有する。本書は,文章情報に基づき,書き手を特定する「著者識別」あるいは書き手の特徴(性別や年齢層など)を推定する「著者プロファイリング」といったサイバー犯罪に挑む分析手法を解説。

目次

第1章 近年の犯罪と計量的文体分析への期待
1.1 サイバー犯罪の出現と犯罪捜査
1.2 「パソコン遠隔操作事件」解決に向けた新たなツール
  1.2.1 事件の概要と流れ
  1.2.2 犯人性立証の可能性と誤認逮捕の防止
1.3 印字文書の分析例
1.4 遺体無き殺人,電子メールを用いた被害者なりすまし
1.5 遺書の分析

第2章 文体分析に関連する学問分野
2.1 法言語学
  2.1.1 法言語学とは
2.2 計量国語学と計量言語学,ならびにコーパス言語学
2.3 計量文献学
  2.3.1 計量文献学とは
  2.3.2 諸外国における研究史
  2.3.3 日本における研究史
2.4 計量文体学
2.5 社会言語学
  2.5.1 社会言語学とは
  2.5.2 性別と言語に関する研究
  2.5.3 年齢と言語に関する研究

第3章 テキストマイニング概要
3.1 テキストマイニングとは
  3.1.1 データサイエンスとテキストマイニング
  3.1.2 テキストマイニングの応用研究
  3.1.3 テキストマイニングの分析の流れ
3.2 テキストの加工作業とソフトウェア
  3.2.1 形態素解析
  3.2.2 構文解析
  3.2.3 テキストマイニングのためのソフトウェア
3.3 文体的特徴
  3.3.1 文字単位
  3.3.2 形態素単位
  3.3.3 構文単位
  3.3.4 文体的特徴における経年変化
3.4 多変量データ解析
  3.4.1 主成分分析
  3.4.2 対応分析
  3.4.3 多次元尺度法
  3.4.4 階層的クラスター分析
  3.4.5 データセットのテキストと変数の数
  3.4.6 多変量データ解析を用いた日本語研究の変遷
3.5 機械学習
  3.5.1 サポートベクターマシン
  3.5.2 決定木
  3.5.3 ランダムフォレスト
  3.5.4 ナイーブベイズ
  3.5.5 その他の機械学習(ニューラルネットワーク,k最近傍法)
3.6 推定成績や識別力に関する評価方法や指標
  3.6.1 交差検証法
  3.6.2 分類器の性能評価(正解率,再現率,適合率,F値) 
  3.6.3 感度と特異度,ROC分析に基づくAUC 
  3.6.4 効果量
  3.6.5 ランダムフォレストによる評価指標

第4章 法科学における文体分析の概要
4.1 諸外国における事例紹介
  4.1.1 米国の爆弾魔ユナボマーの犯行声明文
  4.1.2 米国の「パトリシア・ハースト誘拐事件」
  4.1.3 英国における遺体無き殺人事件
4.2 日本における事例:保険金詐取目的の殺人事件
4.3 計量的文体分析の種別
  4.3.1 著者照合
  4.3.2 著者同定
  4.3.3 著者プロファイリング

第5章 著者識別(著者照合,著者同定) 
5.1 従来の筆跡鑑定
  5.1.1 筆跡鑑定とは
  5.1.2 個人差と個人内恒常性
  5.1.3 作為筆跡(模倣と韜晦) 
5.2 機械学習による著者識別
  5.2.1 機械学習を用いた著者識別研究
  5.2.2 機械学習による方法の問題点
5.3 多変量データ解析による著者識別
  5.3.1 多変量データ解析による著者識別研究
  5.3.2 「パソコン遠隔操作事件」の犯人性立証への計量的文体分析の試み(調査研究1) 
  5.3.3 実際の事件で用いられた文章に関する著者識別の検討(調査研究2) 
  5.3.4 多変量データ解析の著者識別に関する考察ならびに問題点とその方策
  5.3.5 分析結果に対するスコアリングルールの導入
  5.3.6 スコアリングルールの検証(その1)およびテキスト数や文字数の影響(調査研究3)
  5.3.7 スコアリングルールの検証(その2)(調査研究4)
  5.3.8 著者識別手法の標準化と正確性の検証(調査研究5)
5.4 尤度比による著者識別.
5.5 作為的に自己の文章表現を変えた文章の分析
  5.5.1 模倣文章:「グリコ・森永事件」を模倣した「黒子のバスケ脅迫事件」の文章の判別(調査研究6)
  5.5.2 韜晦文章:自己の文章表現を隠蔽した文章

第6章 著者プロファイリング
6.1 犯罪者プロファイリングとは
6.2 著者プロファイリング研究概要
  6.2.1 性別推定研究
  6.2.2 年齢層推定研究
  6.2.3 その他の著者特徴の推定研究
6.3 性別の推定
  6.3.1 機械学習による性別推定の試み(調査研究7)
  6.3.2 性別を偽装した文章の文体的特徴の変化(調査研究8)
6.4 年齢層の推定
  6.4.1 機械学習による年齢層推定の試み(調査研究9)

第7章 テキストマイニングを応用した犯行動機の分析
7.1 犯罪者プロファイリングにおける動機の分析
7.2 殺人事件
  7.2.1 殺人事件の動機研究
  7.2.2 殺人事件の動機分類(調査研究10)
7.3 放火事件
  7.3.1 放火事件の動機研究
  7.3.2 単一放火の動機分類(調査研究11) 
  7.3.3 連続放火の動機分類(調査研究12) 
  7.3.4 総合考察

第8章 今後を見据えて
8.1 日本の法科学における新たな分析手法としての確立に向けて
8.2 科学鑑定としての評価基準
8.3 鑑定結論に至る根拠ならびに鑑定結論の表現方法
  8.3.1 鑑定結論に至る根拠
  8.3.2 鑑定結論の表現方法
8.4 今後の実務上ならびに研究における課題