Windows PC による日本語研究法―Perl,CLTOOLによるテキストデータ処理―(CD-ROM付き) 

書籍情報
ISBN978-4-320-12086-0
判型B5 
ページ数168ページ
発行年月2003年11月
本体価格2,800円
Windows PC による日本語研究法 書影
Windows PC による日本語研究法

日本語研究の分野においてもデータ処理の容易さと効率性から,PCとソフトウェアの活用は必要不可欠になっている。しかしこれまでGUIベースの使いやすいソフトウェアが存在しなかった。
著者は,日本語分析のための道具―語彙と文字の研究だけではなく,より大きな文字列単位の研究(単文・複文・連文研究)にも役立つソフトウェア―としてCLTOOLを開発し,公開した。
本書では,CLTOOLを活用した実践的日本語研究法を詳しく紹介するとともに,Excelなど他のアプリケーションとの連携や,Pealプログラミングなど,日本語研究の実践において有用と思われるコンピュータリテラシーについても平易に解説した。

目次

第1章 文字処理の基本の考え方
1.1 文章と形状
1.1.1 文章の構成単位と階層構造
1.1.2 区切り(記号)とテキスト構造
1.1.3 レコードデータとその作成

1.2 文字と文字列の表現
1.2.1 データとその表現
1.2.2 文字の種類と外形
1.2.3 文字列の基本操作

1.3 文章の記録
1.3.1 ファイル
1.3.2 ファイルシステム
1.3.3 ファイルの管理の仕方

第2章 パソコンの準備とCLTOOLの概略
2.1 パソコンの準備
2.2 CLTOOLの準備
2.2.1 CLTOOLのインストール.
2.2.2 Perl/jperlの関連づけ

2.3 CLTOOLの利用
2.3.1 ソフトウェアの概略
2.3.2 インタフェースデザインと機能概要
2.3.3 stream ファイル
2.3.4 フォルダ表示

第3章 日本語研究用ソフトウェアの使い方
3.1 内容表示:cat(textview)
3.1.1 catの機能と呼び出し
3.1.2 ファイルの内容を表示する
3.1.3 結果の利用
3.1.4 cat の応用利用
3.1.5 wc, xdump

3.2 文字調査:moji, kcat, cntlttr
3.2.1 moji の機能と呼び出し
3.2.2 文字種を数える
3.2.3 kcat, cntlttr

3.3 文調査:record
3.3.1 record の機能と呼び出し
3.3.2 任意の記号で文を区切る
3.3.3 結果の利用

3.4 単語調査:clword(textview)
3.4.1 clword の機能と呼び出し
3.4.2 字種情報を元に文を区切る
3.4.3 結果の利用

3.5 文脈つき文字列抽出
3.5.1 CLGREP の機能と呼び出し
3.5.2 文脈つきで文字列を検索する
3.5.3 結果の利用
3.5.4 CLGREP の応用利用

3.6 並べ替え機能つき文字列抽出
3.6.1 CLKWIC の機能と呼び出し
3.6.2 並べ替えをしながら文字列を検索する

3.7 テキスト整形:filter
3.7.1 filter の機能と呼び出し
3.7.2 会話文/ 地の文のみを抽出する
3.7.3 半角と全角を変換する
3.7.4 ルビを削除する
3.7.5 括弧内の文を分離する
3.7.6 重複行を削除する
3.7.7 カタカナ,漢字のみを抽出する
3.7.8 注釈部分を削除する
3.7.9 行頭と行末の空白を削除する

3.8 用例整形:csvfilter
3.8.1 csvfilter の機能と呼び出し
3.8.2 キーワードとそれ以外を分離する
3.8.3 キーワードの前・後文脈を元の形に戻す
3.8.4 文字列を後ろから並べ替える
3.8.5 前・後文脈を指定して文字検索をする
3.8.6 文脈を1文ごとに区切る

3.9 正規表現の書き方
3.9.1 照合パターンと正規表現
3.9.2 正規表現に使われるメタキャラクタ
3.9.3 言語形式に注意した正規表現
3.9.4 CLGREP,CLKWIC プログラムですぐに使える正規表現

第4章 調査・研究への応用
4.1 文字種頻度調査
4.2 文の長さの調査
4.3 読点の打ち方の調査
4.4 カタカナ語の調査
4.5 叙法副詞の研究
4.6 畳語形オノマトペとアスペクチュアリティの研究
4.7 ボイスの研究
4.8 複文の研究