データサイエンス・シリーズ 全12巻

編集委員:柴田里程・北川源四郎・清水邦夫・神保雅一・柳川 堯

 いま、社会のいたるところで的確なデータの取得と理解を必要とする激動の新世紀を迎えている。近年のインターネットの普及、情報公開の潮流もあって、取得可能な情報の量だけは爆発的に増大しているが、その量に圧倒されるばかりでは新しい時代を生き抜くことはできないであろう。
 データサイエンスは、データの流れの上流から下流までを一貫して科学する。「取得(サンプリング)」という作業によって流れ出したデータは「解析」を経て「モデルの構築(モデリング)」に利用され、その「検証(ヴァリデーション)」に用いられた後、「現実問題の解決」という大海に下って流れる。川の水を、その上流でどんなことが起こっているかを知らずに利用すれば、どんな災難に巻き込まれるかわからないのと同様、どんな方法によって得られたデータかを知らずに解析を始めれば、どんな危険が待ち受けているかわからない。
 また、川下のことを考えない水の利用は、迷惑なだけでなく危険でもある。同じことが、現実問題に目をつぶったデータの解析やモデル化にもいえる。これが、一貫してデータを科学することの必要性である。
 また"データに語らせる"ことも重要であるが、語らせるにはそれなりの環境


《続刊テーマ》

4.データモデリング (2013年9月刊行中止)
柴田里程・北川源四郎・柳川 堯・神保雅一・清水邦夫 著

12.ファイナンスデータ (2013年9月刊行中止)
三浦良造・大上慎吾 著

分野で探す