2019年度大川出版賞受賞!
簡潔データ構造とは,データをエントロピーの限界まで圧縮して保存しつつ,検索等の処理を行う際にはあたかも非圧縮のデータに対してアクセスしているように扱えるデータ構造である。データを圧縮することにより,これまでのデータ構造よりも多くのデータを扱えるようになる。扱うデータによっては 1/100 まで圧縮できる。2000年以降,多くの理論的・実用的データ構造が提案されており,ゲノム情報処理等では実際に使われている。
本書は,基本的な簡潔データ構造(ビットベクトル,文字列,木構造等)の理論を説明する。初期の簡潔データ構造は非常に難解なものが多く,実装しても性能の出ないことが容易に想像できたが,後に提案されたものは理論的性能を保ったまま簡単化されており,容易に実装可能であり実際の性能も良い。本書ではそのようなデータ構造を中心に説明しているため,簡潔データ構造を実問題に適用する際の助けになると思われる。