2019-07-28から1日間の記事一覧

Burrows Wheeler変換(BWT)

tl:dr Burrows Wheeler変換(BWT)について調べためも Burrows Wheeler変換(BWT)とは 変換すると,似たような記号がたくさん並ぶようになる,文字列の可逆変換手法。 これ自体はデータのサイズは変更しないですが、圧縮しやすくなるのでデータ圧縮の前処理で使…

接尾辞配列

tl;dr 全文検索などで使われる接尾辞配列(suffix array)について調べたのでメモ 接尾辞配列とは 文書すべての位置から始まる部分文字列を辞書式順序で小さい順に並べ、その位置を格納したものです。 全文検索では接尾辞配列をインデックスとして利用すると、…