文字列探索
出典: フリー百科事典『ウィキペディア(Wikipedia)』
文字列探索 (もじれつたんさく) とは、n文字の文章(文字列)Aとm文字の文字列Bが与えられたとき、文章Aの中から文字列Bと一致するものを探索することである。テキストエディタ等で必須の機能であり、これまでさまざまなアルゴリズムが考案されている。
ここでいう文字列とはx種類の文字を並べた系列のことである。通常、文字はアルファベット等の言語に依拠した文字セットを指すことが多いが、生物情報学における染色体の塩基配列A, T, G, Cの4文字を対象とするもののように、特定の領域に特化した応用も行われている。
近年は、圧縮テキスト中の文字列探索の研究も行われている。
[編集] 各種アルゴリズム
- Boyer-Moore法
- Knuth-Morris-Pratt法
- Quick Search法 Boyer-Moore法の亜種の一つで、さまざまな亜種のうちもっとも簡単で、かつ高速。
- Rabin-Karp法
- Shift-Or法
- Aho-Corasick法
- Bit-parallel手法