K-L. Chung
Fast string matching algorithms for run length coded strings
Computing, Vol. 54, pp. 119-125, 1995

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Sun Wu, Udi Manber
Fast Text Searching With Errors
Technical Report #TR 91-11 ,Department of Computer Science, The University of Arizona, 1991

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Sun Wu, Udi Manber
Proceedings of USENIX Technical Conference, pp. 153-162, January 1992

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Udi Manber, Sun Wu
Technical Report #TR 93-34 ,Department of Computer Science, The University of Arizona, 1993
Agrepの技法を巨大なファイルシステムに適用したものらしい。 インデクスを併用する。
最近はWebGlimpseとして頑張っているらしい。 (2000/1 増井)

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

E. Moura, G. Navarro, N. Ziviani, R. Baeza-Yates
Proceedings of the 21th Annual International Conference on Research and Development in Information Retrieval (SIGIR'98), pp. 298-306, 1998
ftp://dcc.ufmg.br/pub/research/~nivio/cgrep Cgrepというプログラムになっているらしい。

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

A. V. Aho, M. J. Corasick
Efficient String Matching: An Aid To Bibliographic Search
cacm, Vol. 18, No. 6, pp. 333-340, June 1975

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Toshiyuki Masui
Keyword Dictionary Compression Using Efficient Trie Implementation
Proceedings of Data Compression Conference, pp. 438, April 1991

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ トライ構造

山田 八郎, 高橋 恒介, 平田 雅規, 永井 肇
あいまい検索が可能な文字列検索LSI
日経エレクトロニクス, No. 422, pp. 165-181, 1987.6.1

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Cad M. Landau, Uzi Vishkin
Fast Parallel and Serial Approximate String Matching
Journal of Algorithms, Vol. 10, pp. 157-169, 1989

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Esko Ukkonen
On Approximate String Matching
Proceedings of International Conference on Foundation of Computing Theory, Vol. 158, pp. 487-495, 1983

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Gad M. Landau, Uzi Vishkin
Introducing Efficient Parallelism into Approximate String Matching and a New Serial Algorithm
Proceedings of 18th ACM Symposium on Theory of Computing, pp. 220-230, 1986

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Thomas N. Turba
Checking for Spelling and Typographical Errors in Computer-Based Text
SIGPLAN Notices, Vol. 16, No. 6, pp. 51-60, June 1981

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

D. E. Knuth, J. H. Morris, V. R. Pratt
Fast Pattern Matching in Strings
sicomp, Vol. 6, No. 2, pp. 323-350, June 1977

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

P. M. Sleat, S. K. Das
An interactive UNIX spelling corrector
Proceedings of the Spring 1989 EUUG Conference, 1989

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

M. Kurt
Compressed Tries
cacm, Vol. 19, No. 7, pp. 409-415, 1976

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

A. Hume, D. Sunday
Fast String Searchng
softpe, Vol. 21, No. 11, pp. 1221-1248, November 1991

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Peter Robinson, Dave Singerno
Another Spelling Correction Program
cacm, Vol. 24, No. 5, pp. 296-297, May 1981

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Patrick A. V. Hall, Geoff R. Dowling
Approximate String Matching
ACM Computing Surveys, Vol. 12, No. 4, pp. 381-402, December 1980

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

James L. Peterson
Computer Programs for Detecting and Correcting Spelling Errors
cacm, Vol. 23, No. 12, pp. 676-687, December 1980

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

花田 孝郎
文字列のパターンマッチ法
情報処理, Vol. 24, No. 4, pp. 494-498, April 1983

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

野崎 昭弘
バックトラッキング/文字列照合
bit, Vol. 18, No. 13, pp. 1746-1754, 1986

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Brian R. Dobing, John Edward Cooke
Spelling correction based on user error patterns
Technical Report #85-4 ,University of Saskatchewan. Dept. of Computational Science, 1985

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Esko Ukkonen
Finding Approximate Patterns in Strings
Journal of Algorithms, Vol. 6, pp. 132-137, 1985

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Ivor Durham, Dabid Alex. Lamb, James B. Saxe
Spelling Correction in User Interfaces
cacm, Vol. 26, No. 10, pp. 764-773, 1983

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

James K. Mullin
A Tale of Three Spelling Checkers
Software - Practice \& Experience, Vol. 20, No. 6, pp. 625-630, June 1990
'Bloom Filter'を使用したスペルチェッカの経験。Bloom Filterとは、判定したい文字列に対して複数のハッシュ関 数を計算し、その結果をテーブル上で捜すことによりその 文字列が正しいスペルかどうかをチェックするというもの である。ハッシュ関数をたくさん使用することにより間違 いの率を低くすることができる。スペル訂正については Peterson_spellcorrectと同じ方法(侯補を生成して それぞれが正しいかどうかチェックする方法)をとっている。

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Ivor Durham, Dabid Alex. Lamb, James B. Saxe
Spelling Correction in User Interfaces
Technical Report #CMU-CS-82-151 ,Carnegie-Mellon University, Dept. of Computer Science, 1982

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Robert A. Wagner
The String-to-String Correction Problem
jacm, Vol. 21, No. 1, pp. 168-173, January 1974

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Pace Willisson
Ispell manual page

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

遠山 朋子, 遠山 元道
文字列探索
bit, Vol. 19, No. 4, pp. 480-481, 1987

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

L. Carter, R. Floyd, J. Gill, G. Markowsky, M. Wegman
Exact and Approximate Membership Testers
Bibファイルがこわれていたため、以下のもの (Peterson:spellcorrect)と混同しているかもしれない。 Address: Berlin/Heidelberg/New York Month: oct Booktitle: Proceedings of the 10th ACM Symposium on the Theory of Computing Editor: G. Goos J. Hartmanis Pages: 59-65

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Daniel M. Sunday
A Very Fast Substring Search Algorithm
cacm, Vol. 33, No. 8, pp. 132-142, August 1990
BM法より速い文字列検索アルゴリズム。BM法がパタン文字 列の最後からマッチを捜すのに対し、まだ調べていないテ キスト文字列の最初の文字からパタン比較を行なう。 BM法に対し、パタンが短い場合数10%、長い場合10%程度高 速化される。

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

R. S. Boyer, J. S. Moore
A Fast String Searching Algorithm
Communications of the ACM, Vol. 20, No. 10, pp. 762-772, October 1977

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

James L. Peterson
Webster's Seventh New Collegiate Dictionary: A Computer-Readable File Format
Technical Report #TR-196 ,Dept. of Computer Sciences, University of Texas at Austin, May 1982

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

R. S. Boyer, J. S. Moore
A Fast String Searching Algorithm
cacm, Vol. 20, No. 10, pp. 762-772, October 1977

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

西村 賢
文字だ! 検索
ASCII, Vol. 19, No. 7, pp. 358-363, July 1995
Windowsのアプリケーションにどんな検索機能が用意 されているか、などを解説している エディタの中でgrepを動かすものとか、 find的にディレクトリを捜してgrepするものなどがある。 「なめらか」なものはあまり無さそうだが...?

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Ricardo A. Baeza-Yates
Algorithms for String Searching: A Survey
SIGIR Forum, Vol. 23, No. 3,4, pp. 34-58, spring/summer 1989
BM,KMP等の比較

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Uzi Vishkin
Optimal Parallel Pattern Matching in Strings
Information and Control, Vol. 67, pp. 91-113, 1985

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Ricardo A. Baeza-Yates, G. H. Gonnet
A New Approach To Text Searching
12th Annual International ACMSIGIR Conference on Research and Development in Information RetrievalSIGIR Forum, Vol. 23, No. 1,2, pp. 168-175, June 1989

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

G. V. Smit
A Comparison of Three String Matching Algorithms
Software - Practice and Experience, Vol. 12, No. 1, pp. 57-66, January 1982

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Ricardo A. Baeza-Yates, Gaston H. Gonnet
A New Approach to Text Searching
SIGIR89, pp. 168-175, June 1989
Waterloo大学のパターンマッチシステム。長さnのパターン のマッチングを計算するとき、マッチ状態をnビットで表現 し、ビットkがk文字マッチしていることを示すようにする。 例えば"11101"は2文字マッチしていることを示す。次の文 字がcであるとき、この状態変数を1ビット左にシフトし、 T[c]とのORを計算することにより新しい状態を計算する。 T[c]はあらかじめ計算しておく値で、パタン文字==cの位置 だけ0になっている。(例えば、パタン"abac"に対し T['a']="0101"となる。) k個のミスマッチを許すときはOR のかわりに加算を使ってミスマッチ個数を計算する。
Shifter Algorithmと呼ぶらしい。条件によってはBMより実 行が速いといっているがどのようなものであろうか。状態 の表現方法が違うだけのような気がするが。Univ. of Waterlooのシステムを使ったと称するIRシステムが商用に なっているが、これのことなのだろうか? ミスマッチには いろいろなタイプがあるが、どのタイプに対しても計算可 能なのだろうか?

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ 情報検索

James L. Peterson
Computer Programs for Spelling Correction
Proceedings of the 10th ACM Symposium on the Theory of Computing, pp. 59-65
スペルチェッカの概説(TYPO,DEC20のSPELL)及び自分で作っ たチェッカの解説。プログラムリストが附属している。 \begin{itemize} \item{スペルチェッカの歴史} \\ 初期のもの(TYPOなど)は2語または2語の組合せの起こる確立によって スペルエラーをチェックしていたが、その後は実際の辞書を参照する方式が 主流となっている。 \item{辞書構成方法} \\ 数千語程度の辞書が適当なので辞書の大きさは100KBぐらいとなる。 もっとも頻繁に出現するものを静的なメモリ上においておき、 個人や文書に依存する特殊なものを動的なメモリ上に置き、 頻繁にあらわれないものをディスク上に置いておくという3段方式がよい。 DEC SPELLでは最初の2文字及び文字長による 6000エントリのハッシュ表を作っている。 \item{誤りの訂正方法} \\ 1文字欠けているもの、余分にはいっているもの、転置しているものに ついてそれぞれ調べる。間違っている語は普通少ないので、訂正に多少時間が かかっても大きな問題ではない。 \item{バッチ方式とインタラクティブ方式} \\ バッチ式の場合辞書をソートしておけばスキャンが一度だけですむという 特徴があるが、使いやすさを考えるとインタラクティブ方式が望ましい 。 \item{サフィックスの扱い} \\ 辞書を小さくするため、サフィックスの可否という属性を辞書に 書いているものがある。属性は20種類ぐらい必要である。 \end{itemize}

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

R. A. Baeza-Yates, G. H. Gonnet
Fast string matching with mismatches
Information and Computation, Vol. 108, No. 2, pp. 187-199, February 1994

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Gad M. Landau, Uzi Vishkin
Fast string matching with k differences
Journal of Computer and System Sciences, Vol. 37, No. 1, pp. 63-78, August 1988

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Ricardo A. Baeza-Yates, Gaston H. Gonnet
A New Approach to Text Searching
Communications of the ACM, Vol. 35, No. 10, pp. 74-82, October 1992
Shift-addアルゴリズムの紹介。ちょっと古い。

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

Howard L. Morgan
Spelling Correction in Systems Programs
cacm, Vol. 13, No. 2, pp. 90-94, February 1970

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

有川 節夫, 篠原 武
文字列パターン照合アルゴリズム
コンピュータソフトウェア, Vol. 4, No. 2, pp. 2-23, 1987

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ

R. Schaback
On the Expected Sublinearity of the Boyer-Moore Algorithm
SIAM Journal of Computing, Vol. 17, No. 4, pp. 648-658, August 1988

詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ