■
K-L. Chung
Fast string matching algorithms for run length coded strings
Computing, Vol. 54, pp. 119-125, 1995
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Sun Wu, Udi Manber
Fast Text Searching With Errors
Technical Report #TR 91-11 ,Department of Computer Science,
The University of Arizona, 1991
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Sun Wu, Udi Manber
Proceedings of USENIX Technical Conference, pp. 153-162, January 1992
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Udi Manber, Sun Wu
Technical Report #TR 93-34 ,Department of Computer Science,
The University of Arizona, 1993
■
Agrepの技法を巨大なファイルシステムに適用したものらしい。
インデクスを併用する。
■
最近はWebGlimpseとして頑張っているらしい。
(2000/1 増井)
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
E. Moura, G. Navarro, N. Ziviani, R. Baeza-Yates
Proceedings of the 21th Annual International
Conference on Research and Development in
Information Retrieval (SIGIR'98), pp. 298-306, 1998
■
ftp://dcc.ufmg.br/pub/research/~nivio/cgrep
Cgrepというプログラムになっているらしい。
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
A. V. Aho, M. J. Corasick
Efficient String Matching: An Aid To Bibliographic
Search
cacm, Vol. 18, No. 6, pp. 333-340, June 1975
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Toshiyuki Masui
Keyword Dictionary Compression Using Efficient Trie
Implementation
Proceedings of Data Compression Conference, pp. 438, April 1991
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ トライ構造
■
山田 八郎, 高橋 恒介, 平田 雅規, 永井 肇
あいまい検索が可能な文字列検索LSI
日経エレクトロニクス, No. 422, pp. 165-181, 1987.6.1
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Cad M. Landau, Uzi Vishkin
Fast Parallel and Serial Approximate String Matching
Journal of Algorithms, Vol. 10, pp. 157-169, 1989
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Esko Ukkonen
On Approximate String Matching
Proceedings of International Conference on Foundation of
Computing Theory, Vol. 158, pp. 487-495, 1983
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Gad M. Landau, Uzi Vishkin
Introducing Efficient Parallelism into Approximate
String Matching and a New Serial Algorithm
Proceedings of 18th ACM Symposium on Theory of Computing, pp. 220-230, 1986
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Thomas N. Turba
Checking for Spelling and Typographical Errors in
Computer-Based Text
SIGPLAN Notices, Vol. 16, No. 6, pp. 51-60, June 1981
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
D. E. Knuth, J. H. Morris, V. R. Pratt
Fast Pattern Matching in Strings
sicomp, Vol. 6, No. 2, pp. 323-350, June 1977
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
P. M. Sleat, S. K. Das
An interactive UNIX spelling corrector
Proceedings of the Spring 1989 EUUG Conference, 1989
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
A. Hume, D. Sunday
Fast String Searchng
softpe, Vol. 21, No. 11, pp. 1221-1248, November 1991
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Peter Robinson, Dave Singerno
Another Spelling Correction Program
cacm, Vol. 24, No. 5, pp. 296-297, May 1981
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Patrick A. V. Hall, Geoff R. Dowling
Approximate String Matching
ACM Computing Surveys, Vol. 12, No. 4, pp. 381-402, December 1980
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
James L. Peterson
Computer Programs for Detecting and Correcting
Spelling Errors
cacm, Vol. 23, No. 12, pp. 676-687, December 1980
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Brian R. Dobing, John Edward Cooke
Spelling correction based on user error patterns
Technical Report #85-4 ,University of Saskatchewan. Dept. of
Computational Science, 1985
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Esko Ukkonen
Finding Approximate Patterns in Strings
Journal of Algorithms, Vol. 6, pp. 132-137, 1985
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Ivor Durham, Dabid Alex. Lamb, James B. Saxe
Spelling Correction in User Interfaces
cacm, Vol. 26, No. 10, pp. 764-773, 1983
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
James K. Mullin
A Tale of Three Spelling Checkers
Software - Practice \& Experience, Vol. 20, No. 6, pp. 625-630, June 1990
■
'Bloom Filter'を使用したスペルチェッカの経験。Bloom
Filterとは、判定したい文字列に対して複数のハッシュ関
数を計算し、その結果をテーブル上で捜すことによりその
文字列が正しいスペルかどうかをチェックするというもの
である。ハッシュ関数をたくさん使用することにより間違
いの率を低くすることができる。スペル訂正については
Peterson_spellcorrectと同じ方法(侯補を生成して
それぞれが正しいかどうかチェックする方法)をとっている。
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Ivor Durham, Dabid Alex. Lamb, James B. Saxe
Spelling Correction in User Interfaces
Technical Report #CMU-CS-82-151 ,Carnegie-Mellon University, Dept. of Computer
Science, 1982
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Robert A. Wagner
The String-to-String Correction Problem
jacm, Vol. 21, No. 1, pp. 168-173, January 1974
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
L. Carter, R. Floyd, J. Gill, G. Markowsky, M. Wegman
Exact and Approximate Membership Testers
■
Bibファイルがこわれていたため、以下のもの
(Peterson:spellcorrect)と混同しているかもしれない。
Address: Berlin/Heidelberg/New York
Month: oct
Booktitle: Proceedings of the 10th ACM Symposium on the Theory
of Computing
Editor: G. Goos
J. Hartmanis
Pages: 59-65
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Daniel M. Sunday
A Very Fast Substring Search Algorithm
cacm, Vol. 33, No. 8, pp. 132-142, August 1990
■
BM法より速い文字列検索アルゴリズム。BM法がパタン文字
列の最後からマッチを捜すのに対し、まだ調べていないテ
キスト文字列の最初の文字からパタン比較を行なう。
BM法に対し、パタンが短い場合数10%、長い場合10%程度高
速化される。
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
R. S. Boyer, J. S. Moore
A Fast String Searching Algorithm
Communications of the ACM, Vol. 20, No. 10, pp. 762-772, October 1977
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
James L. Peterson
Webster's Seventh New Collegiate Dictionary: A
Computer-Readable File Format
Technical Report #TR-196 ,Dept. of Computer Sciences, University of Texas at Austin, May 1982
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
R. S. Boyer, J. S. Moore
A Fast String Searching Algorithm
cacm, Vol. 20, No. 10, pp. 762-772, October 1977
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
西村 賢
文字だ! 検索
ASCII, Vol. 19, No. 7, pp. 358-363, July 1995
■
Windowsのアプリケーションにどんな検索機能が用意
されているか、などを解説している
エディタの中でgrepを動かすものとか、
find的にディレクトリを捜してgrepするものなどがある。
「なめらか」なものはあまり無さそうだが...?
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Ricardo A. Baeza-Yates
Algorithms for String Searching: A Survey
SIGIR Forum, Vol. 23, No. 3,4, pp. 34-58, spring/summer 1989
■
BM,KMP等の比較
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Uzi Vishkin
Optimal Parallel Pattern Matching in Strings
Information and Control, Vol. 67, pp. 91-113, 1985
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Ricardo A. Baeza-Yates, G. H. Gonnet
A New Approach To Text Searching
12th Annual International ACMSIGIR Conference on
Research and Development in Information RetrievalSIGIR Forum, Vol. 23, No. 1,2, pp. 168-175, June 1989
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
G. V. Smit
A Comparison of Three String Matching Algorithms
Software - Practice and Experience, Vol. 12, No. 1, pp. 57-66, January 1982
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Ricardo A. Baeza-Yates, Gaston H. Gonnet
A New Approach to Text Searching
SIGIR89, pp. 168-175, June 1989
■
Waterloo大学のパターンマッチシステム。長さnのパターン
のマッチングを計算するとき、マッチ状態をnビットで表現
し、ビットkがk文字マッチしていることを示すようにする。
例えば"11101"は2文字マッチしていることを示す。次の文
字がcであるとき、この状態変数を1ビット左にシフトし、
T[c]とのORを計算することにより新しい状態を計算する。
T[c]はあらかじめ計算しておく値で、パタン文字==cの位置
だけ0になっている。(例えば、パタン"abac"に対し
T['a']="0101"となる。) k個のミスマッチを許すときはOR
のかわりに加算を使ってミスマッチ個数を計算する。
■
Shifter Algorithmと呼ぶらしい。条件によってはBMより実
行が速いといっているがどのようなものであろうか。状態
の表現方法が違うだけのような気がするが。Univ. of
Waterlooのシステムを使ったと称するIRシステムが商用に
なっているが、これのことなのだろうか? ミスマッチには
いろいろなタイプがあるが、どのタイプに対しても計算可
能なのだろうか?
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ 情報検索
■
James L. Peterson
Computer Programs for Spelling Correction
Proceedings of the 10th ACM Symposium on the Theory
of Computing, pp. 59-65
■
スペルチェッカの概説(TYPO,DEC20のSPELL)及び自分で作っ
たチェッカの解説。プログラムリストが附属している。
\begin{itemize}
\item{スペルチェッカの歴史} \\
初期のもの(TYPOなど)は2語または2語の組合せの起こる確立によって
スペルエラーをチェックしていたが、その後は実際の辞書を参照する方式が
主流となっている。
\item{辞書構成方法} \\
数千語程度の辞書が適当なので辞書の大きさは100KBぐらいとなる。
もっとも頻繁に出現するものを静的なメモリ上においておき、
個人や文書に依存する特殊なものを動的なメモリ上に置き、
頻繁にあらわれないものをディスク上に置いておくという3段方式がよい。
DEC SPELLでは最初の2文字及び文字長による
6000エントリのハッシュ表を作っている。
\item{誤りの訂正方法} \\
1文字欠けているもの、余分にはいっているもの、転置しているものに
ついてそれぞれ調べる。間違っている語は普通少ないので、訂正に多少時間が
かかっても大きな問題ではない。
\item{バッチ方式とインタラクティブ方式} \\
バッチ式の場合辞書をソートしておけばスキャンが一度だけですむという
特徴があるが、使いやすさを考えるとインタラクティブ方式が望ましい 。
\item{サフィックスの扱い} \\
辞書を小さくするため、サフィックスの可否という属性を辞書に
書いているものがある。属性は20種類ぐらい必要である。
\end{itemize}
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
R. A. Baeza-Yates, G. H. Gonnet
Fast string matching with mismatches
Information and Computation, Vol. 108, No. 2, pp. 187-199, February 1994
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Gad M. Landau, Uzi Vishkin
Fast string matching with k differences
Journal of Computer and System Sciences, Vol. 37, No. 1, pp. 63-78, August 1988
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Ricardo A. Baeza-Yates, Gaston H. Gonnet
A New Approach to Text Searching
Communications of the ACM, Vol. 35, No. 10, pp. 74-82, October 1992
■
Shift-addアルゴリズムの紹介。ちょっと古い。
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
Howard L. Morgan
Spelling Correction in Systems Programs
cacm, Vol. 13, No. 2, pp. 90-94, February 1970
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ
■
R. Schaback
On the Expected Sublinearity of the Boyer-Moore Algorithm
SIAM Journal of Computing, Vol. 17, No. 4, pp. 648-658, August 1988
詳細 Wikiページ作成 関連カテゴリ: 文字列検索/パタンマッチ