ベクトル空間モデル
出現頻度にもとづく単語の重みづけ
W
ij
=
TF
ij
*
IDF
i
TF
ij
= (term freq) 文書j中の単語iの出現頻度
IDF
i
= (inverse term freq) log(N/
DF
i
)
DF
i
= 全文書中の単語iの出現頻度