ベクトル空間モデル
出現頻度にもとづく単語の重みづけ
W
ij
=
TF
ij
*
IDF
i
TF
ij
=
(term freq) 文書j中の単語iの出現頻度
IDF
i
=
(inverse term freq) log(N/
DF
i
)
DF
i
= 全文書中の単語iの出現頻度