设置X
-
100%
+
弃)
在该模型提出来之后很长的一段时间里,它都是文本相似度计算领域的主流方法。
不过该模型并不是没有缺点。
一方面当文本量很大时,生成的文本向量是非常稀疏的,这就导致了空间和计算资源的浪费;
另一方面VSM为达到简化模型的效果忽略了词语间的关系,但在很多情况下词语之间是存在联系的,因此简单地认为词语间相互独立是不合理的。
这两条缺陷尤其致命。
上一页 目录 +书签 下一章