导读 大家好,潜在语义索引,关于潜在语义索引的简介很多人还不知道,现在让我们一起来看看吧!
1、 在传统的向量空间模型中,文档集合中的文
大家好,潜在语义索引,关于潜在语义索引的简介很多人还不知道,现在让我们一起来看看吧!
1、 在传统的向量空间模型中,文档集合中的文档被抽取成为若干个索引项,每个文档由索引项构成一个文档向量空间,而每个项在文档集合中的各个文档中的权值集合则构成了一个项向嚣空间。两者结合在一起构成了文档集合的向量空间。此模型存在两个缺陷:向量模型假设所有的索引项是独立无关的,但实际上可能存在两个索引项(如索引项“电扇”和“电风扇”)是同义的;索引项的数量有时会很多,造成向量空间过大,不利于存储和计算。
2、 为了解决向量空间存在的问题,在向量空间基础上提出了一个潜在语义索引的方法,此方法被证实比在Salton的SMART系统中使用的传统向量空间技术性能更好。
本文关于潜在语义索引的简介就讲解完毕,希望对大家有所帮助。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!