本论文是一篇网页类论文目录怎么自动生成,关于基于主题词语义分词与距离的去重算法相关在职研究生毕业论文范文。免费优秀的关于网页及图书馆及算法方面论文范文资料,适合网页论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。
【摘 要】对主题网页去重技术进行了综述,结合已有算法的缺点,提出了一种基于主题词语义与距离的网页去重算法.该方法通过对用户输入的关 键 词进行语义标注后分词检索,计算分词子集在网页文本中的距离,来判断网页与主题的相关度以及网页之间的相似度.同时避开了网页文本向量空间维数大的不足,在一定程度上考虑到了网页的语义信息.
本文来自 http://www.sxsky.net/benkelunwen/06057680.html
【关 键 词】网页去重语义分词与距离去重
目前大多数搜索引擎采用基于关 键 词的方法返回用户