本文是一篇计算机应用论文范文,关于计算机应用类毕业论文题目,关于基于联合权重的多文档关键词抽取技术相关开题报告范文。适合计算机应用及关键词及权重方面的的大学硕士和本科毕业论文以及计算机应用相关开题报告范文和职称论文写作参考文献资料下载。
摘 要 :该文提出一种多文档关 键 词 抽取方法,该方法提出ATF×PDF(Average Term Frequency×Proportional Document Frequency)来计算词语权重,并根据候选关 键 词 之间的语义相似度,采用联合权重方法重新计算候选关 键 词 的权重来抽取关 键 词 .该方法综合考虑了词语的频率,词性以及词语之间的语义相似性等信息,实验表明,该方法能有效抽取多个文档的关 键 词 ,同基于关 键 词 的聚类标记方法相比,其准确率提高3%,召回率提高7%,F-measure提高4.4%.
本文转载于:{$getarticleu