当前位置 —论文政治— 范文

句子类论文范文例文,与综合多特征值相似度在参考咨询问答系统中的应用相关毕业论文范文

本论文是一篇句子类毕业论文范文,关于综合多特征值相似度在参考咨询问答系统中的应用相关毕业论文提纲范文。免费优秀的关于句子及信息检索及信息方面论文范文资料,适合句子论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。

在一条通路这样的假设基础上.基于语义信息的方法需要依赖于比较完备的大型语义词典,这些词典是按照概念间层次关系组织的.在英文方面,常用的具有代表性的语义词典有wordNet等;汉语方面有《知网》(HowNet)《同义词词林》等.基于语义信息的句子相似度计算方法会因为语义词典的不全面和未登录词语义代码的缺失而给计算结果带来一定的误差.另外,基于语义信息的句子相似度计算方法在计算句子相似度时,没有考虑句子的结构信息,计算过程中采用了一种最大匹配法,准确率还没有达到使人满意的程度.三是基于句法结构信息的句子相似度计算方法,基于句法结构信息的句子相似度计算方法又可分为结合词序的方法和基于句法结构分析的方法.结合词序的方法具有代表性的是基于编辑距离的句子相似度计算方法.基于句法结构分析的方法典型的是基于语义依存的句子相似地方计算方法.这种基于句法结构信息的句子相似度计算方法在计算句子相似度时把句法结构信息纳入相似度计算中,对句子理解更为充分,理论上是一种较为理想的的计算方法.这种方法的缺陷主要在于算法的正确性与句法分析技术的正确率祸合性太强,而现在句法分析的技术还有待完善,从而导致该种方法的准确率难以提高,使得方法实用性不强.因此,针对现有句子相似度计算方法考虑不全面的问题,本文提出了一种改进的句子相似度计算方法,即综合多特征的句子相似度计算方法,这种方法在计算句子相似度时综合考虑句子所包含的词语信息、词语的语义信息和句法结构信息,利用句子的深层信息和表层信息,加权整合特征权值,对目前句子相似度计算会起到一定的促进作用.

综合多特征的句子相似度计算方法,在计算句子相似度时综合考虑了句子的词形信息、词语语义信息和句子的句法结构信息这三个层面的信息,这种方法在理论上是可行的:首先,计算句子相似度时可以分别根据句子的任一方面信息进行计算,并且国内外学者对这方面研究也比较成熟.也可以将句子的某些方面的信息综合到一起来计算句子相似度,利用编辑距离和依存文法结合来计算句子相似度.由此可见,综合多特征是可行的.其次,综合多特征是合理的.因为采用某一方面的信息计算句子相似度,其结果是有一定的使用范围和局限性的;而采用多特征综合的方法可以在某些场合弥补这种不足.最后,综合多特征有时是必要的.在计算句子相似度的过程中,应该针对不同的语料特征,利用不同的句子信息来计算句子相似度,而不应该一层不变.比如:在有的领域,语义信息有很大的作用,基于语义信息的句子相似度方法正好可以解决这种问题;而在另外的领域,词形信息有很大的作用,基于关 键 词信息的方法效果不错.因此,针对不同性质的语料中,各信息侧重不同的特点,有必要把多元信息综合起来,在实际运用过程中可以通过调整权重来处理更为广泛的语料[5].

3结语

本文提出了一种综合多特征的句子相似度计算方法.综合多特征的句子相似度计算方法在计算句子相似度时综合考虑了组成句子的词形信息、词语语义信息和句法结构信息,利用句子的深层信息和表层信息,通过加权整合特征权值的方式,以期达到提高句子相似度计算准确率的目的.为此,在计算两个句子的句法结构相似度时,将综合多特征的句相似度计算方法应用于计算机领域问答系统的FAQ问句匹配中,从而验证算法的有效性.

【参考文献】

[1]卜文娟.基于概念图的中文问答系统的研究与实现[D].西北大学,2010.

[2]夏天,樊孝忠,骆正华,等.改进编辑距离算法与汉语句子相似度计算[C]//中国科协第2届优秀博十生学术年会.苏州:2004,444-449.

[3]胡国全,陈家骏,戴新宇,等.一种基于实例的汉英机器翻译策略[J].计算机工程与设计,2005(4):900-903.

[4]杨思春,陈家骏.中文自动问答中句子相似度计算研究[J].情报学报,2008,27(1):35-41.

[5]王永智.限定域中文问答系统关键技术的研究[D].东南大学,2009.

[责任编辑:周娜]

1 2

句子类论文范文例文,与综合多特征值相似度在参考咨询问答系统中的应用相关毕业论文范文参考文献资料:

地缘政治论文

时事政治议论文

高中政治论文800字

初中政治论文1000字

形势与政治论文

九年级政治论文

政治学硕士论文选题

西方政治法律思想史

政治课论文

初三政治小论文

综合多特征值相似度在参考咨询问答系统中的应用(2)WORD版本 下载地址