关于语义类论文范文参考文献,与改进的基于《知网》的词汇语义相似度计算相关毕业论文怎么写
本论文是一篇关于语义类毕业论文怎么写,关于改进的基于《知网》的词汇语义相似度计算相关在职研究生毕业论文范文。免费优秀的关于语义及概念及词汇方面论文范文资料,适合语义论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。
分配策略用于概念相似度计算.总体的分配思想为:各类型集合间相似度权重系数依赖于集合中的各描述式在表达式中的位置.而描述式权重按下述原则进行分配:表达式中位置偏左的描述式应该赋予较高的权重,而位置偏右的义原描述式之间的相似度应该赋予较低权重.假设概念C的义项表达式中有n个义原描述式,按照其在表达式中的顺序依次为S1,S2,等,Sn,则每个描述式的权重由以下公式计算所得:有关论文范文主题研究: | 关于语义的论文范文文献 | 大学生适用: | 学位论文、专科毕业论文 |
---|---|---|---|
相关参考文献下载数量: | 41 | 写作解决问题: | 如何写 |
毕业论文开题报告: | 论文任务书、论文前言 | 职称论文适用: | 职称评定、职称评副高 |
所属大学生专业类别: | 如何写 | 论文题目推荐度: | 经典题目 |
2.2概念的语义相似度计算
在概念相似度计算介绍之前,假定已经计算得到了义原之间的相似度.首先,按照2.1节所述的权重分配策略为概念的义项表达式中各描述式分配权重,并依照文献[3]提出的描述式类型划分方法把各描述式按形式不同划分为四个集合:独立义原描述式集合、其他基本义原描述式集合、关系义原描述式集合和符号义原描述式集合.然后,分别计算相同类型描述式集合之间的相似度值.其原因在于一般只有相同类型的义原描述式集合间进行相似度计算才有意义[3].最后,对得到的各部分相似度进行求和得到概念间的相似度值.接下来,主要就集合间相似度计算方法进行讨论.
这篇论文url http://www.sxsky.net/benkelunwen/060180352.html
3实验结果与分析
为了验证上述方法的有效性,本文从两个方面对其进行对比实验验证.一方面,采用本文与文献[8]的方法进行词汇间语义相似度计算并将实验结果进行对比分析;另外,将本文
关于语义类论文范文参考文献
3.1词汇语义相似度实验
本文选取了若干组具有代表性的词汇进行词汇语义相似度计算的对比实验验证.在计算过程中,由于文献[8]及本文主要就概念相似度计算方法作出改进,所以本文将这两种概念相似度计算方法分别结合1.1节和1.3节中所介绍的已有方法进行对比实验分析.表2中的Sim1和Sim2为文献[8]结合文献[3]和文献[5]的义原相似度计算方法得到的结果;表2中的Sim3和Sim4为本文方法分别结合相同的两种义原相似度计算方法得到的结果.其中,实验中的词汇语义相似度计算方法均采用1.3节中所介绍的方法.
3.2聚类实验
由于词汇间的语义相似度计算结果合理性评价往往采用人工方法进行判别,容易受人的主观因素影响.所以本文为了更为客观地验证本文方法的有效性,将文献[8]与本文的概念相似度计算方法应用于词汇语义相似度计算,并以此为基础进行基于语义的文本聚类对比实验.
实验语料采用CNLPPlatform中一个中文文本语料库[11]的子集,共300篇文档.分别从语料库中选取不同主题中的文档进行3组聚类分析实验,其中第一组为环境(11篇)、经济(10篇)、环境(13篇)、艺术(12篇),第二组为教育、交通、环境和艺术各20篇,第三组为环境、艺术、教育和医药各20篇.具体实验过程如下:
1)对每组实验文档进行分词、去停用词等一系列预处理后建立每个文本的特征向量.
2)采用文献[12]提出的文本相似度计算方法计算任意文档之间的相似度值.在该过程中,分别采用了文献[8]和本文的方法计算文本间的词汇语义相似度值.
3)采用K中心点算法(PartitioningAroundMediod,PAM)[13]对文本特征向量进行聚类.
3组实验分别采用不同的概念相似度计算方法进行聚类,
每组实验结果分别采用准确率(Precision)、召回率(Recall)和F值(Fmeasure)[14]的均值进行评价分析,结果如表3所示.
4结语
本文在充分考虑知识库描述语言线性特征前提下,提出了一种有效的义原描述式权重分配方案,并结合二部图的最大权匹配算法以及现有方法进行词汇的语义相似度计算.实验结果表明,采用本文方法计算得到的词汇语义相似度能够更合理地体现词语间语义上的差异性,更加符合人们的主观理解.接下来,将深入研究《知网》对词汇的描述特点,从而更进一步改善词汇语义相似度计算的合理性.
参考文献:
[1]ZHUZY,DONGSJ,YUCL,etal.AtexthybridclusteringalgorithmbasedonHowNetsemantics[C]//ICAMCS2011:2011InternationalConferenceonAdvancedMaterialsandComputerScience.Zurich:TransTechPublicationsLtd,2011:474-476.
[2]荀恩东,颜伟.基于语义网计算英语词语相似度[J].情报学报,2006,25(1):43-48.
[3]刘群,李素建.基于《知网》的词汇语义相似度计算[C]//第三届汉语词汇语义学研讨会论文集.台北:[出版者不详],2002:59-76.[4]董强,董振东.知网简介[EB/OL].[2013-01-29].http://.keenage./.
[5]李峰,李芳.中文词语语义相似度计算——基于《知网》2000[J].中文信息学报,2007,21(3):99-105.
[6]DAILL,LIUB,XIAYN,etal.MeasuringsemanticsimilaritybetweenwordsusingHowNet[C]//ICCSIT08:2008InternationalConferenceonComputerScienceandInformationTechnology.Washington,DC:IEEEComputerSociety,2008:601-605.
[7]刘青磊,顾晓峰.基于《知网》的词语相似度算法研究[J].中文信息学报,2010,24(6):31-36.
[8]王小林,王义.改进的基于知网的词语相似度算法[J].计算机应用,2011,31(11):3075-3077.
[9]郝长伶,董强.知网知识库描述语言[C]//全国第七届计算语言学联合学术会议论文集.北京:清华大学出版社,2003:371-377.
[10]龚劬.图论与网络最优化算法[M].重庆:重庆大学出版社,2009:86-95.
[11]李荣陆.中文文本分类语料2003[DB/OL].[2013-01-29].http://.nlpir./download/tccorpusanswer.rar.
[12]余刚,裴仰军,朱征宇,等.基于词汇语义计算的文本相似度研究[J].计算机工程与设计,2006,27(2):241-244.
[13]HANJW,KAMBERM.数据挖掘:概念与技术[M].范明,译.2版.北京:机械工业出版社,2007:263-266.
[14]LARSENB,AONEC.Fastandeffectivetextminingusinglineartimedocumentclustering[C]//ProceedingsoftheFifthACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining.NewYork:ACM,1999:16-22.
关于语义类论文范文参考文献,与改进的基于《知网》的词汇语义相似度计算相关毕业论文怎么写参考文献资料: