当前位置 —论文本科论文— 范文

概念类论文范文集,与基于本体的概念相似度计算相关论文格式模板

本论文是一篇概念类论文格式模板,关于基于本体的概念相似度计算相关毕业论文的格式范文。免费优秀的关于概念及本体及语义方面论文范文资料,适合概念论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。

摘 要:本文基于OWL本体的属性和层次关系,给出一个综合概念相似度计算模型,计算概念之间的柔性相似度,并通过实验验证了模型的有效性.

关 键 词:OWL;相似度;本体

中图分类号:TP301.6文献标识码:A文章编号:1007-9599(2012)05-0000-02

一、引言

本体可以提供强大的知识表示方法,是信息检索领域中的重要内容.传统的本体概念相似度计算方法大多采用特定于描述语言的通用推理服务来进行匹配,这些方法忽略了概念的语义信息.在概念检索或语义查询系统的实验过程中,利用本体对领域知识进行建模,使查询结果满足语义方面的匹配,避免了基于关键字进行简单查询的局限性,在构建基于本体的语义信息检索系统的过程中,提高了查询结果的准确率和召回率.

二、本体描述语言OWL

OWL(WebOntologyLanguage)是语义Web中本体描述语言的标准.OWL在资源描述框架RDF(ResourceDescriptionFramework)的基础上,添加了更多的语义结构的声明,从而对RDF进行了扩展.OWL语言建立在描述逻辑DL(DescriptionLogic)的基础上,因此OWL具备良好的知识表示能力和机器推理能力.领域知识本体可以做如下定义:

Onto等于(V,C,P,H,R)(1)

其中:V表示概念词汇集,C表示本体概念,P表示属性,H表示层次,R表示概念之间的关系.

分析OWL语言中描述元素,对于基于语义特征的概念相似度计算方法非常重要.OWL语言中有四类不同的语义描述元素:

第一类描述元素用于定义本体中实体集合,主要包括类Class和实例Instance.

第二类描述元素用于生成一个本体的特征集合,包括描述本体实体的类层次描述元素和属性特征描述元素以及其他各种约束的描述元素.

第三类是用于描述实体之间,以及特征之间的异同关系的描述元素.

第四类是本体中的补充性的描述元素,以及现有算法尚不能有效支持的特征.

三、基于本体的概念相似度计算

(一)属性相似度

在现实世界中,事物可以由各种属性来进行描述和分类,属性的相似度可以通过两个概念属性集合的相似程度来进行计算.

其中,Ci∩Cj表示概念Ci与概念Cj的相同属性集合;Ci-Cj表示在概念Ci中存在而概念Cj不存在的属性集合;Cj-Ci表示在概念Cj中存在而在概念Ci中不存在的属性集合,α,β,γ为调节权重参数,且α>β=γ.

(二)语义层次距离

本体作为一种知识表示模型,其所包含的概念、属性和关系可以通过有向图的形式进行表示,节点表示概念,边表示关系,概念之间的语义距离可以表示为概念节点之间最短路径边的数目,用表示.语义相似度和语义距离之间存在如下对应关系:

1.两个概念间的语义距离为0时,其相似度为1;

2.两个概念间的语义距离为无穷大时,其相似度为0;

3.两个概念间的语义距离越大,其相似度越小.


写概念本科论文的步骤
播放:38630次 评论:3836人

在本体中,如果两个概念的语义距离相同,那么概念的语义相似度由它们所处的层次决定,所处的层次越深,其所对应的语义相似度越高,反之则相反.

其中,h为本体有向图的最大深度,L为概念Ci和Cj之间有向边的数量.考虑到层次深度对语义相似性的影响,同时,层次深度也能判断出两个概念的上下位关系.综合考虑语义距离和层次深度,可以使用树形结构来对本体进行表示.

其中,hi和hj分别表示概念Ci和Cj在本体树中的深度;表示本体树的最大深度;为调节参数,对系统所需的相似度进行动态调节,表示本体树中深度和广度对概念相似度的影响.

(三)基于属性和语义距离的柔性相似度

本体概念的相似度要综合考虑概念的属性以及概念之间的关系,它们对概念的相似度具有重要的影响.综合考虑概念的属性和层次关系对概念相似度的影响,对公式进行权重调整,得到领域本体中两个概念的相似度计算模型.

其中,是权重系数.由于概念相似度的主观性较强,因此对于不同的服务请求,可以通过权重系数的调节来决定本体概念的属性和层次关系对相似度的影响,从而确定系统所需要的相似度阈值.概念相似度的变化趋势是一种线形关系,参数的取值会影响相似度的大小,但是对概念的相似顺序没有影响.

(四)算法描述

给定相似度算法sim(Ci,Cj),该算法最主要的工作是计算两个概念的相似度.相似度算法描述如下:

第一步:预处理.构建相似度矩阵A,提供任意两个概念之间的相似度度量,其中Aij等于sim(Ci,Cj).显式定义所有的等价概念和反义概念的概念元素集合,赋值为1和0,在相似度矩阵A中,除了能被初始化的元素,其它每个概念的取值都与中参数取值有关的,因此,对同一个概念,可能得出不同的相似度,设定相似度的取值区间为(0,1).

第二步,解析本体文件,并抽取出本体中的类、实例和属性,并根据其在本体树中所处位置设置参数构建特征向量,向量的相似性反映了本体中的类、实例和属性的相似程度.

第三步,计算概念之间的特征向量的公共属性和差异属性,并根据实际需要,设定概念差异的参数.

四、实验

本体概念相似度,即依赖于概念属性的相似程度,又依赖于本体概念的层次关系.概念的相似属性越多,说明两个概念越相似.而概念的层次关系反映了领域专家对概念的层次关系的定义,如果调整了概念的层次,相似度也会发生很大的变化.

实验所用本体数据采用Protégé2000自带的pizza本体,pizza本体包含97个类命名,采用了OWL语言描述.该本体描述了领域内的概念、属性以及它们之间的关系,很好的体现了本体的语义特征.根据上述公式的计算方法得到的概念相似度结果.其中各参数取值为:ρ等于5,α等于0.6,β等于γ等于0.2,θ等于0.2.

对于概念相似性的判断,通常以领域专家的判定作为标准.对于一般的概念,领域专家给定的概念匹配顺序为:同义概念>父子节点>相近属性的节点>兄弟节点>其它节点.虽然使用了不同的计算方法,但是得到的概念匹配顺序基本相同.实验结果客观地反映了本文所采用的概念相似度计算方法的有效性.

PizzaTopping与PepperTopping作为较近的属性结点,相似度要大于作为兄弟结点的PizzaTopping与PizzaBase,同时小于作为父子结点的PizzaTopping和VegetableTopping,同一个父节点VegetableTopping和CheessTopping与VegetableTopping和PepperTopping相比,属性相似度大的概念综合相似度大.

基于本体的概念相似度计算参考属性评定
有关论文范文主题研究: 关于概念的论文范文 大学生适用: 电大论文、学术论文
相关参考文献下载数量: 99 写作解决问题: 如何写
毕业论文开题报告: 标准论文格式、论文题目 职称论文适用: 技师论文、职称评副高
所属大学生专业类别: 如何写 论文题目推荐度: 经典题目

TF-IDF(TermFrequencyInverseDocumentFrequency)方法是文本相似度的计算方法中最为典型的一种方法[12],传统的TF-IDF方法是一种将文本转化为向量形式,用于计算文本相似度.该方法没有考虑到概念的属性相似性,本文利用领域本体改进传统的TF-IDF的空间向量模型:

其中,是传统TF-IDF方法的计算权重;是概念在领域本体中计算得到的权重;是根据TF-IDF值对本体相似度进行加权处理得到&#

1 2

概念类论文范文集,与基于本体的概念相似度计算相关论文格式模板参考文献资料:

本科生如何发表sci论文

中文本科函授

本科论文需要检测吗

电气自动化技术本科

电力本科论文

交大自考本科

临床自考本科

自考本科论文致谢

本科毕业论文修改

本科论文声明

基于本体的概念相似度计算WORD版本 下载地址