关于信息检索论文范文例文,与基于本体的语义信息检索系统模型相关论文怎么写

时间:2020-07-09 作者:admin
后台-系统-系统设置-扩展变量-(内容页告位1-手机版)

本论文是一篇关于信息检索论文怎么写,关于基于本体的语义信息检索系统模型相关毕业论文提纲范文。免费优秀的关于信息检索及数据库及本体方面论文范文资料,适合信息检索论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。

【摘 要】传统的信息检索无法实现信息对语义层面的查询,在信息膨胀的今天,越来越难以满足人么对查询效率的要求.本文通过设计一个基于本体的语义检索系统模型,通过语义标签对非结构化数据进行标注,建立统一的元数据库,并且建立相应的领域本体,利用本体的语义推理功能,从而实现了对信息资源的语义检索.

【关 键 词】本体;语义检索;元数据

1.引言

随着互联网与信息技术的发展,信息化的越来越深入到工作与生活的各个层面,随之而来的是信息量的急剧膨胀.由于信息处理技术的发展,如何从海量的信息中高效快速、准确地检索到所需信息已经成为计算机领域研究的一个热点问题.信息检索就是从信息集合中找到用户所需信息的过程.在实践中,传统的基于关 键 词的检索方法主要通过把表征用户查询请求的关 键 词与表征信息内容的索引词进行严格机械匹配进行的.由于一义多词和一词多义现象的存在,缺乏语义理解能力,致使表示查询请求的关 键 词和用户的真实需求之间,关 键 词和索引词之间会存在多重表达差异,从而导致查询结果检准率低、误检率高.为此,本文将研究研究面向本体的智能信息检索技术,并以此为基础构建一个系统模型,通过建立本体库与元数据库来准确映射信息资源,实现了对查询条件进行了语义层面的处理,从而提高检索效率.

2.信息检索与本体

2.1信息检索

信息检索InformationRetrieval)这个术语产生于CalvinMooers1948年在MIT的硕士论文.信息检索是指将信息按照一定的方式组织和存储起来,并针对用户的需求找出所需信息的过程,又称为“信息存储与检索”[1].从广义上讲,信息检索包括存储过程和检索过程,对用户来说,往往仅指查找所需信息的检索过程.信息的存储主要为对一定专业范围内的信息进行选择,并在此基础上进行信息特征描述、加工并使其有序化,即建立数据库.检索是借助一定的设备与工具,采用―系列方法与策略从数据库中查找出所需信息.在现代信息技术环境下,信息检索从本质上讲,是指人们希望从一切信息系统中迅速、准确地查找到自己感兴趣的有用信息,而不论它的出现形式或媒体介质[2].

伴随着Inter的广泛应用,网络上的资源呈现出海量、无序的特点,给传统基于关 键 词匹配的信息检索带来了局限性:对所需检索的目标不能准确描述;无法量化检索目标与候选者间的符合程度.为此,本文提出的基于本体的语义信息检索,利用本体描述语义检索模型中的语义信息,对信息资源进行准确的语义标注,实现语义层面的检索,从而有效提高查全率和查准率.

2.2本体

2.2.1本体基本概念

本体(Ontology)是指对世界上事物的基本描述其概念起源于哲学领域它在哲学中的定义为对世界上客观存在物的系统地描述,即存在论,是客观存在的一个系统的解释或说明,关心的是客观现实的抽象本质,后来随着计算机科学技术的发展,本体的概念被引入计算机工程.从本体的哲学内涵出发,结合计算机工程领域的特点,斯坦福大学知识系统实验室(KSL)的Gruber于1993年在概念化(conceptualization)这一重要的定义基础上提出了第一个广泛被接受的定义:本体是一个明确定义的概念化规范[3].Gruber把本体解释成共享概念化的明确的形式化规范.共享体现了本体获取领域知识,能够被多个人和系统共同接受:概念化是一个的结构,D是领域、R是D上的集合和相应关系,是现实世界的抽象模型;形式化是指本体能够被机器理解和学习;明确则是要清晰地定义概念和概念之间的关系.1998年,Guarino修订了Gruber的定义,引入了统称为概念关系的内涵关系,将本体定义为“本体论是一个逻辑理论,用来说明一个正规词汇表的逻辑含义[4].2001年,Zuniga折中了两种定义,提出信息系统本体论应该是“特定的形式化语言产生的清晰公理理论[5].关于本体,在信息系统理论界还有很多代表性的定义,但总体来说,本体都是用于表示信息系统中隐含或不明确的信息,以便使知识的共享和复用成为可能.

2.2.2本体的构建

构建本体时,根据各自问题域和具体工程的不同形成了不同的构建方法.这些方法有TOVE法、METHODOLOGY方法、骨架法、KACTUS工程法、SENSUS法、IDEF5方法和七步法[6].其中最具参考价值的方法是骨架法.构建本体的核心在于严格确定领域内的术语、属性、关系和规则等,确立术语间的语义网络,建立术语库和关系库,并用规范化、形式化的语言进行描述和存储,使计算机能够识别和处理[7].其主要步骤是确定构建本体的目的和范围;构建本体(分为本体获取、本体编码和本体重用本体评估);使用本体语言对本体进行描述.

目前用于构建本体的工具很多,比较常见的有Ontolingua、Ontosaurus、WebOnto、protege、OntoEdit等.其中Ontolingua和WebOnto均只支持在线编辑而且必须是注册用户才可以使用Ontosaurus是一个可以对用Loom编写的知识库和本体进行浏览的Web浏览器,其文库中只有少量可以使用的本体,对初学用户不易使用,protege则是一个可以免费下载的、具有图形化用户界面的、可在本地运行的本体构建工具;OntoEdit也是一个在本地运行的免费程序但必须注册后由网管人员给用户提供用户名和密码.在这5种工具中protege有它明显的优势,因而现在的本体构建大多都是使用protege来实现的[8].


写信息检索论文的注意事项
播放:37101次 评论:7897人

2.2.3本体的描述语言

OWL(WebOntologyLanguage)是W3组织推荐的本体描述语言,基于XML、RDF和RDFSchema建立.OWL相对XML、RDF和RDFSchema拥有更多的机制来表达语义,从而超越了XML、RDF和RDFSchema.OWL是最新的Web本体语言标准.2002年7月,W3C组织公布了网络本体描述语言(Web


这篇论文url http://www.sxsky.net/jingji/0605743.html

OntologyLanguage,OWL)的工作草案1.0版,2003年8月该工作草案发展成W3C的候选建议,在2004年的2月10号,OWL成为W3C正式推荐的标准.

OWL已经发展成公认的未来的Web本体语言标准.OWL增加了更多的词汇用于描述更多的语义特征:如类之间的关系;基数;相等关系;更丰富的属性类型;属性特征和枚举类.OWL提供了比XML、RDF和RDF模式更强大的功能,在它们的基础上增加了自己的带有形式语义的词汇[9].

3.语义检索系统模型模型

3.1基于本体的语义检索系统设计

本体系统模型主要分为三个模块:用户查询模块、本体管理模块、元数据管理模块,其系统结构如图1.

本系统模型的建立步骤的基本步骤可归纳如下:

(1)利用本体编辑器工具建立相关领域的本体.

(2)对收集的信息资源进行本体元数据标注:各种信息资源如PDF、Web网页等,根据已建立的领域本体实体进行元数据标注.使用RDF或OWL语言对信息资源进行语义层面表示和描述,然后将其按照一定的格式存储在元数据库中.

(3)根据用户检索界面提交的概念,在理解用户需求的基础上,语义检索引擎借助解析推理工具对用户请求进行概念分析和语义相关性推理,然后检索并对已进行本体元数据标注的信息资源库进行检索,最后将检索结果通过反馈给用户检索界面输出.


(4)设计用户检索界面:对用户的检索输入并进行概念提取,并将分析结果传递输出给语义检索引擎;在本体的帮助下匹配出符合条件的数据集合,把检索结果经过定制处理后返回给用户.

3.2本体库的构建

一个本体可由概念、分类层次、关系、函数、公理和实例六种元素组成.本体中的概念是广义上的

1 2

关于信息检索论文范文例文,与基于本体的语义信息检索系统模型相关论文怎么写参考文献资料:

国民经济论文

行政与经济管理论文

建筑经济管理毕业论文

政治经济学硕士

经济法本科毕业论文

经济论文示范

非公经济论文

农业经济类论文

国际经济论文

经济期刊

后台-系统-系统设置-扩展变量-(内容页告位2-手机版)
声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:123456789@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。
后台-系统-系统设置-扩展变量-(内容页告位3-手机版)