信息检索有关论文范文资料,与信息检索与信息抽取差异性探析相关毕业设计论文
本论文是一篇信息检索有关毕业设计论文,关于信息检索与信息抽取差异性探析相关大学毕业论文范文。免费优秀的关于信息检索及信息及计算机方面论文范文资料,适合信息检索论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。
本标记,如“相关链接”文本所指示的信息为URL链接信息;③以数据库内容为代表的结构化信息,抽取相对简单,关于这方面的探讨还比较少.4.信息检索与信息抽取的关键技术
有关论文范文主题研究: | 关于信息检索的论文范文文献 | 大学生适用: | 学位论文、学术论文 |
---|---|---|---|
相关参考文献下载数量: | 16 | 写作解决问题: | 怎么撰写 |
毕业论文开题报告: | 论文任务书、论文结论 | 职称论文适用: | 技师论文、高级职称 |
所属大学生专业类别: | 怎么撰写 | 论文题目推荐度: | 经典题目 |
这篇论文地址 http://www.sxsky.net/zhengzhi/050914529.html
信息检索通常有分析标引与响应检索两大过程,信息抽取的分析过程更复杂、更有针对性.信息检索可以做成通用的,而信息抽取往往是领域相关的或特征相关的.
一般的信息抽取系统包含以下6步过程:
用一组信息模式描述感兴趣的信息.
对文本进行预处理.采用特征词频率统计和特定模式匹配过滤掉当前文本中与特定领域无关的信息.
对文本进行词法分析、浅层句法分析以及简单的语义分析,对文本中包含的特定领域的主要名词短语单元进行识别,同时标注语义信息.
使用模式匹配方法实现事件模板的构造,建立实体之间的联系.采用基于知识的句子分析技术,将识别的实体映射到一个结构中,并标注它们的角色.
采用语段分析技术实现句子相关性分析,进行上下文关联、共指、引用等分析和推理,对句子层获得的结构实现重载与合并,解决语段的指代和省略问题,构造一个完整的实体事件.
格式化分析结果,把抽取的信息输出到预定义好的模板中.
信息抽取的关键是命名实体识别与模板的匹配.命名实体识别有两类特征信息,一类是实体内含信息,如姓名抽取中,根据中国人数较多的姓(如王、张、李、刘等)以及专用于姓的汉字(如姚、闫等),加之人名所用高频字等信息判断姓名;另一类是前后附着信息,根据实体名
信息检索有关论文范文资料
一个模板就是一条规则,每个模板都是一个约束的序列,这个约束的序列表现为对文本特征的描述,这些特征包括标点符号、词典、大小写、词长、句法分类、句法分块、语义特征等.而事件抽取不一定是整篇文献的内容,有可能只从文献的某一部分内容中进行抽取.例如从新闻中专门抽取事件的经过或事件的影响.事件的描述主要有事情的背景、人物、时间、地点、缘由、开始、过程、结果、影响、评价等,这种事件的抽取涉及场景模板填充任务、命名实体识别、共指关系确定、模板元素填充等.如袁毓林在职务变动事件抽取研究中,根据职务变更动词的有关句法、语义特点,把职务变动的动词分成6个小类,分别描写每一小类动词的论元结构,建立动词的论元角色跟事件模板元素的匹配关系,进行由动词驱动的信息抽取.通过语句的逻辑结构和篇章结构约束信息模板的类型,并约束对当前句中缺失的或以代词等形式表达的信息项目的求解.
5.信息检索与信息抽取的发展趋势
目前信息抽取的模型有很多,包括基于agent的信息抽取、基于隐马尔科夫模型的信息抽取、基于决策树的信息抽取以及基于本体的信息抽取.基于本体的信息抽取的研究比较多,因为一旦有了本体,信息抽取相对比较容易,所以基于本体的信息抽取不管是期刊论文还是学位论文都特别多,但如何获取本体才是问题的关键.
现代信息检索的理论模型开始更多地糅合粗糙集、模糊集、潜在语义标引、神经网络等人工智能技术,信息检索的应用也朝着个性化、知识化、智能化的方向发展,垂直搜索引擎也取得了长足的发展,并起着举足轻重的作用.
未来的信息检索与信息抽取,将更多地运用人工智能理论与自然语言处理技术,需要更加丰富的语料库与语言学知识的支撑.只要资源库足够丰富,无论是抽取还是检索都会更加有效.公安系统有全国13亿人口的资料,可以统计出姓和名的用字概率;政府有全国各级行政区划的命名,铁路系统有大小火车站的名录,这些数据库准确度和可信度都非常高,需要增加系统数据的开放性.如果把各行各业的数据统一共享起来,命名实体的识别就会容易得多.再加之各种分类系统、各行业主题词条,概念等级体系也会在很大程度上得以解决.
6.结论
综上,笔者认为,信息检索与信息抽取有着质的不同,信息检索与信息抽取是完全不同的两个概念,无论从处理目标、关键技术、理论模型还是应用对象等各方面都有所不同.信息抽取不是“更高级的信息检索”,它不是信息检索的发展方向,也不会取代信息检索,只能是促进信息检索的发展.
信息抽取可以应用于信息检索,但信息检索不是信息抽取的唯一应用.信息抽取除了可用于信息检索外,还可用于自动文摘、自动问答系统、技术跟踪与监测系统、结构化数据获取等很多方面.
在有关信息抽取的学术论文中,硕士生所发表的论文占很大比重,近几年有关这个方面的硕士学位论文也较多,特别是基于本体的信息检索或基于本体的信息抽取尤其明显,这种现象与其它研究领域有很大的不同.因为信息抽取往往是面对特定领域,针对某一具体特征,运用某种方法解决某种特定问题的研究,相对来讲比较容易取得应用性创新,而且有很强的现实意义,不需要太大、太复杂的工程即能实现,无需深奥的理论支撑,理解起来也较为容易,这些特点使得大家纷纷加入信息抽取的研究和探索行列.但是如果要分析更复杂的语言现象、设计更通用的信息抽取模式、抽取更复杂的信息单元,还有很长的路要走.此外,网络组织竞争情报还有支持网络组织学习和消除网络组织知识转移障碍的作用,关于这两方面,笔者将另撰文论述.
3网络组织竞争情报流程模式与基于单一企业组织的竞争情报流程模式的比较
3.1网络组织竞争情报流程模式
网络组织竞争情报流程贯穿于网络组织建立的整个过程和网络组织运行的各项活动中,根据网络组织建立的酝酿、选择合作伙伴、正式组建、有效运行与风险防范等环节及各环节的活动,我们可以把网络组织竞争情报流程分解为6个步骤:
●确定企业的合作和建立网络组织的情报需求.其主要任务和内容是根据企业战略,定义企业的情报需求,明确情报需求的范围和重点.
●为选择合适的网络合作伙伴而对潜在合作对象进行情报审计.
●网络盟主出面协调或各成员平等协商对网络组织竞争情报进行总体规划.
●依据上述规划展开信息搜集.其中包括对网络组织的新申入者的资信信息搜集.
●对所搜集的信息进行整理、加工和分析,形成网络组织竞争情报产品.其中包括对网络组织的新申入者的资信信息进行加工、整理和分析.
●依据各网络组织成员的具体需求分发情报,共享情报.
据此,简要构建网络组织竞争情报流程模式(见图1),并指出各步骤竞争情报的主要内容.
3.2两种竞争情报流程模式的简要比较
要对两种竞争情报流程模式进行比较,就需要确定单一企业组织的竞争情报流程模式.综合霍忠文先生和阎旭军的情报过程链模型、王琦提出的四步骤流程模型、JanHerring的竞争情报周期模型(CICycle)、包昌火五环节竞争情报过程模型、中央情报局情报分析与预测程序模型、Gates.B的竞争情报三环节模型、Kahaner.L的竞争情报四步骤模型、Calof和Breakspear(1999)的六环节情报流程模型、Calof(1997)和Kahaner(1996)的“竞争情报循环”模型等等中外有代表性的专家的观点和理论,我们综合出一个基于单一企业组织的竞争情报流程模型(模式),如图2所示:
可以看出,与非网络组织框架下的基于单一企业组织的竞争情报流程模式相比,网络组织竞争情报的流程模式发生了明显的变化,尤其是在第二环节“网络组织竞争情报审计”和最
信息检索有关论文范文资料,与信息检索与信息抽取差异性探析相关毕业设计论文参考文献资料: