当前位置 —论文大学毕业论文— 范文

数据库类论文范文数据库,与政府电子文档全文数据库建设检索方法相关论文范文

本论文是一篇数据库类论文范文,关于政府电子文档全文数据库建设检索方法相关硕士论文范文。免费优秀的关于数据库及电子政务及信息安全方面论文范文资料,适合数据库论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。

电子文档的全文检索策略研究

全文检索[6]是一种将文件中所有文本与检索项匹配的文字资料检索方法,通过计算机程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置;当用户查询时根据建立的索引查找,类似于通过字典的检索字表查字的过程.功能上全文检索系统需要具有建立索引,处理查询返回结果集,增加索引,优化索引结构等功能.结构上具有索引引擎,查询引擎,文本分析引擎和对外接口等.全文检索技术是现代信息检索技术一个重要分支,是处理电子文档这类非结构数据的强大工具,也是电子的核心技术之一.该技术对文档按各种策略进行分词,然后对切分得到的每个有检索意义的词建立索引,并指明该词在文章中出现的次数和位置,当用户输入检索关键字进行查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈用户.

电子文档的全文检索策略需要关心的问题是搜索效率,包括搜索的即时性、准确率、查全率,策略需要考虑引入给部分字段添加索引、装备采用倒排索引技术的引擎、多关键字共同限定、模糊搜索等技术来提高检索效率.

2.4电子文档全文数据库的安全策略

数据库安全包含两层含义:第一层是指硬件系统运行安全;第二层是指数据信息安全,系统安全通常受到如黑客对数据库入侵、盗取或篡改资料等威胁[7].前一层威胁可以通过数据备份来实现,有很成

关于政府电子文档全文数据库建设检索方法的硕士论文范文
数据库类论文范文数据库
熟的技术去保证硬件的正常运行,对于政府的电子文档来说,后一层的威胁需要更多的关注.

(1)政府电子文档的特殊性之一在于具有密级(一般、秘密、机密、内部),密级与访问权限的设置是数据库建设中必不可少的.因此,电子文档查询和显示模块分为两类:一类为针对单个特殊文档控制查询权限;一类为针对普通文档控制查询权限.针对单个文件,指定哪些用户有查询此文件的权限;普通文档,先赋予用户与档案密级一样的权限,当用户查询权限大于或等于文档密级时,则可查看文档,否则不能查看文档.普通文档又可分类,针对每类文档分别赋予用户普通文档查询权限.

因政府电子文档涉及到大量的涉密文档,应严格按照《中华人民共和国档案法》和《中华人民共和国国家保密法》等相关法律法规的要求对相关操作人员进行保密教育,从源头上保证文档信息的安全.

(2)数据库系统的安全策略主要是针对数据而言的,通过数据独立性、数据安全性、数据完整性、并发控制、故障恢复等几个方面加强数据库系统的安全性来提高电子文档全文数据库的安全策略[8].

3全文数据库建设

根据政府纸质文档电子化及全文数据库建设的模型研究的结论,针对政府电子文档的特点,进行了政府电子文档电子化及全文数据库建设.

首先将纸质公文资源进行扫描后识别成具有水印的双层PDF文档,使用解析工具将PDF文件解析并导入全文数据库中,同时在前台根据用户权限提供全文检索及下载浏览功能,包括以下几个方面的建设内容:

3.1电子公文扫描管理

对电子公文进行扫描,在保证数字化存储格式的通用基础上,实现高清晰度的数字化存储利用,最后将扫描后的目录和文档交由专人集中管理保存.主要管理流程如图2所示:

1图2电子文档扫描管理流程1

3.2OCR识别及双层PDF制作

双层PDF格式文件一般有两种格式的,(1)图像型的,可以通过OCR软件经过去污、纠偏和OCR识别,然后再通过制作双层PDF软件直接生成可以检索的双层PDF文件;(2)文本型的,最常见的WORD转双层PDF文件,先将WORD文件转成单层的PDF文件,再将单层的PDF文件转成图像文件,然后通过OCR软件OCR识别,然后再通过制作双层PDF软件直接生成可以检索的双层PDF文件.本文主要是对扫描文件的内容数据进行获取分析提取,完成对数据基础信息数字识别转换,生成可识别处理的文本格式数据文件(可识别的双层PDF文件).

3.3电子签名与水印添加

政府电子文档同其他电子文档一样会遭遇伪造、篡改、增删、冒名等,公文的内容、公文发送者身份真实性和公文本身的合法性受到了威胁,如何保证政府电子文档的这些安全性不但是其在电子政务中发展的重要内容,也是电子文档全文数据库建设的重要内容之一.使用单向散列函数和RSA加密算法实现数字签名,同时向电子文档中添加某些数字信息以达到文件真伪鉴别、版权保护等功能,防止电子文档被篡改或替换.3.4全文数据库建设

政府部门产生的电子文件,是档案的“前身”,是不可再生的资源,集中存储并提供简洁、方便的归档操作是新时期电子政务建设的重要课题.充分利用这些电子文档数据中心的难点是将不同类别的政府电子文档加载入全文数据库,实现对电子文档的全文检索,提升对政府电子文档的利用率.根据已有的PDF资料构建全文数据库,即使是非专业人员也可以方便的通过系统入库加载PDF或WORD、TXT文档;同时,实现中文分词并构建全文检索引擎.


这篇论文来自 http://www.sxsky.net/daxuebiyelunwen/05043259.html

3.5前端平台提供检索等服务

通过文献共享服务平台,实现对不同类别的文档统一风格显示,提供政府电子文档全文检索、浏览及下载服务.其系统架构如图3所示,系统功能如图4所示.1图3系统架构图1


数据库学术论文的撰写
播放:34796次 评论:7598人

1图4前端检索应用平台功能图

4总结

本文以电子政务新环境下的政府文档全文数据库建设及全文检索方法为研究对象,总结分析了国内外对电子文档处理的成功案例与不足,以某政府部门电子文档管理的实际工作为基础,提出了政府纸质文档电子化及全文数据库建设的模型.在模型基础上,根据该类电子文档的特点,提出了解决政府文档电子化问题及建设全文数据库的方案.

参考文献

[1]冯惠玲.政府电子文档管理[M]北京:中国人民大学出版社,2004.5.

[2]彭碧珍.浅析电子文件的收集与归档[J].科学咨询,2012,(1):59.

[3]孙展红.国外电子文件管理服务力保障机制值得借鉴的几个方面[J].黑龙江档案,2011,(3):68.

[4]安徽省电子文件中心建设项目可行性研究报告[EB/OL].http:∥.thdaxx.//daxxh/dzwjzx/1174..

[5]《电子文件归档与管理规范》GB/T18894-2002[EB/OL].http:∥baike.baidu./link?url等于zYS92RFrqJgNiFIm0n3ljg3-V9h1Ndi0ILbMuCCtvdHroAb6WsKFYEaZErNGQjG9kJbYDMlW93Q2iP7lCCa.

[6]陈慧萍,等.全文索引技术在办公自动化系统中的应用研究[J].计算机应用研究,2007,24(2):222-224.

[7]数据库安全[EB/OL].http:∥baike.baidu./link?url等于BhBEjamqNg1Q6KzUNY58udXFFgc6sIiOVCPUtS4tCnsNE-w7RIjKCLq5uWZTknVNl1Vw3gIhymln2E3Ax6Lpq.

[8]高小银.电子文档的信息安全保障[J].陕西档案,2011,(6):29.

(本文责任编辑:孙国雷)

1 2

数据库类论文范文数据库,与政府电子文档全文数据库建设检索方法相关论文范文参考文献资料:

大学生就业指导局

关于大学生就业的论文

大学数学建模论文

中专数控专业毕业论文

毕业论文没过

当代大学生就业形势

大学生就业环境

个人网站设计毕业论文

印刷毕业论文

妇科毕业论文

政府电子文档全文数据库建设检索方法(2)WORD版本 下载地址