本论文是一篇数据库类论文范文,关于政府电子文档全文数据库建设检索方法相关硕士论文范文。免费优秀的关于数据库及电子政务及信息安全方面论文范文资料,适合数据库论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。
〔摘 要〕本文通过对电子政务新环境下的政府文档的电子化、标准化、全文检索及安全策略等的研究,提出了政府纸质文档电子化及全文数据库建设的模型.并基于该模型,提出了解决政府文档电子化问题及建设全文数据库的方案.
〔关 键 词〕电子政务;电子文档;全文数据库;全文检索
DOI:10.3969/j.issn.1008-0821.2013.10.013
〔中图分类号〕TP399〔文献标识码〕B〔文章编号〕1008-0821(2013)10-0059-04
政府电子文档也称为电子公文,是实施电子政务的必然产物,是提高效率、降低成本、加强安全的有效手段[1].与纸质公文相比,政府电子文档具有存储体积小、检索速度快、远距离快速传递及同时满足多用户共享等优点.目前,我国各级党政机关已广泛应用电子公文,并逐步确立了政府电子文档的格式规范、传输、管理和归档等方面的标准和要求.相关法规规定,政府电子文档与相同内容的纸质公文具有同等法定效力.
有关论文范文主题研究: | 关于数据库的论文范文素材 | 大学生适用: | 自考论文、函授论文 |
---|---|---|---|
相关参考文献下载数量: | 40 | 写作解决问题: | 学术论文怎么写 |
毕业论文开题报告: | 论文任务书、论文选题 | 职称论文适用: | 职称评定、职称评副高 |
所属大学生专业类别: | 学术论文怎么写 | 论文题目推荐度: | 免费选题 |
由于政府电子文档有别于一般电子文档,如政府电子文档有密级的限制,政府电子文档的类别多、归档难,而这些文件是不可再生的资源,如何集中存储并提供简洁、方便的服务是新时期电子政务建设的重要课题,严格按照国家制定的相关电子公文管理规范,借电子政务发展的良机,提出有效解决政府电子文档管理中突出问题的方法,探索出政府电子公文管理一体化创新模式,具有重要的现实意义和实际价值.
通过对国内较早开展电子文档管理研究或全文数据库建设城市的典型案例进行了针对性的调研,发现主要存在电子文档制作为完全规范化;电子文档全文数据库建设存在不足;未考虑全文检索的需求;文件安全性较低等不足之处.建立政府电子文档全文数据库必须确保数据的真实性、完整性、有效性、安全性[2];全文检索将直接针对数据资源的内容进行检索,可以多角度、多侧面的综合利用信息资源.
1国内外研究现状分析
1.1国外电子文档管理及全文数据库建设现状
国外在电子文档管理方面起步较早,研究多偏重于标准制度的研究,如澳大利亚、美国、英国等国都把国家政府文档管理标准、规范、制度作为研究的重点,其研究的基础是以各国的档案工作实际为主,对于文件以及纸质档案电子化工作流程的研究较少.
美国及欧洲等很多发达国家和地区的电子文档的全文数据库建设都不约而同地经历了从机构层面自行研发到国家层面有组织规划、从分散管理到集中管理的转变过程[3].这些国家电子文档的全文数据库建设日趋成熟和完善,这其中比较有代表性的全文期刊数据库有:EBSCO、SpringerLink、ElsevierSDOL、Wiley、ScienceDirec等,这些全文数据库可以实现结构化数据和非结构化数据的全文入库,也可以根据用户需求制定基于全文检索的功能完备的个性化检索服务.在商业化软件方面,较成熟的有微软公司的SQLServer2008及甲骨文公司的OracleTEXT,以及IBM公司的LotusDomino等电子文档处理系统的标志性产品,这些商业化电子数据管理系统解决了查询海量非结构化数据时效率低的问题,能通过全文检索技术高效地管理这些非结构化数据.由于中文信息自身的特点,国外成熟软件产品存在术语与编码不统一,资源不易共享,系统不易于推广等问题,特别是在处理政府电子文档时,存在保密信息可能会泄露的威胁,以及需要解决中文语言分词等难题,因而国内建立电子文档全文库的时候多独立自主开发或利用商业化软件的部分功能进行二次开发.
1.2国内电子文档管理现状
我国在电子文档管理方面起步较晚,目前尚处于探索阶段,但也取得了一定成果.从1996年起国家和地方档案部门开始着手电子文件管理的研究,先后制定了《中华人民共和国电子签名法》(2004年8月28日中华人民共和国主席令第18号)、《电子文件管理细则》(包括文书电子文件元数据方案)、《电子文件长期保存格式需求》、《基于XML的电子文件封装规范》等标准规范)、《电子公文归档管理暂行办法》(6号令)、《电子文件归档与管理规范》(GB/T18894-2002)、《纸质档案数字化技术规范》(中华人民共和国档案行业标准DA/T31-2005)等文件.电子文件管理的国家战略正逐步成型,主要表现为全国性的统筹规划、统一规范和业务指导正在全面启动,一些省、市已经启动了集中管理电子文件的项目,并取得实质性进展,如2005年10月19日,安徽省电子文件中心正式投入使用;2005年浙江省温州市依托地方特色资源,建立了“媒体看温州”全文数据库,取得了很好的社会效果.与发达国家相比,虽然我们的电子文档管理取得了一定的成果,但仍存在一些问题,如:电子文件管理与电子政务发展不相适应;电子公文归档复杂;缺乏统一的归档和共享机制,电子文档利用率不高;电子文件归档管理不规范等突出问题[4].
2全文数据库建设的模型研究
政府文档全文数据库建设一般包括政府纸质文档的电子化方法、政府电子文档全文数据库的建设、数据库的全文检索搜索策略、全文数据库的安全策略4个部分,根据对全文检索策略及关键技术进行的研究,提出了政府纸质文档电子化及全文数据库建设的模型,如图1所示:1图1政府文档电子化及全文数据库建设模型1
2.1政府纸质文档的电子化
按照国家标准《电子文件管理细则第二部分:电子文件长期保存格式需求》,目前国家认可的电子档案格式有TIFF、TXT、PDF和XML等,但每种格式既有自身的优势也有不足.
对于经过OCR后的文档,PDF和XML是较好的选择.但是XML的优势主要体现在数据交换上,且无法保持文件的原版原式.而PDF则能够“原汁原味”的记录文件,是真正的所见即所得.同时,PDF文件技术成熟,存储空间小,便于加密、权限控制和在线浏览,已被业界广泛认可.因此,PDF是入库前文档较好的保存格式.在政府文档的电子化过程中,需要保证数据的真实性、完整性、可靠性和版权的保护.目前我国在《电子文件归档与管理规范》(GB/T18894-2002)[5]中规定了4条措施:
(1)建立对电子文件的操作者可靠的身份识别与权限控制;
(2)设置符合安全要求的操作日志记录,随时自动记录实施操作的人员、时间、设备、项目、内容等;
(3)对电子文件采用防错漏和防调换的标记;
(4)对电子化的印章、数字签名等采取防止非法使用的措施.
具体实施时,主要采用加密技术、数字签名、数字摘 要、数字时间戳、身份认证、报文认证、信息隐藏技术、元数据管理技术等主要技术措施进行实施.
根据国家标准要求,将政府纸质文档扫描为多层PDF格式并加载数字签名,保证文档的合法性,同时,添加水印,保证数据文件的安全性.最后,将PDF文件解析后导入全文数据库,实现政府纸质文档的电子化.
2.2政府电子文档全文数据库建设的标准及电子文档入库方法利用电子文档数据中心的难点是将不同类别的政府电子文档加载入全文数据库,实现对电子文档的全文检索,提升对政府电子文档的利用率.主要包括全文检索数据库标准研究和数据库构建方法两部分内容,其中构建全文检索数据库建设标准主要满足系统性原则、实用性原则、开放性原则、安全性原则等基本原则;数据库构建方法主要从全文数据库选择、电子文档解析、数据结构倒排索引、组织数据、元数据抽取方面进行实施.完成电子文档的入库工作后,还需要制定全文数据库的检索策略,这样构建的全文数据库才能实现全文检索.
2.3
数据库类论文范文数据库,与政府电子文档全文数据库建设检索方法相关论文范文参考文献资料: