关于档案馆方面本科论文开题报告,关于影响数据挖掘功能的几个问题相关本科论文范文

时间:2020-07-05 作者:admin
后台-系统-系统设置-扩展变量-(内容页告位1-手机版)

这篇档案馆论文范文属于论文格式免费优秀学术论文范文,关于档案馆方面本科论文开题报告,与影响数据挖掘功能的几个问题相关论文引用格式。适合档案馆及数据库及档案数字化方面的的大学硕士和本科毕业论文以及档案馆相关开题报告范文和职称论文写作参考文献资料下载。

数据挖掘,又称为数据库中的知识发现,就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的过程.简单地说,数据挖掘就是从大量数据中提取或“挖掘”知识.在数字档案馆建设中,从海量原始档案数据中快速提取信息,以满足用户需求,就是数据挖掘功能最终要达到的目的.

在数字档案馆中进行数据挖掘的前提条件应包括两个方面:一是数据格式问题,二是OCR识别问题.目前档案行业标准(DA/T 31―2005)纸质档案数字化技术规范,要求纸质档案扫描存储格式可为TIFF和JPG,提供网络查询的图像存储格式可为CEB、PDF或其他格式.这就决定了综合档案馆的档案无论存储成TIFF、JPG或是PDF等格式,都是符合国家标准的.从综合档案馆馆藏案卷纸张实际情况来看,一个全宗下的案卷,不同年代、甚至同一本案卷内的纸张扫描后,分别存储为TIFF或JPG的可能性都有,这就造成了多种存储格式并存现象.先不论哪种格式的识别率高,以及多种格式同时存在时如何识别问题,单就扫描图像能否被识别而论,就是一个难题.目前情况是,20世纪80年代前的档案,无论从纸张颜色、页面存在手写体等方面都和现在的规范要求相距甚远,因此造成了识别困难.没有被识别的图像文件,不

后台-系统-系统设置-扩展变量-(内容页告位2-手机版)
声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:123456789@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。
后台-系统-系统设置-扩展变量-(内容页告位3-手机版)