关于计算机专科毕业论文范文,与档案馆机读目录后控方法实践相关论文目录格式

时间:2020-07-05 作者:admin
后台-系统-系统设置-扩展变量-(内容页告位1-手机版)

本论文为关于计算机论文目录格式,关于档案馆机读目录后控方法实践相关毕业论文范文,可用于计算机论文写作研究的大学硕士与本科毕业论文开题报告范文和优秀学术职称论文参考文献资料下载。免费教你怎么写计算机及档案馆及自动控制方面论文范文。

档案机读目录是以一定的格式存入计算机存储器中,可由计算机读取的档案目录数据.通常将通过著录标引得到的、反映档案特征的信息如档号、题名、责任者、分类号、主题词等输入计算机,形成机读目录.编制机读目录,是实现档案计算机检索的前提,其质量直接影响档案检索效果.

一、档案馆机读目录现状及问题

目前各级档案馆、室都已开展档案计算机检索,形成大量的档案机读目录,但质量普遍较差,严重影响检索效果.据浙江省调查材料显示①,质量情况较好的档案馆差错率在12%左右,有的差错率在50%以上,总平均差错率达29%(见下表).


本文来源 http://www.sxsky.net/geshi/416528.html

由此可见,必须对机读目录的质量进行控制.目前档案馆机读目录的主要来源包括以下两个方面:

1.档案馆内形成的机读目录

档案馆内形成的机读目录包括:(1)将原有的已打印的纸质目录通过扫描输入计算机,再通过OCR技术转换的机读目录;(2)对照案卷按著录要求逐项著录标引制成卡片后输入计算机形成的机读目录;(3)是对照案卷直接在计算机上进行著录标引形成的机读目录.这种机读目录存在的主要问题有:

(1) 在著录卡片时由于工作人员笔误造成的错误.

(2) 在录入时由于误操作造成的错误.例如:录入时多按一次回车键,造成录入字段错位.

(3) 前处理环节遗留的问题,包括案卷多册且不连续编号造成档号中卷号重号;责任者没有写全称等.

(4) 扫描时由于原有目录不清或遇容易混淆的字在转换时发生的错误.例如:“纳入”转换成“纳人”等.

(5) 由于著录、标引等标准的变化而导致的数据前后不一致.

2.接收来的电子目录

接收的电子目录主要是从机关档案室接收纸质档案时同时接收来的电子目录,存在的主要问题包括:

(1) 形成电子目录使用的软件各不相同.由于目前国家对于接收电子目录没有统一标准,所以各档案室编制的电子目录,有用EXCEL、WORD、FOXPRO、ACCESS做的表,甚至还有用WPS里CCED做的表,数据格式各不相同,这在接收进馆后都需要进行转换.

(2) 档案室编制的目录和档案馆编制的目录著录项目不同.如:分类号等字段档案室的目录没有,一些档案室有的字段,档案馆的机读目录不需要,要进行增减.如:立档单位、编制单位等.

(3) 相同字段的长度不同.接收来的电子目录即使与馆内机读目录字段相同也存在长度不同的问题,需要与馆内的标准统一.

二、后控方法的提出

鉴于目前机读目录存在问题较多,北京市档案馆提出了对机读目录进行后控的方法,就是在机读目录正式进入检索系统以前,利用各种技术手段对馆内形成的和接收的机读目录质量进行控制.其目的是确保作为检索重要项目的档号、分类号、关 键 词 、责任者、题名、时间等的规范和符合要求.其中最重要的是保证档号的准确惟一性.机读目录经过后控处理,差错率能降至最低.

后控方法:一是自动控制,二是人工控制.

自动控制是将根据有关标准制定的参照系统输入计算机,由计算机自动比照参照系统对档案数据进行规范.它的实现一是采用现有的档案处理软件,二是利用计算机批量处理数据的优势,编制一些实用程序将一些可以用计算机处理的内容统一处理或通过命令、程序操作将著录、标引、录入过程中的问题统一查找出来进行修改以保证机读数据内容的准确.通过自动控制可实现:

1.将自由词转换为主题词和分类号,实际上就是计算机自动标引.目前,国内已开发出一些自动标引系统,其中有抽词标引法、题名标引法和规则标引法等.档案馆可用已有的自动标引软件,结合馆藏内容,选择合适的主题词扩充主题词库,实现档案机读目录自动标引.

2.将不同格式转换为统一格式.对于机读目录数据目前格式不统一的现状,编制程序由计算机自动实现不同数据格式之间的转换.

3.通过查错程序检查数据输入阶段产生的错误.数据在输入阶段不可避免地会出现错误,这些问题都可以通过编制程序查找并解决.

人工控制则是针对自动控制不能解决的问题所采用的方法.例如:在自动标引进行主题分析时遗漏主题或分析错误等,就必须由有经验的专业人员来处理.就目前计算机发展水平看,自动控制和人工控制相结合的半自动方式不失为当前的一个好方法.

三、后控参照系统

1.指标体系

后控的重要方法是建立一套指标完备的参照系统,主要是依据档案著录规则、分类标引规则、主题标引规则、档案分类法、档案主题词表、机读目录后控标准的相关内容,并结合档案工作的实践制定出来.包括①档号②分类号③题名④责任者⑤起始时间⑥终止时间⑦主题词等主要指标,一般的参照系统指标体系如图所示:

2.后控的规则:

(1) 对数据格式的统一.将WORD、EXCEL、CCED等格式的表统一转换成FOXPRO格式,并统一字段名称和字节长度.

(2) 档号由全宗号、目录号、案卷号、页号构成,不能缺少和重复,不能有非法字符,案卷号不能断号.

(3) 分类号按档案分类法标引,不能缺少,不能有非法字母和非法分隔符.

(4) 题名必须能反映档案内容,不能缺少,不能有空格和非法字符.

(5) 责任者按著录标准要用全称或标准的简称,用规定的分隔符,ߎ

后台-系统-系统设置-扩展变量-(内容页告位2-手机版)
声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:123456789@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。
后台-系统-系统设置-扩展变量-(内容页告位3-手机版)