本论文是一篇关于加工论文下载,关于中国医学科学院医学信息所相关硕士学位毕业论文范文。免费优秀的关于加工及知识管理及自动化方面论文范文资料,适合加工论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。
中国医学科学院医学信息研究所
文献数据加工系统
开发需求说明
2016年12月13日
一、概述
中国医学科学院医学信息研究所/图书馆(简称"医信所")承担着医学科技文献数字化和文献数据加工工作.为了提高工作效率和加工数据质量,保证数据加工工作在统一的数据处理环境中进行,形成紧密联系,相互配合,相互协调的系统环境,医信所计划开发文献数据加工系统(简称"加工系统").
本文描述了加工系统项目需求,供竞价单位参考.
二、项目需求
在本项目中医学科技文献指的是以纸本出版或电子出版(光盘,电子刊物)方式发行的医学类中外文期刊,图书(含会议文献,文集汇编,科技报告).
文献数据加工分为文摘加工和引文加工两部分.图书和期刊需要进行文摘加工,部分期刊(称为医学引文刊)需要进行引文加工.将来随着馆藏文献数字化工作的展开,重要纸本文献将需要进行原文加工,电子文献还将需要对包括多媒体和流媒体等格式的内容进行原文加工.
本篇论文地址 http://www.sxsky.net/xie/070896058.html
本项目在第一阶段仅包括对图书和期刊进行文摘加工,对医学引文刊进行文摘和引文加工工作的支持,同时加工系统结构和数据库的设计应为将来的原文加工留下接口和空间.
2.1功能需求
加工系统应支持下列功能:
加工任务导入:将按规定结构存储的XML,ACCESS,EXCEL格式的加工任务数据导入加工系统.
加工任务筛选:按照规则将加工任务分析分类.导入的任务数据在第一阶段主要进行四个步骤的筛选:
有关论文范文主题研究: | 关于加工的论文范文集 | 大学生适用: | 函授论文、电大毕业论文 |
---|---|---|---|
相关参考文献下载数量: | 46 | 写作解决问题: | 怎么撰写 |
毕业论文开题报告: | 论文任务书、论文目录 | 职称论文适用: | 刊物发表、职称评初级 |
所属大学生专业类别: | 怎么撰写 | 论文题目推荐度: | 免费选题 |
可识别文献和不可识别文献筛选:所谓可识别文献,是指该文献的母体信息在系统中有记录,系统可以根据母体信息进行下一步筛选,不可识别文献,指系统没有找到该文献的母体信息,因此需要提交给人工进行判断.
文献类型筛选:不同类型(期刊,图书)的文献由不同工作人员进行任务预览和处理,系统应根据文献类型将待加工任务分类后提交给相应工作人员.
需要和不需要加工文献筛选:文献是否需要加工由文献母体属性和相应规则决定,据此系统应将不需要加工的文献筛出,提交给人工处理.需要加工的进行下一步筛选.
需要和不需要下载筛选:系统应对需要加工的文献根据积累的知识判断该文献数据有无下载,下载来源,并形成下载建议.对于提供接口支持系统直接获取数据的网络开放数据源,应通过其接口直接获取数据载入系统等待处理(请按制作1个数据源集成采集接口报价).
加工任务筛选应分为自动筛选和人工筛选.自动筛选规则主要根据对已经加工数据的历史记录分析形成,保存在知识库中,同时允许人工对规则进行调整,人工筛选主要针对自动筛选不能识别的任务数据进行筛选分类,也包括对自动筛选的结果进行审核调整.
加工任务预处理:筛选过的加工任务按文献类型提交不同工作人员进行字段增补,审核和发布.字段增补主要是为方便提刊而加上文献在本馆的馆藏位置信息(包括纸本文献位置信息和电子文献位置信息).字段增补工作应在系统知识库的支持下自动进行,人工可以审核调整.
下载数据格式化:对于可下载的文摘和引文数据进行下载,并将下载结果导入加工系统后,将对下载下来的文摘和引文数据进行格式化整理,形成符合格式规范的文摘和引文数据.
加工任务分类:通过对加工任务和下载数据进行分析,将加工任务分解为扫描任务,整本加工任务,增补加工任务,引文刊加工任务.
加工任务分配:将加工任务按规则分配给加工人员.任务分配应在知识库的支持下逐步实现自动化和智能化,即系统在对加工任务进行量化估