关于数据库及系统维护及图书馆方面的免费优秀学术论文范文,数据库类有关论文封面格式,关于数字资源长期保存开源软件比较*相关论文范文参考文献,对写作数据库论文范文课题研究的大学硕士、本科毕业论文开题报告范文和文献综述及职称论文参考文献资料下载有帮助。
摘 要 论文介绍了8种数字资源长期保存开源软件:Invenio、DSpace、Eprints、Fedora、Drupal、i-Tor、MyCoRe和OPUS,阐述了它们的产生和发展过程,并从软件概况、技术规范、知识库及系统管理、系统性能及系统维护5个方面进行了比较分析,概括了这些软件的共同点和不同点,希望能够为各机构选择长期保存软件提供参考,并为国内从事数字图书馆系统设计和开发的同行提供参考.
关 键 词 数字资源长期保存 开源软件 数字图书馆 技术规范 知识库
分类号 G250.76
Comparison Research of Several Digital Preservation Open Source Software
Ma Ningning, Zhou Chen, Feng Hongjuan
Abstract This paper introduces 8 kinds of digital preservation open source software: Invenio, DSpace, Eprints, Fedora, Drupal, i-Tor, MyCoRe as well as OPUS, describes the emergence and development of them, carries out a parison and analysis from 5 aspects: software overview, technical specifications, repository and system management, system performance, and system maintenance, summarizes the similarities and differences of these software, hoping to provide a reference for anizations to choose the best digital preservation software, and provide some help to the designer or developer of digital library software system in China.
Keywords Digital preservation. Open Source Software. Digital library. Technical specification. Repository.
0 引言
数字资源长期保存的概念自20世纪80年代提出以来,国内外一直在进行着大量的研究,并且涌现出一大批功能完善、各具特色的数字资源长期保存开源系统或软件,深得各国图书馆的青睐.构建数字资源长期保存系统的开源软件发展极为迅速,截止到目前,已有Archimede,ARNO,Invenio,DSpace,Eprints,Fedora,Drupal,I-Tor,MyCoRe和OPUS等10 余种.本文重点介绍8种比较有代表性的数字资源长期保存开源软件,并从数字图书馆内容管理系统应具备的主要功能(资源的批量导入与导出、存档管理及系统维护、用户查询与浏览、访问控制)的角度,对这8个系统进行了详细的比较和分析.
1.系统功能和服务特性概览
1.1 DSpace
DSpace由美国麻省理工大学图书馆和惠普公司实验室联合开发,第一个版本于2002年12月发布,是一个收集、组织、存储、索引、发布任何格式和层次结构的数字对象的内容管理发布系统.DSpace遵循BSD协议,采用DC(Dublin Core)元数据来描述数字对象,支持OAI-PMH2.0协议,可以导出METS格式的数字对象,通过METS与其他系统交换资源.DSpace系统结构分为三层:应用层、事务逻辑层和存储层.应用层包含DSpace的用户应用界面、数据提供导入导出工具、统计工具等功能;事务逻辑层负责存档文件、电子用户、授权及工作流等内容的管理;存储层负责元数据及内容的物理存储,如PostgreSQL、Oracle数据库的访问管理、文件系统管理、维护内容索引等[1].
DSpace可扩展性强、功能集成、界面友好,而且使用的第三方软件也均为开源软件,如PostgreSQL,JDK,Apache等,因而受到很多高校和研究机构的青睐.当然,DSpace也有不足之处,在实际应用中需要对其进行本土化处理,如:汉化系统的用户界面、邮件内容、提交作品的描述信息等内容,需根据实际情况设置系统的主题、提交策略和服务条款,从而对系统进行相应的优化改进.
1.2 Fedora
Fedora(Flexible Extensible Digital Object and Repository Architecture)系统始于1997年,在Andrew W. Mellon基金会的资助下,由弗吉尼亚大学和康奈尔大学联合开发,2001年发布其第一个版本.Fedora遵循Mozilla许可协议,采用CORBA和Java技术实现,是一个通用的数字对象管理和存储系统.Fedora系统由数字对象和仓储框架两大实体组成,数字对象是Fedora体系结构的核心,提供了一个集成内容(包括数据和元数据)和行为(对内容的操作)的框架;Fedora仓储是为数字对象服务的,提供了对数字对象的存储管理和访问接口,客户端通过管理和访问接口跟仓储进行交互.Fedora的体系结构分为web 服务层、逻辑应用层和存储层三层[2].
Fedora系统中的数字对象使用METS标准编码,以XML格式存储,方便了数据导入导出时的信息交换.Fedora实现了数字对象框架,扩展性强,适合存储和管理各种属性不同的复合数字对象;支持OAI协议,可以很方便地进行互操作,美国塔夫斯大学、维吉尼亚大学、英国赫尔大学等机构都是其忠实用户.但由于Fedora仅提供管理和访问数字对象的接口,没有用户界面,因此在实际应用中需要使用者进行二次开发,通过编码来调用这些接口,使用门槛较高. 1.3 EPrints
EPrints由英国的Southampton大学研发,目的是创建一个高度可配置的基于Web的知识库,2000年6月发布第一个版本,可存储研究论文、图像、科学数据、音视频等所有数字格式的文件.EPrints用Perl语言编写,使用Apache和MySQL作为其网络服务和存储软件;遵循OAI-PHM2.0协议,灵活性强,用户可以根据需求对其进行修改.EPrints还可以自动安装,可用一种或多种格式存储数字对象,支持多种元数据方案,自动检查数据完整性,基于web进行系统维护,可通过网页提交、订阅、点评资源等,因此拥有广泛的用户群,如:西班牙的E-LIS项目、荷兰Twente大学、澳大利亚昆士兰大学等.
EPrints系统内包含四个区域,分别为用户工作区、编辑/提交缓冲区、存储区、删除区.用户工作区用来存储未编辑完或未准备好提交的记录;编辑/提交缓冲区存储等待批准审核的记录;存储区存储已审核通过、允许发布、可被检索使用的记录;删除区用于存储被逻辑删除的记录,EPrints中的数据是被长久保存的[3].所谓删除,只是从发布区域移走而已.
1.4 Drupal
Drupal是一套由63多万用户和开发人员共同维护与开发的开源内容管理系统,基于PHP开发,基本架构为PHP+Mysql,可以定制各种功能模块,具有典型的web2.0特征,以简洁的代码实现了强大的功能.Drupal是一个建设动态网站的开源平台和内容管理系统,允许用户轻松地组织、管理和发布各种内容,提供广泛而全面的功能和服务,包括:用户管理、发布工作流、讨论功能、新闻聚合、基于受控词表的元数据操作、用于内容共享的XML发布功能.由于功能模块和参数设置均可以自由搭配,Drupal可以支持从个人博客到大型社区驱动网站的各种网页项目[4].
Drupal提供了一个超薄而功能强大的核心组件平台.它基于LAMP 平台,并且支持多种语言,使用容易;模块化的体系结构使功能组织定制更加灵活,还提供了完善的管理和分析工具;庞大的开发团队推动着Drupal的不断发展和完善.
Drupal具有三层体系结构,即数据持久层、逻辑层和表现层.数据持久层负责持久保存各类数据对象,支持Mysql、PostgreSQL等关系型数据库,其它模块可以通过调用核心数据库的API来访问其中的数据;逻辑层是整个系统的核心,包括Drupal核心库和模块组两部分,通过各个功能模块对数据进行业务和逻辑处理;表现层负责存档数据的用户呈现,以用户为中心通过主题系统提供强大的内容表现机制.
1.5 Invenio
Invenio是一个帮助用户构建自己的数字图书馆或网络文档库的免费软件包.该软件提供的技术覆盖了数字图书馆管理的所有方面,从文件摄取,到分类、索引、策划和发布.I