本论文是一篇关于数据库论文提纲,关于基于XML格式的数据转换技术的设计与应用相关学年毕业论文范文。免费优秀的关于数据库及数据结构及计算机方面论文范文资料,适合数据库论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。
【摘 要】针对煤炭集团公司建设“一站式”综合信息管理平台过程中,各个不同业务系统中相关联的数据实体,由于表示方法、业务实体、业务系统采用的技术以及存储数据库的类型等的不同,导致大量异构数据需要转换.本文通过提出一种基于XML格式的数据转换方法,根据目标业务实体的复杂结构和目标数据实体的数据生成规则,把复杂的数据转换过程分解为一个或多个简单的数据转换单元,大大提高了数据转换的效率和准确性,具有较和高的实际应用价值.
【关 键 词】XML;数据转换;业务实体;映射单元;信息平台;异构数据
Abstract:Accordingtotheprocessofbuilding“CoalGroupCompanyone-stop”integratedinformationmanagementplatform,thedataentitiesrelatedtovariousbusinesssystems,becausetherepresentation,thebusinessentity,businesssystemadoptsthetechnologyofthedatabaseandthestoragetypeisdifferent,resultinginalargenumberofheterogeneousdataconversion.ThispaperpresentsamethodofconvertingXMLformatbasedonthedata,accordingtotheplexstructureandthetargetdataentitybusinessentitydatagenerationrules,toconverttheplicatedprocessofdataintooneormoresimpledataconversionunit,whichgreatlyimprovestheefficiencyandaccuracyofthedatatransfer,andhashigherpracticalapplicationvalue.
Keywords:XML;DataConversion;Businessentity;Mappingunit;Informationplatform;Isomerousdata
1.引言
随着煤炭行业信息化的发展,通过集成的业务系统推进财务业务一体化,建立包含人、财、物、生产、采购、物资、设备管理高度集成的“一站式”综合信息管理平台,在不影响各业务系统正常运行的前提下,打破各业务系统信息数据的壁垒,完成系统的集成整合,通过对各系统的关键数据进行提取、数据的挖掘和分析,为领导决策提供信息支撑,实现各类用户一次登录系统按需享用资源的综合信息平台,成为各大煤炭集团公司综合信息化管理平台建设的一种趋势.煤炭企业在信息化建设的过程中,在不同的时期,基于不同的需求,逐步搭建和积累了多个信息系统.这些信息系统建设满足单个部门业务的需求,承建厂家采用的技术也不尽相同,因而在搭建“一站式”综合信息管理平台过程中,涉及到大量的异构数据的转换.基于上述情况,本文提出一种基于XML格式的数据转换方法,通过这种技术方法,根据目标业务实体的复杂结构和目标数据实体的数据生成规则,把复杂的数据转换过程分解为一个或多个简单的数据转换单元,解决异构系统中数据中的转换问题.
2.XML技术
XML(ExtensibleMarkupLanguage,可扩展标准语言)是SGML(StandardGeneralizedMarkupLanuage,标准通用标记语言)的子集,其目标是允许普通的SGML在web上以目前HTML(HypertextMarkupLanguage)的方式被服务、接收和处理.XML被设计成易于实现,且可在SGML和HTML之间互相操作[1].
XML是一套定义语义标记的规则,这些标记将文档分成许多部件并对这些部件加以标识.这些标识必须根据某些通用的原理来创建,XML标记描述的是稳定内容的结构和含义.它具有:可扩展性、结构性、平台独立性的优点[2].基于这些优点,本文将各个业务平台中的数据库数据转换成统一的XML格式,再将XML格式转换成最终的数据库.
3.数据转换
本文介绍的基于XML格式的数据转换,基本原则是根据目标业务实体的复杂结构和目标数据实体的数据生成规则[3],把复杂的数据转换过程分解为一个或多个简单的数据转换单元.这种细微的数据转换单元在本文中称为映射单元.这种数据转换方法,其内容主要包括映射单元以及映射单元的分解方法.
有关论文范文主题研究: | 关于数据库的论文范文集 | 大学生适用: | 自考论文、学术论文 |
---|---|---|---|
相关参考文献下载数量: | 35 | 写作解决问题: | 毕业论文怎么写 |
毕业论文开题报告: | 文献综述、论文总结 | 职称论文适用: | 技师论文、中级职称 |
所属大学生专业类别: | 毕业论文怎么写 | 论文题目推荐度: | 最新题目 |
3.1业务实体
业务实体的数据结构定义,采用数据模型来描述业务数据结构[4].业务数据定义映射到关系型数据库中是一组具有主从关系或关联关系的表或视图的集合,因此,业务数据是一组数据集,每个数据集是一个二维表结构,包括列集和行集.在数据转换过程中,数据转换的源在本文中称为源业务实体,数据转换的目标在本文中称为目标业务实体;其中源业务实体包含的表称为源表,目标业务实体包含的表称为目标表[6].
3.2映射单元
映射单元的结构属性包括:编号、名称、描述、目标数据表、取数来源、源数据的取数范围、源数据的分组依据、映射单元的执行条件、执行顺序、上级映射单元、映射规则[7].表1是对映射单元的结构属性的详细描述.
映射单元之间的关系是由目标表间的关系确定的,主从关系的数据表对应的映射单元其关系也是主从关系,平行数据表对应的映射单元其关系也是平行关系[5],具体关系参照图1所示.图1映射单元关系图
3.3分解方法
映射单元的分解依据有两个:
(1)目标业务实体的数据结构;
(2)目标表的数据生成规则.
映射单元的分解步骤如下:
(1)识别目标业务实体的数据表组成以及数据表之间的关系:主从和平行.
(2)根据目标业务实体的结构,从主表到子表依次为每个目标表创建映射并设置单元.
创建映射并设置单元可进一步描述为以下几个子步骤:
1)设置映射单元对应的目标数据表;
2)设置映射单元对应的数据来源;
3)设置源数据的取数范围;
4)设置源数据的分组依据;
5)设置映射单元的触发条件;
6)设置映射单元的映射规则.
识别每个目标表的数据生成规则,对于同一个目标表,如果存在不同数据生成规则(比如数据源不