当前位置 —论文政治— 范文

生物医学方面论文范本,与生物医学关联数据进展与比较相关论文开题报告

本论文是一篇生物医学方面论文开题报告,关于生物医学关联数据进展与比较相关毕业论文提纲范文。免费优秀的关于生物医学及数据库及数据方面论文范文资料,适合生物医学论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。

0340;实体识别疾病,采用DrugBank中的实体识别药物成分等.经过实验,LifeSKIM在处理的1204063篇Medline摘 要中,标注了10884032个实体和40510个实体间的关系.

此外,关联数据还不断在问题回答系统和事件数据管理中得到应用,如SemanticCrunchBaseTwitterBot、DBpediamobile、EventDataManagementlOpenLinkgCalendar等,但这些应用目前在生物医学领域中却还少有尝试.相信下一步在生物医学领域中,关联数据的应用会更加广泛.

4 典型生物医学关联数据比较分析

4.1 数据规模与发布情况比较分析

对上述典型的生物医学关联数据进行分析,从其数据源数量、资源规模、外链数、浏览方式、查询方式和下载方式等方面进行数据规模和发布情况的分析和比较,分析的对象主要有Bio2RDF、LinkedLifeData(简称LLD)、LOD的生命科学部分(简称LOD-Life)、Chem2Bio2RDF和LODD,如表1所示:

从表1的分析情况可以看出,生物医学领域的关联数据集成数据规模普遍较大,映射关系也较多,提供访问和下载的途径也较为完备,是关联数据实践发展较好的一个领域.

4.2 实施策略比较分析

除了以上数据规模与发布情况比较分析,本文通过对大量文献和数据的调研认为,目前在实施策略方面,这些生物医学领域关联数据分别采用了不同的解决方案,主要体现在:

4.2.省略/pdb:1GOF;LinkedLifeData对所有资源进行了统一命名,采用以下命名空间,如来自Entrezgene数据库的tumorproteinp53表示为:http://linkedlifedata.省略/drugbank/resouree/drugbank_din/DB00001;LODD则保留了各自数据源的命名空间.

4.2.2 映射机制Bio2RDF的映射原理简单,就是通过查找相同字符串,找到在不同数据来源中的相同实例,将它们关联起来;LinkedLifeData在映射方面采用了多样复杂的方法,分别有命名空间映射、基于参考节点的映射、标识符匹配、取回参考值、传递链接、语义标注等方法;LOD-Life中不同数据源之间的链接通过关联数据发布者来提供,数据集被吸纳为LOD的条件之一就是考量其外链数(outlinks),达到一定数量外链数的数据集才会被考虑;Chem2Bio2RDF的映射方法是以化学基因组学相关的概念为中介,搭建生物类数据源和化学类数据源之间的链接;LODD中不同数据源之间的链接则通过语义链接发现方法来实现,采用了LinQuer工具和SILK链接发现框架中的方法来计算不同数据源中概念之间的语义距离,通过一个相似度的值发现概念之间的链接.

综上所述,当前的关联数据都在试图整合越来越多的资源,同时构建精细准确的链接关系,并以Web可获取的方式发布与访问,也提供用户的下载和应用.尽管这些研究中存在一定的重复整合,但从发展趋势上看,一些机构的研究成果被吸纳到其他项目的后续研究中,如Bio2RDF、LODD、Chem2Bio2RDF均为LODLife贡献了重要力量,Chem2Bio2RDF与Bio2RDF还进行了大量外部映射,随着LOD―Life的不断发展,Bio2RDF的大量成果被吸纳改进,Bio2RDF在形式上正逐渐退出业界,但它在早期的研究积累和成果却是毋庸置疑的.从目前的发展情况来看,最活跃且最具有长期生命力的项目是LOD-Life,众多的局部项目成果都将吸纳到集中式的LOD中去,这样的滚雪球式的发展模式无疑推动了规模更大、质量更高的关联数据的构建和发布,这也与LOD提出的共享与重用理念相吻合.

生物医学关联数据进展与比较参考属性评定
有关论文范文主题研究: 关于生物医学的论文范本 大学生适用: 在职研究生论文、学校学生论文
相关参考文献下载数量: 77 写作解决问题: 如何怎么撰写
毕业论文开题报告: 标准论文格式、论文小结 职称论文适用: 杂志投稿、中级职称
所属大学生专业类别: 如何怎么撰写 论文题目推荐度: 免费选题

5 面临的困难和问题

当前关联数据在生物医学领域中的广泛应用仍面临困难,主要困难就是概念和术语的标准化以及异构资源之间的准确映射,这也是今后发展需要重点解决的问题.

5.1 概念和术语的标准化是迫切需要解决的问题

概念和术语的标准化是大规模关联数据应用的前提和关键,统一的表达形式有助于更大范围内技术、资源等方面的交流和共享,特别是在生物医学这样一个相对更加严格和复杂的学科领域,标准化更是一个迫切需要解决的问题.无论是在传统知识组织体系,如主题词表、分类词表中,还是在新兴的本体乃至语义Web当中,概念和术语都是最基本的重要知识单元,是最基本的外在表示形式.一些相关的研究已经开展,如GeneOntology作为特定医学领域的本体系统应用在了基因领域的诸多实践中,借助于本体技术,GeneOntology成功地解决了以往生物信息领域分散在不同数据库中不同术语表达的问题.然而,还有更广泛的生物医学领域存在着大量隶属于不同系统中的生物医学概念、医学术语,需要对其进行提取、转换、规范化和有序化,迫切需要解决生物医学概念和术语的歧义表达和不一致性问题,这是进一步解决关联数据集成与发布、知识共享和机器统一查找问题的基础.

5.2 异构资源之间的映射问题

生物医学领域中存在许多数据集和本体,但由于编码格式、不同机构与编制者专业知识认知差异、语义粒度、语种与术语差异等多方面因素导致数据集之间普遍存在异构现象.为了生成和发布LinkedData,解决异构资源映射问题,实现语义互操作是关键.关联数据中的关联基本原理是借由RDF三元组的每个位置以无限制方式实现开放语义关联,最具代表性的以DBpedia为中轴的数据集,主要是对实例(instances)采用owl:sameAs实现关联,这也是目前最常见的关联方式.生物医学领域,例如MG数据库和EntrezGene通过Bio2RDF被表达为RDF三元组并发布为关联数据,这两个数据来源之间的联合使用Bio2RDF:xGeneID来实现集成.目前的普遍做法虽然明确了实例间的关系,但它们对应的概念之间尚未被有效关联和集成,即未深入到本体语义层面.

6 总结

关联数据为生物医学领域描绘了一幅美好的知识共享与重用愿景,当前的关联数据研究与实践更为我们打下了应用的基础.本文以生物医学关联数据作为分析对象,探讨了当前生物医学关联数据的研究进展,从面向特定应用的Chem2Bi02RDF、LODD项目到面向领域大规模的Bio2RDF、LinkedLifeData、LOD-Life项目,分析了其研究建设与应用情况,并继续对这些典型生物医学关联数据进行了多方面比较与分析,从而发现它们的特点和优势,以便于将其中有价值的方法应用到后续的研究中去.虽然生物医学关联数据近年来成果显著,但这并不意味着关联数据的发展就没有困难,当前的研究成果还仅限于实验水平,离应用这个目标还有很长一段距离,这需要我们针对当前的发展困难持续不断地研究和探索.

1 2 3

生物医学方面论文范本,与生物医学关联数据进展与比较相关论文开题报告参考文献资料:

政治思想工作论文

政治课改论文

思想政治议论文

研究生政治课论文

诚信政治小论文

初中政治论文网

思想政治论文网

高中政治学生论文

思想政治专业论文

高中政治论文题材

生物医学关联数据进展与比较(3)WORD版本 下载地址