关于图书馆方面论文例文,与期刊共被引相似性测度问题的实证相关论文查重
本论文是一篇关于图书馆方面论文查重,关于期刊共被引相似性测度问题的实证相关本科论文范文。免费优秀的关于图书馆及核心期刊及期刊方面论文范文资料,适合图书馆论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。
eChiSquaredDistance).Ahlgren、Jameving和Rousseau于2003年提出对Pearson相关系数的质疑,建议用余弦函数或者卡方距离代替Pearson相关系数.邱均平等认为卡方距离不适合共被引分析,因为共被引矩阵的数据类型应被看成连续变量(Interval),而卡方距离一般用于计数变量(counts)的处理.他们肯定Ahl-gren等提出的相似性测度的两个必要条件是非常正确的,认为Pearson相关系数矩阵自身的确存在问题,欧氏平方距离能满足这两个必要条件.他们还从程序的统一性角度说明欧氏平方距离测度方法是更好的相似性测度方法.本篇论文网址:http://www.sxsky.net/zhengzhi/050916432.html
实际上,在多元分析中,常用的距离测度方法还有马氏(Mahalanobis)距离和明可夫斯基(Minkowski)距离,其中明可夫斯基距离又有三种特殊形式,分别是绝对值(cityblock)距离、欧氏距离(Euclidean,即上文提到的欧几里德距离)和切比雪夫(chebychev)距离.
3.3 何种方式更适合期刊共被引分析
在之前的文章中,笔者认为共被引分析应该针对作者、期刊、专利等不同分析对象的特点,考虑其不同的对角线取值方式.同样,笔者认为期刊共被引分析的相似性测度方式也应重新考虑.
Pearson相关系数和Sahon余弦测度直接测度变量之间的相关性.正如Jones和Furnas所认为,Salton余弦和Pearson相关系数作为测度方式是等同的,不同在于前者采用几何平均,后者采用的是算术平均.Egghe和Leydesdorff也通过数学演算得到了Pearson相关系数和余弦函数的数学公式转化关系.vanEck和Waltman指出统计意义上的Pearson相关系数是衡量两个随机变量之间的线性关系,但共被引关系并不是简单的线性关系.Leydesdorff则认为Salton余弦测度更适用于非对称的引用矩阵的可视化分析.在共被引分析运用于期刊时,Pearson相关系数和Salton余弦测度更多地是揭示两种期刊所载文献的共被引次数,但显然共被引次数的大小并不是相似性的强弱.因此,笔者认为Pearson相关系数和Stilton余弦函数不是期刊的共被引关系相似性测度的最佳选择.
有关论文范文主题研究: | 关于图书馆的论文范文文献 | 大学生适用: | 在职研究生论文、专升本毕业论文 |
---|---|---|---|
相关参考文献下载数量: | 47 | 写作解决问题: | 如何怎么撰写 |
毕业论文开题报告: | 文献综述、论文小结 | 职称论文适用: | 核心期刊、职称评初级 |
所属大学生专业类别: | 如何怎么撰写 | 论文题目推荐度: | 优秀选题 |
马氏距离适用于变量的量纲不同、测量值变异范围相差悬殊的情况,而期刊共被引分析不存在量纲不同的情况;并且在聚类分析时,马氏距离夸大变量细微变化的缺点非常明显.
绝对值距离、欧式距离与切比雪夫距离同是明可夫斯基距离对应于不同取值的几种形式,它们在数学原理上有一定的相似性.为比较谁更适合用于期刊共被引分析的相似性测度,本文引入Cophe函数(取值在[0,1]间,计算方法将在后文介绍)用于计算聚类过程中分类所确定的结构与原始数据间的拟合程度,该值越接近1则说明聚类结果与数据间的拟合程度越高、聚类过程中信息丢失越少.笔者认为,以此来判断相似性测度的选择更为客观.
4 实证研究
4.1 研究方法与过程
下文将对共被引分析中常用的几种测度方式在标准化与非标准化两种情况下进行实证研究.
本研究选择中文社会科学引文索引数据库(CSSCI)收录的15种图书情报学核心期刊,以中国期刊全文数据库(CNKI)为数据源,对这15种期刊1996~2006年所刊载的论文进行期刊共被引的计量分析.需要说明的是,期刊共被引矩阵的对角线取值采用期刊与自身的实际共被引次数.
聚类分析(ClusterAnaXysis)是研究如何将对象按照多个方面的特征进行综合分类的一种统计方法,是一种定量方法,是从数据分析的角度给出一个更准确、细致分类的分析工具.聚类分析是共被引分析的重要一环,可以用于揭示学科结构并描绘学科结构的发展历程;结合社会网络分析,可以考查这些期刊在本学科的“地位”.
本研究以Matlab7.1软件作为分析工具,采用各种相似性测度方式对期刊共被引数据进行标准化与非标准化的聚类分析,并对聚类结果作对比分析.Cophe是Matlab中的一个内置函数,用于检验某一算法下产生的二叉聚类树和实际情况的相符程度,其值越高,说明聚类结果与数据间的拟合程度越高、聚类过程中信息丢失越少,越与实际相符.将Cophe函数值作为测量聚类结果优劣的一个标准,是比较客观的选择.
4.2 结果分析
4.2.1 Pearson相关系数和Salton余弦函数测度对于直接测度方式来说,标准化后的共被引数据,采用Pearson相关系数和Salton余弦函数测度得到的cophe值均高于未标准化的情况;无论标准化或非标准化,采用Pearson相关系数测度都能得到比Salton余弦函数测度更高的Cophe值.
再看聚类结果,考察期刊群的分类情况.采用Pearson相关系数或Salton余弦函数测度分析非标准化数据时的聚类优于标准化的情况,而且非标准化时两者结果是一致:将图书情报期刊群分成两大类,第一大类为图书馆学期刊群,包括《图书情报工作》、《中国图书馆学报》等10种;第二大类为情报学期刊群,包括《情报科学》、《情报理论与实践》等5种,如图1所示:
4.2.2 距离测度笔者将各种距离测度方式,在聚类中得到Cophe值进行列表比较,如表1所示:
从表1可看出,马氏距离聚类的Cophe值非常低,数据所含信息丢失严重,聚类效果很不理想,这里不再列出聚类图.明可夫斯基距离在这里表现为欧氏距离,得到相同的聚类结果.明可夫斯基距离的三种形式中,非标准化数据直接进行距离测度得到的co―phe值均高于标准化的情况,其中,拟合最好的是非标准化数据下的切比雪夫距离测度.这三种距离测度方式的聚类结果如图2所示:
由图2可看出,共被引数据标准化前后,绝对值距离测度得到的聚类和cophe值变化微小,切比雪夫距离测度得到的聚类和cophe值变化最明显.作为明可夫斯基距离的三种具体形式,共被引数据标准化前后,它们得到的聚类结果比较接近.尤其是在数据非标准化时,它们能得到一致且效果很好的聚类结果:
第一大类是被引和共被引频次最高的《中国图书馆学报》和《图书情报工作》.这两种期刊都在图书情报学中占有很重要的地位,它们的相关性最高,具有非常相似的同被引情况,具有较高的被引频次和影响因子.此外,它们还具有一致的主题结构,期刊研究的主题范围都比较广.
第二大类由三个小类组成.第一小类由《图书馆理论与实践》、《图书馆学研究》、《图书馆工作与研究》、《情报资料工作》和《图书情报知识》组成,它们总体特点是具有比较明显的双栖性,期刊主题偏重于图书馆学.该小类是所有聚类中最大的一类,实际上图书馆学和情报学并没有明确的界限,也说明图书情报学没有明确界限是该学科的一个明显特征.第二小类由《情报科学》、《情报理论与实践》、《情报学报》和《现代图书情报技术》四种期刊组成,它们都是情报学期刊,并且技术方面的文章占的比例也相对较高.第三小类是由《大学图书馆学报&
关于图书馆方面论文例文,与期刊共被引相似性测度问题的实证相关论文查重参考文献资料: