当前位置 —论文—本科论文— 范文

教学管理相关论文范文资料,与数据挖掘在毕业文成绩管理中的应用相关毕业论文网

本论文是一篇教学管理相关毕业论文网,关于数据挖掘在毕业文成绩管理中的应用相关开题报告范文。免费优秀的关于教学管理及统计分析及系统工程方面论文范文资料,适合教学管理论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。

摘要：数据挖掘技术自产生以来,己经被广泛应用于多种领域,并得到了充分的验证,显示了其重要的经济和社会价值.利用数据挖掘技术快速而准确的提取有价值的教学信息,提高毕业论文教学质量是一项系统工程.研究

教学管理相关论文范文资料目的在于探索如何在当前的教学条件下提高学生毕业论文教学质量,及时发现对教学管理有用的知识,并将这些知识应用于本科学生毕业论文教学工作实践中,为学校管理者提供有用的信息,进而获得更好的管理效益.

关键词：数据挖掘；决策树；C4.5算法；教学管理；高校教学

中图分类号：TP391文献标识码：A文章编号：1009-3044（2012）30-7150-04

该文url http://www.sxsky.net/benkelunwen/060288545.html

随着数字信息化社会的飞速发展,计算机技术和数据库管理系统被广泛应用于科学探索、商业、金融业、电子商务、企业生产等各种行业,已逐渐发展成为一种智能管理过程.数据挖掘作为一种新兴的数据分析技术,它的研究成果取得了令人瞩目的成就[1].利用数据库技术,通过对教务管理的大量数据进行多层次、多维度的加工处理,从而实现人性化管理,为科学决策提供支持.

毕业论文在教学体系中占有十分重要的位置,是本科生培养计划中衡量教学质量的重要指标.提高毕业论文教学质量是一项系统工程,为研究在当前的教学条件下如何提高毕业论文教学质量,本文采用数据挖掘技术对影响毕业论文成绩管理的多方面因素进行了深入分析和挖掘,以期发现对学校毕业论文教学管理有用的知识,将这些知识应用于本科学生毕业论文教学实践中,为学校管理者提供有用的信息,进而获得更好的管理效益,为学校未来的发展提供更广阔的空间,发挥重要的作用.

1数据挖掘简介

数据挖掘（DataMining）,又称数据库中的知识发现（KnowledgediscoveryinDatabase.KDD）[2],是通过分析每一个具体数据,从大量的、有噪声的、模糊的、随机的海量数据中寻找其规律的技术,它是数据库研究中的一个很有应用价值的新领域.

1.1数据挖掘的定义

H包含如下功能：

综上所述,数据挖掘具有三大特点：其一是处理大型数据；其二应用数据挖掘的目的是发现未知的、有意义的模式或规律；其三是一个对大量数据处理的过程,有特定的步骤[3].

为什么要写教学管理毕业论文
播放:33771次评论:5593人

1.2数据挖掘的主要方法

数据挖掘是一个多学科交叉领域,它由人工智能、机器学习的方法起步,并与统计分析方法、模糊数学和可视化技术相融合,以数据库为研究对象,围绕面对应用,为决策者提供服务.

数据挖掘的方法主要可分为六大类：统计分析方法、归纳学习方法、仿生物技术、可视化技术、聚类方法和模糊数学方法.归纳学习法是目前重点研究的方向,本文根据给定的训练样本数据集,采用归纳学习法中的决策树技术构造分类模型,将事例分类成不同的类别.

2决策树算法基本理论

2.1决策树方法介绍

决策树[4]方法是以事例学习为基础的归纳推算法,着眼于从一组无序的,无规则的事例中推断出类似条件下会得到什么值这类规则的方法,它是一种逼近离散值函数的方法,也可以看作一个布尔函数[5].决策树归纳方法是目前许多数据挖掘商用系统的基础,可以应用于分析数据,同样也可以用来作预测.建模过程中,即树的生长过程是不断的把数据进行切分,采用“自顶向下,分而治之”的方法将问题的搜索空间划分为若干个互不交叉的子集,通常用来形成分类器和预测模型.如图1所示,为决策树的示意图.

决策树一种类似流程图的树形结构,是一种知识的表现形式.为了对未知样本进行分类,生成具体的分类规则,信息样本的各个属性值要在决策树上进行测试.主要分为两个阶段：在第一阶段中生成树.决策树最上面的节点为根节点,是整个决策树的开始,然后递归的进行数据分区,每次切分对应一个问题,也对应着一个节点；在第二阶段中对树进行修剪,此过程中去掉一些可能是噪音或异常的数据,防止决策树的过匹配,进而保证生成决策树的有效性和合理性.当一个节点中的所有数据都属于同一类别,或者没有属性可以再用于数据进行分割时,分割工作停止.具体的工作流程如图2所示.

2.2C4.5算法

1986年RossQuinlan首次提出了ID3决策树算法,它是最早的决策树算法之一.ID3算法运用信息熵理论,选择当前样本中具有信息增益值的属性作为测试属性,对样本的划分则依据测试属性的取值[6].C4.5算法是在ID3算法基础上发展起来的,它继承了ID3算法的全部优点,并增加了新的功能改进了ID3算法中的不足,可以进行连续值属性处理并处理未知值的训练样本.在应用单机的决策树算法中,C4.5算法不仅分类准确而且执行速度快.

C4.5通过两个步骤来建立决策树：第一阶段树的生成,第二阶段树的剪枝.C4.5算法采用信息增益率来记录字段不同取值的选择,首先计算各个属性的信息增益率,寻找到规则信息的优劣,选出信息增益率最大的属性作为结点,自顶向下生成决策树.C4.5算法构造决策树的基本策略如下：

数据挖掘在毕业文成绩管理中的应用参考属性评定
有关论文范文主题研究:	关于教学管理的论文范本	大学生适用:	专升本论文、研究生论文
相关参考文献下载数量:	57	写作解决问题:	写作资料
毕业论文开题报告:	文献综述、论文结论	职称论文适用:	杂志投稿、职称评副高
所属大学生专业类别:	写作资料	论文题目推荐度:	经典题目

首先计算出给定样本所需的期望信息,设S为一个包含s个数据样本的集合,对于类别属性,可以取m个不同取值,分别对应于m个不同的类别[Ci（i∈1,2,...,m）].假设类别[Ci]中的样本个数为[si],期望信息为：

其中,[Pi]是任意样本属于[Ci]的概率,并用[sis]估计.

接着,计算当前样本集合所需用的信息熵,设一个属性A具有n个不同的值[（a1,a2,...an）],利用属性A可以将集合S划分为n个子集[S1,S2,...Sn],其中[Sj]包含了S集合中属性A取[aj]值的样本数据.如果属性A被选作测试属性,设[Sij]为[Sj]中属于[Ci]类别的样本集,根据A划分计算的熵为：

然后利用属性A对当前分支结点进行相应样本集合划分计算信息增益：

最后,求信息增益率,表达式为：

C4.5算法的伪代码如下：输入：训练样本Samples；目标属性Target—attribute；候选属性的集合Attributes

输出：一棵决策树

1）创建根节点root；

2）IfSamples都在同一类CThen；

3）返回label等于类C的单结点树root；

4）IfAttributes为空Then；

5）返回单结点树root,[label等于Samples]中最普遍的Target-Atribute值；

6）Else；

7）Foreach测试属性列表Attributes中的属性；

8）IF测试属性是连续的Then；