本论文是一篇关于体育训练类论文提纲,关于数据挖掘技术在体育训练中的应用综述与相关毕业论文开题报告范文。免费优秀的关于体育训练及乒乓球及网络技术方面论文范文资料,适合体育训练论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。
摘 要:随着体育事业的不断发展,大部分体育信息都是用信息技术存取和积累的.面对庞大的数据库和激烈的比赛竞争,将数据挖掘技术应用于体育领域将会成为一种趋势.该文研究数据挖掘技术的各种算法在体育训练中的应用情况,对基于决策树分类的网球训练算法、基于BP神经网络算法、基于关联规则的FP-tree算法进行了分析.最后在此基础上,研究了决策ID3算法的改进方向和可能出现的弊端,提出了数据挖掘技术未来应用到体育领域的研究方向.
关 键 词:数据挖掘;体育训练;决策树ID3
中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)22-5492-04
ApplicationReviewandAnalysisofDataMiningTechniquesinSportTraining
XUJian-min,OUMu-hua,XIONGJin-zhi
(ComputerCollege,DongguanUniversityofTechnology,Dongguan523808,China)
Abstract:Withthecontinuousdevelopmentofsports,mostsportsareusingITtoaccessandaccumulate.Facedwithahugedatabaseandfiercepetitioninthegame,thedataminingtechnologyinthefieldofsportswillbeeatrend.Thisstudyfocusesmainlyontheimplementationofthevariousalgorithmsbasedonthedatamining,whichinvestigatesthealgorithmbasedondecisiontreeclassificationappliedtotennis,thealgorithmbasedonBPneuralwork,andtheFP-treealgorithmbasedonassociationrules.Finally,onthebasisoftheabovemethod,thestudyanalyzesthedirectionofimprovementtoandpossibledrawbacksofthedecision-makingID3algorithm,andprovidesawayofresearchofdataminingwhichwillbeappliedtosports.
Keywords:datamining,sportstraining,decisiontreeID3
目前体育数据信息的分析通常采用常规统计方法:抽样理论、假设检验、决策理论、估计理论、时间序列等[1],大多数统计分析技术都要求完善的数学理论和严谨的使用技巧,对使用者要求很高,且大多属于抽样研究,存在不同程度的丢失信息现象.此外,传统统计方法很难挖掘出数据资料的潜在规律.随着近年来体育领域数据增多,各种指标的体质监测数据,各种各类体育竞技比赛数据等越来越多,形成海量数据[2].与此同时,计算机应用技术在存储、模拟分析数据方面有着很明显的发展潜力.于是,如何在海量数据中寻找各种因素间的相互关系、发现它们之间的变化规律,进而对数据深入分析就成为了计算机的重要发展方向之一.因此,数据挖掘技术的研究和应用成为体育科学研究中不可或缺的内容之一.
该文首先介绍数据挖掘的定义和基本方法,其次综述数据挖掘技术在国内外体育训练的应用情况,最后在此基础上经过对方法和研究方向的分析,提出未来数据挖掘技术在体育训练上的研究方向.
1数据挖掘的基本方法
数据挖掘作为一门跨学科的应用技术,它涵盖了统计学、机器学习、人工智能、模糊数学等诸多科学领域,形成了根据具体任务而进行数据分析以及知识萃取的方法体系.同样,对于相同的问题也可以根据不同的应用领域特点选择不同的算法.比如,处理描述性挖掘任务有数据特征化和数据区分等概念抽象和数据汇总概要处理;预测性挖掘任务因目标变量属性的不同有分类和预测方法.
数据挖掘的方法主要有:
1)分类:按照分析对象的属性分门别类加以定义,建立类组.
2)回归:是使用一系列的现有数值来预测一个连续数值的可能值.
3)预测:根据对象属性的过去观察值来估计该属性未来的值.
4)聚类:是将一组数据按照相似性和差异性分为几个类别,其目的是使得属于同一个类别的数据间的相似性尽可能大,不同类别中的数据间的相似性尽可能小.
有关论文范文主题研究: | 关于体育训练的论文范文集 | 大学生适用: | 本科论文、电大毕业论文 |
---|---|---|---|
相关参考文献下载数量: | 55 | 写作解决问题: | 怎么撰写 |
毕业论文开题报告: | 标准论文格式、论文摘要 | 职称论文适用: | 期刊发表、职称评中级 |
所属大学生专业类别: | 怎么撰写 | 论文题目推荐度: | 最新题目 |
5)关联:是要找出在某一事件同时出现的事件.主要是要找出:如果甲因素出现在某一事件的一部分,则乙因素也出现在该事件中的机率有多大.
数据挖掘常用的技术主要有决策树、遗传算法、聚类分析、神经网络技术、关联规则等[3-4].
1)决策树
一种用树枝状展现数据受各变量的影响情况的分析预测模型,根据对目标变量产生效应的不同而制定分类规则,它是建立在信息论基础之上,对数据进行分类的一种方法.它首先通过一批已知的训练数据建立一棵决策树,然后采用建好的决策树对数据进行预测.决策树的建立过程是数据规则的生成过程,因此这种方法实现了数据规则的可视化,其输出结果容易理解,精确度较好,效率较高,因而较常用.常用的方法有分类及回归树法、卡方自动交互探测法等[3].
2)遗传算法
一种新的最佳化空间搜索方法,它应用算法的适应函数来决定搜索的方向,运用一些拟生物化的人工运算过程进行一代又一代的周而复始的演化,求得一个最佳结果.特点是具有强固形与求值空间的独立性.强固形使问题的限制条件降到最低,并大幅度提高系统的容错能力;而求值空间的独立性则使遗传算法的设计单一化,且适用于多种不同性质、领域的问题.将遗传算法运用于数据挖掘,可以开采出与众不同的信息,是别的算法所不能替代的.
3)聚类分析
聚类分析是将数据对象分成类或簇的过程,使同一簇中的对象之间具有很高的相似度,而不同簇中的对象高度相异.一个好的聚类方法会最大化类内的相似性,最小化类间的相似性.主要聚类方法有:划分算法、层次算法、基于密度的方法、基于网格的方法、基于模型的方法.
4)神经网络技术
一种模仿人脑思考结构的数据分析模式,由输入变量或数值中自我学习并根据学习经验所得的知识不断调整参数,以期得到资料的模式.是建立在自学习的数学模型基础之上,它可以对大量复杂的数据进行分析,并能完成对人脑或计算机来说极为复杂的模式抽取及趋势分析.神经网络的处理过程主要是通过网络的学习功能找到一个恰当的连接加权值来得到最佳结果.比较典型的学习方法是回溯法.通过将输出结果同一些已知值进行一系列比较,加权值不断调整,得到一个新的输出值,再经过不断的学习过程,最后该神经网络得到一个稳定的结果.
5)关联规则
关联规则挖掘就是从大量的数据中挖掘出有价值描述数据项之间相互联系的有关知识.关联规则主要应用在商业数据库中:商品分类设计、降价经销分析、生产安排、货架摆放策略等.关联规则主要反映了一个事物与其他事物之间的相互依存性和关联性.给定一个事务集D,挖掘关联规则的问题就变成如何产生
关于体育训练类论文范文素材,与数据挖掘技术在体育训练中的应用综述与相关论文提纲参考文献资料: