当前位置 —论文管理学— 范文

关于数据库相关论文范文集,与基于数据挖掘技术的商品陈列相关论文查重软件

本论文是一篇关于数据库相关论文查重软件,关于基于数据挖掘技术的商品陈列相关学年毕业论文范文。免费优秀的关于数据库及数据及统计学方面论文范文资料,适合数据库论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。

格,进行手工处理.


由于挖掘数据量一般比较大,因此,算法的时空复杂性成为许多挖掘工具实际应用中的重要限制因素.如果算法的复杂性随着数据量的增大、模式精细度的提高、准确度要求的增加而呈现指数增长,就将严重限制数据挖掘工具的应用.

为了了解数据挖掘工具解决复杂问题的能力大小.可从挖掘工具的模式应用、数据选择和转换能力、可视化程度、扩展性等方面考察.

多种类别模式的结合使用往往有助于发现有用的商业模式,降低问题的复杂性.特别是与分类有关的模式,可用不同的算法来实现,以适应不同的需求环境.数据挖掘工具如果能够提供多种途径产生同种模式,可以提高其解决复杂问题的能力.

数据选择和转换能力对挖掘工具解决复杂问题能力的影响也是相当大的.因为知识模式通常被大量的数据项所隐藏,这些数据有的是冗余的,有的是完全无关的.这些数据项的存在会影响有价值模式发现的能力.数据挖掘工具的一个很重要功能,就是能够减低数据的复杂性,提供选择正确数据项和转化数据值的能力,这些能力都将增加数据挖掘工具解决复杂问题的能力.

可视化工具不仅为用户提供了直观、简洁的数据挖掘方法,方便了用户使用数据挖掘工具;更重要的是可视化工具有助于用户对重要数据的定位,对模式质量的评价,从而降低解决复杂问题时建模的难度.

三、影响购买的因素

为方便处理,将品牌根据销量归一化(即根据销量加权平均),同时将所有饮料同质化处理,即不考虑其口味和品种,仅考虑其由于其摆放位置高度、深度和摆放幅度(宽度),以及视角和色彩种类.

表描述统计表

NMinimumMaximumMeanStd.Deviation

超市面积(m^2)45203200219.76469.703

超市经营货品种类45300298003153.564512.070

月销售额(万元)452250073.44370.152

POS机数量(台)451202.893.151

营业时间(hr)4512.024.015.0563.0080

周边小区45072.871.700

客户行走动线长度45520018.0128.707

最大客户线密度(个/m)45.11.9.956.5692

货架高度(m)451.594.003.0174.76483

货架格数45464.98.783

货架深度44164.20.878

货架宽度45152.761.368

视角(度)4504220.3712.344

色彩种类45153.001.446

四、主成分分析原理

目前超市,其选择的样本数量都在几十个到一百多个,所使用的指标大多是根据主观判断选择能影响产品销售的指标作为模型的输入变量,所选的指标数量在几个到几十个之间.由于样本量多数偏小,不足以体现数据挖掘技术的优势,而且尽管在样本选择上都采取随机抽样,但是由于数据的可获得性或其他原因,都或多或少对研究结论有一定影响.所以首先要对这些指标进行降维处理,找出最重要的几个影响指标.

一般来说,指标降维有小波变换和主成分分析(PCA,principalponentsanalysis)两类方法,与小波变换相比,PCA(又称Karhunen-Loeve或K-L方法)能够更好地处理稀疏数据,而小波变换似乎更适合复杂高维结构数据.

假定待归约的数据由n个属性或维描述的元组或数据向量组成.PCA搜索k个最能代表数据的n维正交向量,其中k≤n.这样,原来的数据投影到一个小得多的空间,导致维度归约.不像属性子集选择通过保留原属性集的一个子集来减少属性集的大小,PCA通过创建一个替换的、更小的变量集“组合”属性的基本要素.原数据可以投影到该较小的集合中.PCA常常揭示先前未曾察觉的联系,并因此允许解释不寻常的结果.基本过程如下:

基于数据挖掘技术的商品陈列参考属性评定
有关论文范文主题研究: 关于数据库的论文范文检索 大学生适用: 硕士学位论文、在职研究生论文
相关参考文献下载数量: 37 写作解决问题: 学术论文怎么写
毕业论文开题报告: 论文提纲、论文设计 职称论文适用: 杂志投稿、职称评中级
所属大学生专业类别: 学术论文怎么写 论文题目推荐度: 经典题目

1.对输入数据规范化,使得每个属性都落入相同的区间.此步有助于确保具有较大定义域的属性不会支配具有较小定义域的属性.

2.PCA计算k个标准正交向量,作为规范化输入数据的基.这些是单位向量,每一个方向都垂直于另一个.这些向量称为主成分.输入数据是主成分的线性组合.

3.对主成分按“重要性”或强度降序排列.主成分基本上充当数据的新坐标轴,提供关于方差的重要信息.也就是说,对坐标轴进行排序,使得第一个坐标轴显示数据的最大方差,第二个显示次大方差,如此下去.这一信息帮助识别数据中的分组或模式.

4.既然主成分根据“重要性”降序排列,就可以通过去掉较弱的成分(即方差较小)来归约数据的规模.使用最强的主成分,应当能够重构原数据的很好的近似.

PCA计算开销低,可以用于有序和无序的属性,并且可以处理稀疏和倾斜数据.多于2维的多维数据可以通过将问题归约为2维问题来处理.主成分可以用作多元回归和聚类分析的输入.

五、结论

通过主成分分析,安徽某市超市饮料销售与面积和客户行走动线长度高度相关,与其他因素相关性没有通过统计学检验,由于数据采集和相关变量设置缺乏足够的经验,现在只能怀疑数据采集的时点的不相关性导致规律的不明显.

因为超市的最主要的数据是销售数据,其他数据,如库存数据、采购数据都是围绕着该数据,或说与该数据高度相关.显然,销售数据蕴含的反映顾客购买行为的商品相关性信息,这个是我们最为关心的.此类数据的最大的特点是,基于半文本的,非结构化的,短时段内是随机的(客户间相关性很弱),但是长时段与时间相关(季节趋势),因此对此类数据应该以关联性挖掘算法为主,当然多种类别模式的结合使用往往有助于发现更有用的商业模式,同时有时会降低问题的复杂性.特别是,在销售中分析与归类有关的模式,可用不同的算法来实现,以适应不同的需求环境.数据挖掘工具如果能够提供多种途径产生同种模式,可以提高其解决复杂问题的能力.

参考文献:

[1](美)JiaweiHan(韩家炜)andM.Kamber著,范明等译,数据挖掘概念与技术[M].北京:机械工业出版社,2001:1-97

[2](英)DavidHand等著,张银奎等译,数据挖掘原理[M].北京:机械工业出版社,2003:64-122

[3](意)PaoloGiudici著,袁方等译,实用数据挖掘[M].北京:电子工业出版社,2004:1-91

[4](美)Pang-NingTan(陈封能),MichaelSteinbachandVipinKumar著,范明、范宏建译,数据挖掘导论[M].北京:人民邮电出版社,2006:1

关于基于数据挖掘技术的商品陈列的学年毕业论文范文
关于数据库相关论文范文集
5;140

[5]安淑芝等,数据仓库与数据挖掘[M].北京:清华大学出版社,2005:53-70

[6](美)GeeM.Marakas著,敖富江译.数据仓库、挖掘和可视化核心概念.北京:清华大学出版社,2004:79-124


本文出处:http://www.sxsky.net/guanli/00359781.html

[7](美)TrevorHastie,RobertTibshiraniandJeromeFriedman,范明等译,统计学习基础:数据挖掘、推理与预测[M].北京:电子工业出版社,2004:135-155,243-258


1 2

关于数据库相关论文范文集,与基于数据挖掘技术的商品陈列相关论文查重软件参考文献资料:

公司战略管理论文

管理心理学概述

工程管理信息系统论文

iso质量管理体系 培训

吉林大学自考项目管理

自考工商管理专科科目

行政管理 论文

报考工商管理硕士

管理会计应用

企业仓储管理论文

基于数据挖掘技术的商品陈列(2)WORD版本 下载地址