电子政务相关论文范文例文,与Web挖掘在电子政务中的应用相关论文下载
本论文是一篇电子政务相关论文下载,关于Web挖掘在电子政务中的应用相关毕业论文的格式范文。免费优秀的关于电子政务及数据库及网络信息方面论文范文资料,适合电子政务论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。
摘 要:介绍了Web挖掘的基本知识,分析了电子政务中Web挖掘应用的必要性以及主要应用领域,优化了适用于电子政务环境下的关联规则挖掘算法E-GM,通过数据试验验证了该算法的有效性,并通过实例证实了其在政府电子政务门户网站规划与建设中的指导应用.
关 键 词:Web挖掘电子政务关联规则政府门户网站
一、引言
目前,Web挖掘已成为数据挖掘研究中的一个重要方面,而且已成功应用到银行、电信、保险、网络零售、电子商务等很多领域.随着网络社会的到来,政府的管理和服务模式不断变化,电子政务作为一种新型的政府工作形式近几年取得了蓬勃的发展,其中加强政务信息资源的开发与利用成为当前的迫切任务[1].
本文讨论了Web挖掘在电子政务中的主要应用领域,并就关联规则Web挖掘算法进行了优化分析,对其在电子政务门户网站规划与建设的实践中进行了应用性的实证研究.
二、Web挖掘的基本知识
⒈Web挖掘的定义
从形式上看,Web挖掘就是从与WWW相关的资源和行为中抽取主体感兴趣的、潜在的有用模式和隐含的信息或知识.Web挖掘覆盖了多个研究领域,包括Web技术、数据库技术、数据挖掘、计算机语言学、信息获取技术、统计学、人工智能等[2].
从更为一般的角度出发,对Web挖掘可以作如下形式化的定义[3]:
Web挖掘是指从大量Web文档的集合C中发现隐含的模式p.如果将C看作输入,将p看作输出,那么Web挖掘的过程就是从输入到输出的一个映射f:C→p.
⒉Web挖掘的主要类型
Web挖掘的研究主要有3种,即Web结构挖掘、Web使用挖掘和Web内容挖掘[4].
⑴Web结构挖掘
Web结构挖掘主要是指挖掘Web上的链接结构,它有广泛的应用价值.例如,通过Web页面间的链接信息可以识别出权威页面、安全隐患(非法链接)等.
⑵Web使用挖掘
Web使用挖掘主要是指对Web上的Log日志记录的挖掘.Web上的Log日志记录了包括URL请求、IP地址以及时间等的访问信息.分析和发现Log日志中蕴藏的规律,可以帮助我们识别潜在的客户、跟踪Web服务的质量以及侦探非法访问的隐患等.
该文来自 http://www.sxsky.net/zhengzhi/050810660.html
⑶Web内容挖掘
Web内容挖掘主要是对包含文本、声音、图片等的文档信息,以及Web链接结构信息的挖掘.其中,基于关 键 词的Web内容分析技术已经在文本挖掘(TextMining)和Web搜索引擎(SearchEngine)等相关领域得到广泛的研究和应用.
⒊Web挖掘的复杂性分析
面向Web的数据挖掘要比面向数据库和数据仓库的数据挖掘要复杂得多.这主要是因为Web上的数据结构是非常复杂的,Web挖掘必须面对下面一些关键问题[5-7].
⑴海量、异构的数据源环境
Web网站上的各种数据信息构成了一个非常庞大、非常复杂的异构数据源.如果要利用这种异构数据源进行数据挖掘,首先,必须要解决站点之间异构数据的集成问题;其次,还要解决Web上的数据查询问题,因为如果所需的数据不能很有效地得到,对这些数据进行分析、集成、处理就无从谈起.
⑵半结构化的数据结构
Web上的数据更多是半结构化的.面向Web的数据挖掘必须以半结构化模型和半结构化数据模型抽取技术为前提,为此,寻找一个半结构化的数据模型是解决问题的关键所在.除了要定义一个半结构化数据模型外,还需要一种半结构化模型抽取技术.每一站点的数据都各自独立设计,并且数据本身具有自述性和动态可变性.
⑶动态变化的应用环境
研究表明,一个Web站点的数据可能只有不超过1%的信息对特定挖掘主题是相关的,这些变数也是Web挖掘必须面对的问题.这些问题主要表现为:首先,Web的信息是频繁变化的,而且这种高变化也体现在页面的动态链接和随机存取上,像新闻、股票等信息是实时更新的;其次,Web上的用户是难以预测的,用户具有不同的知识背景、兴趣以及访问目的;最后,Web上的数据环境是高噪音的.
⑷高度综合的网络信息内容
Web挖掘的研究对象是网络信息.由于网络信息涉及各个学科门类,因而内容具有较大的综合性,要在丰富的内容中挖掘有规律的知识,其难度相当大.因此,要注意各种专业领域知识的应用,同时综合利用各种挖掘方法,不断提高知识发现的有效性.
⑸模糊、多样的用户目标
基于网络信息Web挖掘的用户类型较多,用户目的各自不同.许多用户往往对所要挖掘的主题只有模糊的、粗浅的认识,不能提出明确的目标.这就需要基于Web挖掘的知识发现系统具有一定的智能性和学习机制,不断地发现和跟踪用户的兴趣,并且清晰地表示知识发现的结果,从而提高知识发现的可用性.
⒋Web挖掘的处理流程
从典型的Web挖掘处理流程(如图1所示)可以看出,该流程主要包括如下几个步骤[8]:
⑴查找资源
查找资源的任务是从目标Web文档中得到数据,值得注意的是有时信息资源不仅限于在线Web文档,还包括电子邮件、电子文档、新闻组,或者网站的日志数据甚至是通过Web形成的交易数据库中的数据.
⑵信息选择和预处理
该步骤的任务是从取得的Web资源中剔除无用信息和将信息进行必要的整理.例如从Web文档中自动去除广告连接、去除多余格式标记、自动识别段落或者字段并将数据组织成规整的逻辑形式,甚至是关系表.
⑶模式发现
模式发现自动进行,可以在同一个站点内部或在多个站点之间进行.
⑷知识生成
该步骤验证、解释上一步骤产生的模式,从而产生有一定规则的相关知识.这个过程可以是机器自动完成,也可以是与分析人员通过交互操作来完成.
另外,Web挖掘作为一个完整的技术体系,在进行挖掘之前的信息获得(InformationRetrieval,IR)和信息抽取(InformationExtraction,IE)相当重要.信息获得的目的在于找到相关Web文档,它只是把文档中的数据看成未经排序的词组的集合;而信息抽取的目的在于从文档中找到需要的数据项目,它对文档的结构和表达的含义感兴趣,它的一个重要任务就是对数据进行组织整理并适当建立索引.
⒌Web挖掘的应用分析
目前,Web挖掘已经在很多方面发挥作用,如对搜索引擎的结构进行挖掘,确定权威页面,Web文档分类,WebLog挖掘,智能查询,建立MetaWeb数据仓库等;并且已经成功地应用到了银行、电信、网络零售、电子商务、客户关系管理等多个领域.
三、Web挖掘对于电子政务的必要性
电子政务作为一种新型的政府工作形式近几年取得了蓬勃的发展.但是,如何对大量的电子政务信息进行有效的组织利用,从中抽取用户感兴趣的模式,从而改进政府门户网站的结构或为用户提供个性化的服务,已经成为当前电子政务发展必须要解决的问题.这个问题的解决离不开一项重要的技术――Web挖掘技术.
Web挖掘在电子政务中主要用来为政府重大政策出台提供决策支持,例如,通过对网络各种经济资源的挖掘,确定未来经济的走势,从而制定出相应的宏观经济调控政策.再如,在经费拨款申请等类似问题上,容易出现欺诈行为,因此在各级上报的申请单据中,很难确定存在欺诈的单位以及具有
电子政务相关论文范文例文,与Web挖掘在电子政务中的应用相关论文下载参考文献资料: