当前位置 —论文本科论文— 范文

关于网址论文范文集,与基于决策树的二维码恶意网址检测方法相关论文查重软件

本论文是一篇关于网址论文查重软件,关于基于决策树的二维码恶意网址检测方法相关专升本毕业论文范文。免费优秀的关于网址及恶意及信息安全方面论文范文资料,适合网址论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。

号(Symbol)、是否为恶意网址(Oute),并将其表示为向量形式.

3.3决策树算法训练流程

决策树的总体训练过程如图1所示.

1)设S是s个数据样本的集合.假定类标号属性具有m个不同值,定义m个不同类Ci(i等于1,2,...,m).设si是类Ci中的样本数.对一个给定的样本分类、所需要的期望信息如下:

I(s1,s2,...sm)等于-pilogpi

其中pi是任意样本属于Ci的概率,并用估计.

2)设属性A具有v个不同值{a1,a2,...,av}.用属性A将S划分为v个子集{S1,S2,...,Sv},设Sij是子集Sj中类Ci的样本数.由A划分成子集的熵表示如下:

E(A)等于i(S,S,...,S)

3)在A分枝将获得的信息增益表示为:

Gain(S,A)等于i(S,S,...,S)-E(A)

4)用信息增益率进行属性选择,信息增益率定义为:

GainRatio(S,A)等于

分裂信息SplitInfo(S,A)代表了按照属性A分裂样本集S的广度和均匀性.分裂信息定义如下:

SplitInfo(S,A)等于-log

其中,S1到Sc是c个不同值的属性A分割S而形成的c个样本子集.

3.4决策树算法的种类选择

目前决策树的典型算法有ID3、C4.5、CART、J48等,不同的决策树会影响系统判别的准确度.

首先对建立好的训练集进行预处理,即对非数值型的属性进行离散化,并优化属性.之后对训练集进行分类回归,采取十折交叉验证的方法,将数据集分成10份,轮流将其中9份做为训练数据、1份做为测试数据进行实验.每次实验都会得出相应的正确率,将10次结果正确率的平均值做为对算法精度的估计.运用不同的决策树算法进行训练,根据设置的实例情况,共选择了10种决策树进行对比分析,实验结果如图2所示.结果表明,J48决策树算法的正确率最高,所用的属性集为最优的属性组合,其正确分类比例为94.96%.

3.5不同属性组合的选择

不同的属性组合同样对预测结果产生很大影响.为提高算法的速度和精度,避免对一些作用小的属性进行分析而增大系统负荷,选择不同属性组合进行测试,得到最优的属性组合.参考测试决策树算法时每个决策树最后形成的决策树中的属性,对12个属性进行不同的组合,测试不同组合利用J48决策树算法的正确率.表1所示的测试结果说明,第8行属性组合、即(name、length、dot、Ip1、Ip2、Ip3、Ip4、prefix)的正确率最高,且形成决策树的时间最短.

4实验结果与分析4.1实验环境

系统的应用环境分为服务器、PC客户端、智能手机客户端,网络环境包括联通或移动3G网络、WiFi、校园无线局域网、校园LAN等.

利用weka工具实现智能算法,算法中的重要参数设置如下:为正规网址和恶意网址,划分为12,设为126,不同的属性值v的取值不同,训练集与测试集交叉验证重叠数为10.


大学生如何写网址论文
播放:34164次 评论:5091人

4.2结果与分析

实际检测中,二维码恶意网址数据取自近一个月的瑞星安全日报共计66个,正规网址数据取自hao123网址大全共计60个.126个实验数据有7个返回错误的结果,测试准确率为94.5%.60个正规网址实验数据,有5个返回错误的结果,误报率为8.4%.66个二维码恶意网址测试数据,有2个返回错误的结果,有17个URL失效,49个URL有效,漏报率为4.0%.

相同的测试内容使用“快拍二维码”进行测试,126个测试数据测试准确性为71.5%,66个二维码恶意网址实验数据有36个返回错误结果,漏报率为54.5%.60个正规网址实验数据,没有返回错误结果,误报率为0%.

本系统产生误报的原因在于选取的正规网址大部分是小网站、游戏网站,其某些URL特征跟恶意网站网址的特征类似.本系统漏报率只有4.0%,说明本系统对于未知的恶意网址的判别率很高.由于“快拍二维码”使用的是黑名单技术,对于未知的恶意网址判别率非常低.实验数据表明,本系统对二维码恶意网址检测具有良好的效果.

5结束语

目前,手机等移动端的计算能力相对于PC机尚有差别,专门针对手机的恶意网址检测方法不多,基本采用专家系统规则匹配方法.本文面向二维码中URL,提出二维码恶意网址决策树智能检测方法.利用恶意网址和正规网址,提取网址URL特征,构建特征向量,经过反复训练,构建址决策树,进一步对网址特征提取及决策树选择进行了测试优化,最终形成用于检测二维码恶意网址的决策树算法.运用WebService技术实现跨平台的恶意网址智能检测系统.实例测试结果表明系统在对恶意网址识别的响应速度和准确率方面取得了较好的效果.

参考文献

[1]许统.手机二维码在国内的发展及应用[J].电脑与信息技术,2011,19(3):62-63.

[2]刘晓.五大威胁危害网络安全[J].保密科学技术,2013,7:68.

[3]徐国辉,陈婕娴.手机二维码技术原理及应用[J].信息与电脑,2013,1(1):18-19.

[4]ZhuangW,JiangQ.Intelligentanti-phishingframeworkusingmultipleclassifiersbination[J].JournalofComputationalInformationSystems,2012,8(17):7267-7281.

[5]JustinMa,,LawrenceK.Sauletal.BeyondBlacklists:LearningtoDetectMaliciousWebSitesfromSuspiciousURLs.Proceedingsofthe15thACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDatamining.2009.

[6]唐迪,孙瑞志,向勇等.基于Web服务的异构工作流互联接口设计[J].计算机应用,2013,33(6):1650-1653,1712.

[7]黄宇达,范太华.决策树ID3算法的分析与优化[J].计算机工程与设计,2012,33(8):3089-3093.

[8]HallM,FrankE,HolmesG,etal.Thewekadataminingsoftware:anupdate[J].SIGKDDExplorations,2009,11(1):10-18..

基金项目:

1.北京市属高等学校人才强教计划资助项目[PHR201106133].

2.北京市教委教育教学-本科生科学研究计划项目[PXM2012_014224_000055].

作者简介:

赵刚(1965-),男,博士,副教授,现任职于北京信息科技大学信息管理学院;主要研究方向和关注领域:信息安全、人工智能.

王碰(1994-),女,现就读于北京信息科技大学信息安全专业.

1 2

关于网址论文范文集,与基于决策树的二维码恶意网址检测方法相关论文查重软件参考文献资料:

自考本科毕业论文报名时间

北大函授本科

北航本科

自考本科试点

远程函授本科

自考本科报考时间

自考本科论文答辩流程

自考本科考什么科目

本科毕业论文枪手

本科自考有哪些科目

基于决策树的二维码恶意网址检测方法(2)WORD版本 下载地址