基于贝叶斯的DEM地形分类方法研究与应用
作者:未知【摘要】为了针对DEM数字高程模型(DigitalElevationModel)地形因子分析中存在的不确定性、多样性、地形分布复杂性等特点,提出一种基于相对信任度的贝叶斯算法用于DEM地形分类。提出了基于互信息相对可信度的特征选择方法,用基于互信息的相对可信度R作为衡量标准进行特征选择,以删除冗余属性;把R作为权值引入到贝叶斯分类算法中,从而得到改进后的贝叶斯算法。该方法通过对坡度、坡向、山脊线、山谷线地形因素特征提取和DEM分类算法的应用,为地形研究和考察评价提供了一种新的可靠的预测分类方法。
【关键词】数字高程模型;坡度;预测分类
数字高程模型(DigitalElevationModel,DEM)[1]包含了丰富的地形、地貌、水文信息,它能反映各种分辨率的地形特征,通过DEM可以提取大量的地表形态信息[2]。
传统贝叶斯方法[3]在DEM地形分类和预测应用[4]中存在一些不足之处。主要从以下两个方面进行阐述。
(1)没有考虑DEM中地形属性如坡向,坡度等不确定分析受到对不同地形分类如丘陵、平原地区影响;
(2)没有考虑如坡度同一地形属性[5]对于具体地形分类准确率的影响;对于地形分类,如果地形属性所占比例越多,一般情况下,属性个数越多地形分类的准确率就越高,但是地形属性个数越多,地形分类的效率就越低。
因此,需要针对传统贝叶斯算法的不足以及DEM地形数据的特点,寻找一个有效的算法,基于此基础本文提出一种基于相对信任度[6-8]的贝叶斯算法用于DEM地形分类。并且利用该方法对DEM坡度、坡向、山脊线、山谷线地形因素进行数据分析,为地形研究和考察评价提供了一种新的可靠的预测分类方法。
一、算法描述
朴素贝叶斯算法是通过计算后验概率的方法来确定样本所属类别的概率,基本思想是基于概率论中的贝叶斯公式和简化假设,采用属性和类别的联合概率来估计新样本的类别。
如果Aj是分类属性,P(xj|Ci)等于类别为Ci的训练样本中属性Aj等于xj的比例[1]。
从理论上分析,朴素贝叶斯比其他分类算法如决策树、SVM等具有更好的分类精度,但是贝叶斯分类模型在对样本进行分类时没有考虑属性不同时对分类所起作用不同,冗余的数据属性会提高数据的维数,增加分类计算量和带来噪声影响,造成分类准确率的下降。
二、算法设计
基于相对信任度贝叶斯算法在对DEM地形属性数据进行不确定分析和预测分类时候,具体算法流程如下所述。
Stpe1:对原始DEM地形?傩允?据进行预处理,如:离散化处理和空值处理。
Stpe2:对于训练坡度,坡向等DEM数据属性样本,用上述算法公式计算每个属性Ai分类的相对可信度Ri(1≤i≤N),并把Ri由大到小进行排列,选取前K个属性作为最佳属性,删除排在后面的(N-K)个属性,得到特征选择后的一个新属性集合B={B1,B2,…,BK}。K是人为预定的一个整数,作为所选特征属性的个数。
三、DEM地形预测分类系统
为了弄清DEM预测分类系统的信息处理工作,哪些与系统有关,哪些与系统无关,就必须了解组织的业务流程。因此提供信息的时间和信息形态等有关调查情况并用“业务流程图”来表示。
基于贝叶斯DEM预测分类系统需要大量数据为支撑,一般收集或实测的资料格式多种多样,数据的存储需要对数据进行格式统一。本文是通过对数据归类统一,建立基础数据库,基础数据库包括属性数据库和空间属性数据库两类。在进行数据库设计时,通过数据分层、图层管理、属性编码和空间索引设计,建立空间数据库,然后进行属性数据库设计,最后建立空间数据库与属性数据库的连接关系。
四、性能测试和分析
(一)测试模型
本文针对改好后的基于相对信任度的贝叶斯算法在实际系统应用情况进行测试,在测试中对DEM地形模型中的属性坡向,坡度以及山谷线,山脊线作为分类属性,对它们进行特征提取,根据分析结果对地形进行分类测试。
(二)时间性能测试
把改进的基于相对信任度的贝叶斯算法和传统贝叶斯算法进行在DEM预测分类过程中的时间复杂度进行时间性能分析。
改进后的基于相对信任度的贝叶斯算法和传统贝叶斯算法在DEM地形分类,坡度,坡向以及其他DEM属性进行预测分类过程中耗费时间都有所提高。
(三)准确率性能测试
评测DEM地形分类准确率,是贝叶斯算法优劣的一个很重要的指标,其定义如下:
改进后的基于相对信任度的贝叶斯算法和传统贝叶斯算法在DEM地形分类,坡度,坡向以及其他DEM属性进行分析过程中准确率都有所提高。
五、总结
本文在结合前人优势的基础上,提取的坡度等地形属性数据进行分析,提出一种基于相对信任度的贝叶斯算法用于DEM地形分析,通过具体的实验结果对上述改进后贝叶斯算法进行验证,从DEM分类准确率和时间性能进行建模比较,验证了改进后贝叶斯算法的可行性和合理性。
参考文献:
[1]汤国安,刘学军,房亮,罗明良.DEM及数字地形分析中尺度问题研究综述[A].武汉大学学报(信息科学版),2006(12).
[2]汤国安,陶阳,王春.等高线套合差及在DEM质量评价中的应用研究[B].测绘通报,2007(7).
[3]ZhouQiming,LiuXuejun1AnalysisonerrorsofderivedslopeandaspectrelatedtoDEMdataproperties1.ComputerandGeoscience,2004,(30).
StateUniversityofNewYorkCollegeofEnvironmentalScienceandForestry,Syracuse,NewYork,1999.