本论文是一篇关于图像方面发表论文,关于结构化局部边缘模式下的文档图像分类处理相关在职毕业论文范文。免费优秀的关于图像及计算机科学及局部方面论文范文资料,适合图像论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。
摘 要:现代科学技术的快速发展,在一定程度上推动了文档图像分类处理工作的进步.结构化的局部边缘处理模式在文档图像处理工作方面得到了普遍的推广,该算法能够将邻域中的空间分布结构精确的描述出来,提高了图形文档的区分能力.本文通过试验的方式和HOG进行了对比,并对四种文档类型特征进行了分类,探究了结构化局部边缘模式下的文档图像分类处理.
关 键 词:结构化局部边缘模式;文档图像;模式分类
目前,文档图像具有很多种模式形态,其分类方法也多种多样.在过去,人们比较常用的分类方法是光学字符识别系统,该系统主要根据文本特征、结构特征、混合特征三种方法对文档进行识别分类,但是该分类方法的分类速度比较慢,对所处理图像解析度的要求比较高.因此,该方法逐渐被结构化局部边缘模式分类方法所替代.
1结构化局部边缘模式下处理图像分类的预备知识
文本管理工作主要包括:压缩、管理、归档、文本分析等,在进行文档工作处理的时候,相对准确的文档类型信息能够有效的提高文本检索的速度以及工作人员的工作效率.文档具有多种模式形态,每种形态都有自己的独特性以及形态之间的相似性.结构化局部边缘模式的使用,不仅可以实现对图像分割模式的自由调节,还能够有效的提高文档图像特征提取的准确性,在使用结构化局部边缘模式进行文档图像特征提取的时候,采用的是图像区块之间重叠的方法,通过这种方式有效的确保图像分割区域特征本身的连贯型性.
2采用结构化局部边缘模式下,文档图像分类特征的提取
本文在对结构化局部边缘模式下文档图像分类处理的研究中,进行分类对比采用的是HOG.结构化局部边缘系统通过LEP特征,根据图像像素邻域的边缘方向进行了相关的编码.文档图像本身特征就比较明显,例如影像图片的像素数值变化比较大;一般学术论文的格式比较规整且字数比较多;灰度图像之相似性比较大,没有明显的规律可循;表格文件的特征性比较明显,横线和竖线比较多;PPT幻灯片的图像、文字等变化性比较明显,但是在排版方面具有一定的规律可以遵循,为了方便结构化局部边缘模式在处理文档图像方面的研究工作,上述几种图像类型的边缘信息都比较明显.
本篇论文url:http://www.sxsky.net/benkelunwen/06092534.html
3结构化局部边缘模式和HOG的主要特征
3.1模式分类框架
文中在进行结构化局部边缘模式下,文档图像的分类处理研究中,还没有形成一一个完整通用的基准数据库进行相关的实验研究,并且受其它因素的限制也比较明显.所以,本文在进行处理研究的时候,通过综合对比研究选取了含有5000张图像并具有四种文档图像类别,每种类型都包含1250张图像,类型包括:影像图片、学术论文、PPT幻灯影片以及含有表格的文件.另外,在进行文档图像处理研究时,图片都是随机获取的.
3.2结构化局部边缘模式的特征描述
结构化局部边缘模式主要是利用计算机模拟技术对对视觉、图像等进行处理,在使用的过程中,根据图片中重复出现的不同pixel,并将其按照不同的方向延伸成九宫格的形状作为参考的重点.在模式计算的过程中,首先要获取到原始的边缘图像,并建立一个3*3的邻域窗口,在这一过程中,文本会被分为比较小的空间区块,其计算方式为:结构化局部边缘模式(SLEP)等于Ni/N,i等于0,1,2,等31,其中结构化边缘模式的变化范围是在0到31之间,Ni中的i代表的是pixel的数目,n代表的是piexl的总数目.
有关论文范文主题研究: | 图像类论文范文 | 大学生适用: | 本科论文、研究生论文 |
---|---|---|---|
相关参考文献下载数量: | 84 | 写作解决问题: | 写作参考 |
毕业论文开题报告: | 论文模板、论文摘要 | 职称论文适用: | 期刊目录、职称评中级 |
所属大学生专业类别: | 写作参考 | 论文题目推荐度: | 免费选题 |
3.3HOG的特征描述
HOG特征是目前人们比较常用的图像特征提取方法,该方法在计算的时候选取的是320*256的图像区域,在此基础上,把区块的大小划分为32*32,其中九宫格的大小为16*16,将九宫格的每一格作为最基本地计算单元,然后进行相关的串联计算.方法步骤如下.第一,可以对图像进行卷积处理,目的是了解图像中像素的梯度以及方向变化,一般将范围值控制在[-1,0,1]或者是[1,0,-1].第二,对每个格子进行量化处理,角度量化的范围值是[0,180],然后根据每个像素的模建立九维方向角直方图.第三,把区块内部各格子之间的直方图进行串联处理,然后组成36维直方图的特征向量.第四,把所有的特征向量串联在一起,就会形成最后的直方图特征向量.
4结构化局部边缘模式的处理分析
在对上述四种类型的图像特征进行信息提取研究以后,了解到在进行图像分析的过程中,图像的解析度分别为:80*64,160*128,这组数据说明和HOG相比,结构化局部边缘模式在运用过程中性能效果比较好,分辨率也比较高.这说明结构化局部边缘系统在不适用OCR系统的条件下,也具有高质量的文档图像分辨率.当图像大小为80*64,文档图像的类别为影像照片以及规范化的学术论文的时候,SLEP测试效果要比HOG高0.1到1.6个百分点,但是当进行表格文件处理的时候,