关于数据库论文范文素材,与基于动词相似度的特征分类方法相关本科毕业论文范文
本论文是一篇关于数据库本科毕业论文范文,关于基于动词相似度的特征分类方法相关本科论文范文。免费优秀的关于数据库及特征及说话方面论文范文资料,适合数据库论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。
【摘 要】本文提出了一种新的说话人特征分类方法,基于计算动词相似度理论,建立距离和趋势的评价模型,通过计算特征向量与k-means算法聚类所得的聚类中心的相似度矩阵,将说话人个性特征从MFCC特征域映射到说话人相似度属性空间中,形成新的特征向量集,这样,每个说话人的特征向量将被聚为在距离和变化趋势上最具相似性的k分类.之后,利用GMM模型在属性空间内进行联合概率分析、匹配,建立新的说话人识别系统.本文采用标准TIMIT语音库与NIST语音库在该识别系统中进行一系列实验,结果表明,该基于新的优化特征分类的识别系统,对比传统的说话人识别系统,在等错误率上有很好的提高.
【关 键 词】计算动词相似度;特征分类;GMM模型;说话人识别
AFeatureClassificationMethodBasedonVerbSimilarity
JingyunQiu,LinLi
(DepartmentofElectronicEngineering,XiamenUniversity,XiamenFujian361005,China)
Abstract:Anewstrategyoffeatureclassificationmethodforspeakerrecognitionbasedonputationalverbsimilarityispresented.Ontheevaluationmodelwiththesimilarityfunctionofbothdistanceandtrendinmelcepstraldomain,thenewfeaturevectorsetswereassortedafterparingclusteringcenters,whichwereobtainedbyutilizingk-meansalgorithm.Asaresult,thefeaturevectorsofeachspeakerwereclassifiedintokclusters,andthevectorsineachclusterhadthemostsimilarityinbothdistanceandvariationtrend,butseparatedthoseinotherclusters.Moreover,anewspeakerverificationsystemwasestablishedbyusingGMMmodelforanalyzingandmatchingthejointprobabilityinthenewfeatureclassificationspace.TheexperimentswiththestandardTIMITdatabasesandNISTdatabaseswereimplemented,andtheresultsshowedtheproposedalgorithmachievedgoodclassificationperformance.
该文转载于 http://www.sxsky.net/benkelunwen/060276687.html
Keywords:putationalverbsimilarity;featureclassification;GMM;speakerrecognition
1.引言
对于说话人识别系统而言,一个能有效区分说话人的特征提取和分类方法是非常重要的,因而,在语料中找到能够表征说话人的个性特征及其特定的特征映射空间就显得尤为重要.目前,大多数说话人识别系统所采用的特征参数主要有:表征说话人听觉特性的梅尔频率倒谱系数(MelFrequencyCepstrumCoefficient,MFCC)[1]和表征说话人声道信息的线性预测倒谱系数(LinearPredictionCepstrumCoefficient,LPCC)[2],二者都是说话人识别系统中的主流特征分析方法,并应用于模型匹配如隐马尔可夫模型(HMM,HiddenMarkovmodels)[3]、高斯混合模型(GMM,GaussianMixturemodels)[4].
近年来,为了提高说话人识别系统的性能,在MFCC和LPCC的基础上还增加了一些辅助特征参数,如harmonic结构特征[5]、残差相位信息[6]、高阶统计特征等.相对于众多的谱分析方法,MFCC特征参数符合人耳听觉特性,较好的反映说话人的个性特征,但这种传统的MFCC特征参数包含了大量的冗余信息,在噪声环境下识别性能很不稳定.因此,很多人在特征映射空间和分类器上做了很多改进,如,McIntyre[7]提出一种改进的GP(GeicProgramming)多重分类器,能在增加训练说话人的同时减少系统的训练时间并优化系统的性能.TaoBan[8]提出的分类器是通过构造决定函数的最小距离准则,将单分类器转为多重分类器进行分类.在这些方法都一定程度上改善了特征参数的缺点.
在传统的说话人识别系统的识别阶段,多样化的识别模型被广泛的应用于识别系统中,主流的如矢量量化(VQ,VectorQuantization)[9]、高斯混合模型(GMM)、隐马尔可夫模型(HMM)、支持向量机模型(SVM,SupportVectorMachines)[10]、神经网络(NN)[11]以及混合模型等.
本文提出了一种新的说话人特征分类方法.在传统MFCC特征向量的前提下,结合一阶二阶特征形成一个新的MFCC动态加权参数,之后,采用计算动词相似度理论,将新的动态加权MFCC参数集从传统的梅尔倒谱域映射到一个新的空间,称为“相似度属性空间”,主要由梅尔倒谱域中原参数的距离相似度和变化趋势相似度联合确定.这种参数空间映射首先针对单个或多个说话人分析其特征参数(N维),提取M个共性特征中心作为该说话人属性空间的基坐标(2M 本文的第二部分介绍的是改进算法的核心部分:相似度映射的概念及其应用于说话人识别系统;第三部分是在GMM基础上将核心算法结合动态MFCC特征参数并仿真实验,并对实验结果进行分析.最后是结论. 2.特征参数相似度映射 2.1计算动词相似度定义 计算动词相似度(简称动词相似度)[12][13],是综合考虑频率、距离、趋势、幅值等,作为测量模板特征向量与待测特征向量之间的比较因子,得到一个评估二者相似程度的值,即为相似度. 采用动词相似度的概念,我们可以只考虑能够区分不同说话人的个性特征方面,如频率分布、曲线形状近视程度、二次谱特征等,而忽略掉说话人语音中共性之处,如背景噪音和声道噪声等,最大限度的区分不同说话人,而转换得到的空间,则是后期模型匹配所在的相似度属性空间. 首先,假设有两个特征向量集,其中, (1) 则二者间的相似程度计算函数,应该满足: (2) 其中,为的距离,除了可以利用传统的距离测度外,还可以考虑人类直觉的各类因素如距离、趋势、频率等等,形成复合型的计算动词相似度: (3) 其中: 表示相似度中两个计算动词间的距离比较; 表示相似度中两个计算动词间的趋势比较; 表示相似度中两个计算动词间的频率比较; 等 在本文中,根据说话人识别系统的特点,拟用了距离测度和趋势比较两个方面作为相似度计算函数,其中是调节因子: (4) 其中采用的是欧式距离测度,则是趋势测度: (5) (6) 由大量的实验测试结果可得出,取经验值等于1.6~1.8,等于1.6~2.0时,识别精度最好. 2.2相似度映射应用于说话人识别系统 首先,假定有m个待训练说话人样本,经过预处理后变换到mel倒谱域,得到大小为M的MFCC语音特征向量集,假定其维数为N,并采用动态MFCC及其一阶二阶信息,这样,我们可以得到维特征向量: (7) 其次,采用k-means聚类算法,将已获得的特征向量聚为可表征说话人特征的L类,作为计算相似度的基本坐标向量: (8) 将L个码书作为相似度空间的基坐标向量,由相似度计算函数(4),将维特征向量通过计算距离测度和趋势测度映射到由确定的属性空间内.这样,即可得到维的相似度矩阵: (9) 由此,对待测训练样本建立独立的属性空间后,根据比较待训练语音的每个特征向量与基本坐标向量之间的相似度值,将所有特征向量归类于不同的基本坐标向量所属类中,即可得到L类: (10) 其中,为第i类,聚类数目L由GMM阶数决定.通过计算,便可以得到GMM模型的输入参数: (11) 其中,为第i类的均值特征向量,为第i类į 关于数据库论文范文素材,与基于动词相似度的特征分类方法相关本科毕业论文范文参考文献资料: