基于CEP和LPC谱提取语音信号基音周期的方法

| 浏览次数:

摘 要:在语音信号分析中,只有分析出可表示语音信号本质特征的参数,才有可能利用这些参数进行高效的语音通信、语音合成和语音识别等处理。因此对语音信号采用CEP和LPC谱提取语音信号基音周期的异同进行了研究,并采用Matlab实现了仿真分析。从中可以看出,LPC谱估计基音周期的算法运算量较大,而CEP 谱算法更直观,且在少部分情况下基音峰会变得更突出一些, CEP谱具有更加广阔的应用前景。

关键词:同态分析;线性预测分析(LPC);基音周期;Matlab

中图分类号:TP274文献标识码:A

文章编号:1004-373X(2009)20-150-02

Speech Signal Extraction Method of Pitch Based on CEP and LPC Spectrum

MA Ying,SHI Xiaorong,LI Haixin

(Qinghai Nationality College,Xining,810000,China)

Abstract:In voice signal analysis,by analysing the voice signal substantive characteristics′ parameter,these parameters can be used to carry on high effective processing and voice communication,speech synthesis and speech recognition.Therefore,difference between speech signal extraction of pitch by CEP and speech signal extraction of pitch by LPC spectrum are analysed,and Matlab is used to realize the simulation analysis.LPC spectrum is used toestimate tone cycle"s algorithm which has big calculation,but the CEP spectrum algorithm is more direct-viewing,and the tone summit becomes prominent,CEP spectrum has widely application prospect.

Keywords:analysis of same state;LPC;pitch;Matlab

0 引 言

语音信号的分析,就是提取语音产生模型的各种参数(语音的特征参数),应用于语音的编码、识别和合成等。不论是分析怎样的参数以及采用什么分析方法,在按帧进行语音分析,提取语音特征参数前,有一些经常使用的、共同的短时分析技术必须预先进行,如语音信号的数字化、预加重、加窗和分帧等。经过这些处理,语音信号就被分割成一帧一帧加过窗函数的短时信号,然后再把每一个短时语音帧看成平稳的随机信号,利用数字信号处理技术提取语音特征参数。

在进行处理时,按帧从数据区中取出数据,处理完后再取下一帧。最后得到由每一帧参数组成的语音特征参数的时间序列。基音周期是语音信号最重要的参数之一,它描述了语音激励源的一个重要特征。因为汉语言是一种有调语言,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息,有区别意义的功能,所以基音周期的提取和估计对汉语言更是一个十分重要的问题。

1 同态分析

1.1 同态信号处理的原理

同态信号处理也称为同态滤波,实现将卷积关系和乘积关系变换为求和关系的分离处理。将非线性信号处理变为线性信号处理的过程。语音信号x(n)可视为声门激励信息u(n)及声道冲击响应h(n)的卷积:x(n)=u(n)*h(n);通过处理可将语音信号的声门激励信息及声道冲击响应信息分离开来,从而求得声道共振特征和基音周期。卷积同态系统可分为三个子系统[3]:

第一个子系统特征系统D*[] 完成将卷积信号转化为加性信号的运算,对x(n)=x1(n)x2(n)进行如下处理:

Z[x(n)]=X(z)=X1(z)X2(z)(1)

ln X(z)=ln X1(z)+ln X2(z)=

1(z)+2(z)=(z)(2)

Z-1[(z)]=Z-1[1(z)+2(z)]=

1(n)+2(n)=(n)(3)

第二个子系统对加性信号进行所需要的线性处理(满足线性叠加原理等):

(n)=LTI[(n)]=LTI[1(n)+2(n)]

第三个子系统是逆特征系统D-1*[],使其恢复为卷积性信号。对(n)=1(n)+2(n)进行如下处理:

Z[(n)]=(z)=1(z)+2(z)(4)

exp[(z)]=Y(z)=Y1(z)Y2(z)(5)

y(n)=Z-1[Y1(z)Y2(z)]=y1(n)y2(n)(6)

1.2 倒谱

设X(ejω)=|X(ejω)|ejarg[X(ejω)],对其取对数得:

(ejω)=ln|X(ejω)|+j arg[X(ejω)]

(ejω)仍然是复数,只考虑其实部。令:

c(n)=IDTFT[ln|X(ejω)|]

c(n)=IDFT[ln|X(k)|]

式中:c(n)是序列x(n)对数幅度谱的傅里叶逆变换,称为倒频谱,简称为倒谱,有时也称为对数倒频谱,其量纲为时间。c(n)就是要求取得语音信号倒谱特征[4]。因此,设信号为s(n),则其倒谱为:

c(n)=IDFT{ln|DFT[s(n)]|}

1.3 倒谱的作用

倒谱的作用为:

(1) 区分清/浊音;

(2) 求浊音的基音周期,可以得到浊音的激励信号;

(3) 得到声道冲击响应[5]h(n)。

2 基于LPC系数的倒谱

由于语音样点之间存在相关性,所以可以用过去的样点值预测现在或未来的样点值。这是线性预测分析的基本思想。通过使实际语音x(n)和线性预测结果x′(n)之间的误差e(n){e(n)=x(n)- x′(n)} 在某个准则下达到最小值来决定惟一的一组预测系数ak。这组系数就能反映语音信号的特性,可以作为语音信号特征参数用于语音编码、语音合成和语音识别等应用中去。语音信号的倒谱特征系数与语音信号的LPC参数有密切关系。LPC系数是线性预测分析的基本参数,它可以表示整个LPC系统冲激响应的复倒谱。

预测误差e(n)就是激励信号G•u(n),预测系数{ak}就是声道滤波器的系数{dk}。线性预测分析可以对生成模型的增益参数G和滤波器系数{dk}进行直接和高效率的计算。这样,结合清浊音的判断和基音周期的估计,可得到语音信号生成模型的全部参数,实现语音的产生。

3 Matlab仿真及基音周期提取

具体步骤如下:

(1) 打开Matlab软件,在命令窗口中利用wavread函数打开语音信号的波形文件,得到抽样频率fs,n bits的值以及语音信号的二维图形。实验仿真是对一男声“沙地”的语音信号进行分析,其采样频率为8 kHz[6]。

(2) 对该语音信号截取一帧的长度,帧长为20 ms。

(3) 定义窗函数,在此选用汉明窗。

(4) 对截取的一帧语音信号AMP(见图1)进行加窗处理。

图1 一帧语音信号

(5) 对截取加窗后的一帧语音信号AMP进行CEP和LPC谱分析,观察波形图,估计基音周期。如图2,图3所示。

图2 LPC谱

图3 CEP谱

4 LPC谱(左)和CEP谱(右)的讨论

对一帧语音信号做CEP谱和LPC谱都能准确地分析出语音信号的基音周期。LPC谱图波峰位置恰好对应CEP谱图中的波谷位置;波形基本上关于横轴对称;LPC谱估计基音周期,可以采用离开原点的第一个波谷出现的样值点除以采样频率;而用CEP谱图估计基音周期,可以采用离开原点的第一个波峰出现的样点值除以采样频率[7]。

但是,在语音信号分析过程中窗长的选择对于语音特征参数的选择是非常重要的,如果窗长很大,当语音信号通过时,反映波纹细节的高频部分被阻碍,短时能量随时间变化很小,不能真实地反映语音信号的幅度变化;反之,窗长太小,短时能量随时间有急剧的变化,不能得到平滑的能量函数,因此应该根据不同的需要选择合适的窗长,否则提取特征参数会产生很大的误差[8]。

此外,采用LPC谱估计基音周期的方法,其算法的运算量较大,而CEP 谱算法简单,概念更直观,且在少部分情况下基音峰会变得更突出,基音周期的估计值更加准确;在实际的基音周期检测算法中,CEP谱的应用更为广泛,因此基于CEP谱的改进算法是进一步需要研究的理论。

参考文献

[1]陈洪立.一种基音周期估计方法[J].江西通信科技,2004(2):8-10.

[2]王文延,曾庆宁.一种噪声环境下的语音端点检测方法[J].声学技术,2007,26(3):435-441.

[3][美]夸特尔瑞.离散时间语音信号处理(原理与应用)[M].赵胜辉,译.北京:电子工业出版社,2000.

[4]王洪海,刘刚,郭建军.基于滑动倒谱的自动语言识别[J].智能系统学报,2008(4):336-341.

[5]李跃强,孙星明,周天亮.基于复倒谱变换的数字音频水印研究[J].计算机工程,2006,32(23):145-148.[6]丛玉良.数字信号处理及其Matlab实现[M].北京:电子工业出版社,2004.

[7]拉宾纳,谢弗.语音信号数字处理[M].朱雪龙,译.北京:科学出版社,1993.

[8]刘建,郑方,吴文虎.基于混合幅度差函数的基音提取算法[J].电子学报,2006,34(10):1 925-1 928.

[9]周文,侯阿临.基于自适应滤波和小波变换的基音检测[J].电声技术,2006,30(10):41-43.

[10]欧贵文,程新荣,杜剑峰.一种基于时域的基音周期提取方法[A].第五届全国人机语音通讯学术会议论文集[C].1998.

推荐访问: 基音 提取 周期 语音 信号

【基于CEP和LPC谱提取语音信号基音周期的方法】相关推荐

工作总结最新推荐

NEW
  • XX委高度重视党校的建设和发展,出台《创建全省一流州市党校(行政学院)实施方案》及系列人才培养政策,为党校人才队伍建设提供了有力的政策支撑。州委党校在省委党校的悉心指导下、州委的正确领导下,深入贯彻落

  • 为推动“不忘初心、牢记使命”主题教育常态化,树牢“清新简约、务本责实、实干兴洛”作风导向,打造忠诚干净担当、敢于善于斗争的执纪执法铁军,经县纪委常委会会议研究,决定在全县纪检监察系统开展“转变作风工作

  • 为进一步发展壮大农村集体经济,增强村级发展活力,按照中共XXX市委抓党建促乡村振兴工作领导小组《关于印发全面抓党建促乡村振兴四个工作计划的通知》要求,工作队与村“两委”结合本村实际,共同研究谋划xx村

  • 今年来,我区围绕“产城融合美丽XX”总体目标,按照“城在林中,水在城中,山水相连,林水相依”以及“城乡一体、景城一体、园城一体”的建设思路,强力推进城市基础设施建设、棚户区改造、房地产开发和城市风貌塑

  • 同志们:新冠疫情发生至今已有近三年时间。三年来,在广大干群的共同努力下,我们坚决打好疫情防控阻击战,集团公司范围内未发生一起确诊病例,疫情防控工作取得了阶段性胜利。当前国际疫情仍在扩散蔓延,国内疫情多

  • 我是毕业于XX大学的定向选调生,当初怀着奉献家乡、服务人民的初心回到XX,在市委的关心关爱下,获得了这个与青年为友的宝贵历练机会。一年感悟如下。一要对党忠诚,做政治坚定的擎旗手。习近平总书记指出,优秀

  • 同志们:今天召开这个会议,主要任务是深入学习贯彻习近平总书记重要指示批示精神,以及李克强总理批示要求,认真落实全国安全生产电视电话会议和全省、全市安全生产电视电话会议精神,研究我县安全生产和安全隐患大

  • 2022年市委政研室机关党的建设工作的总体要求是:坚持以XXX新时代中国特色社会主义思想为指导,全面贯彻党的XX届X中X会和省、市第十二次党代会精神,自觉运用党的百年奋斗历史经验,弘扬伟大建党精神,深

  • 同志们:今天,我们在这里召开市直机关基层党建示范点工作会议,一方面是对各示范点单位进行表彰授牌,另一方面是想通过这种会议交流的方式,给大家提供一个相互学习、取长补短的平台和机会。市直工委历来把创建基层

  • 新冠疫情暴发以来,学校党委坚决贯彻习近平总书记关于疫情防控工作的指示要求和党中央的决策部署,严格执行×××部、×××厅关于疫情防控的系列要求,认真落实驻地防疫部门的工作举措,继承发扬优良传统,以最高标