基于线性预测下的语音信号合成

时间：2025-04-25

基于线性预测下的语音信号合成

第31卷总第80期西北民族大学学报(自然科学版)

2010年12月 JournalofNorthwestUniversityforNationalities(NaturalVol.31,No.4

Science)Dec,2010

基于线性预测下的语音信号合成

贺艳平

(西北民族大学电气工程学院,甘肃兰州730030)

[摘要]线性预测编码(LinearPredictiveCoding)是实现语音编码的一项重要技术1通过对语音信号和LPC的研究,介绍了语音信号的线性预测分析原理,详细分析用来求解线性预测方程的自相关法和计算方法,并用Matlab对实际语音信号进行线性预测编码实验1实验结果表明,应用LPC法合成的语音信号误差小、计算简单、合成速度快1

[关键词]线性预测编码;自相关法;语音编码;Matlab

[中图分类号]TN92 [文献标识码]A [文章编号]1009-2010(2010)04-0043-05

0 引言

语音合成是当前语音领域里一个非常热门的方向,随着人工智能和计算机技术的发展,人们期待着以语音方式进行人机交流1语音合成系统又称为文语转换(Text-To-Speech,TTS)系统,即从文字到语音的转换系统1由人工通过一定的机器设备产生出语音称为语音合成(SpeechSynthesis)[1]1语音合成是人机语音通信的一个重要组成部分1语音合成的目的是制造一种会说话的机器,它解决的是如何让机器像人一样说话的问题,使一些以其他方式表示或存储的信息能转换为语音,让人们能通过听觉而方便地获得这些信息1

语音合成从技术方式讲可分为波形编辑合成、参数分析合成以及规则合成等三种[2]1波形编辑合成,这种合成方式以语句、短语、词或音节为合成单元,这些单元被分别录音后直接进行数字编码,经适当的数据压缩,组成一个合成语音库1重放时,根据待输出的信息,在语料库中取出相应单元的波形数据,串接或编辑在一起,经解码还原出语音1

参数分析合成,这种合成方式多以音节、半音节或音素为合成单元1首先,按照语音理论,对所有合成单元的语音进行分析,提取有关语音参数,这些参数经编码后组成一个合成语音库;输出时,根据待合成的语音的信息,从语音库中取出相应的合成参数,经编辑和连接,顺序送入语音合成器1在合成器中,通过合成参数的控制,将语音波形重新还原出来1

规则合成,这种合成方式通过语音学规则来产生目标语音1规则合成系统存储的是较小的语音单位(如音素、双音素、半音节或音节)的声学参数,以及由音素组成音节、再由音节组成词或句子的各种规则1当输入字母符号时,合成系统利用规则自动地将它们转换成连续的语音波形1由于语音中存在协同发音效应,单独存在的元音和辅音与连续发音中的元音和辅音不同,所以,合成规则是在分析每一语音单元出现在不同环境中的协同发音效应后,归纳其规律而制定的如共振峰频率规则、时长规则、声调和语调规则等1由于语句中的轻重音,还要归纳出语音减缩规则1

线性预测分析是现代语音信号处理中最核心的技术之一,为现代语音信号处理的飞速发展立下了汗马功劳,在语音分析、合成、编码和识别等方面都有着广泛的应用,至今仍是最有效的语音分析技术

[收稿日期]2010-09-10

[作者简介]贺艳平(1978)),女,山西稷山人,硕士,讲师,主要从事移动通信,数字信号处理研究.

基于线性预测下的语音信号合成

之一1本文所研究的就是对一个格式为WAV的语音文件进行线性预测参数,然后根据预测后的参数进行合成,并通过Matlab仿真

1 语音信号的预处理

在语音信号的A/D转换过程中,为防止频域混叠,通常在对模拟语音信号取样之前先进行低通滤波,但滤波的同时也降低了高频区域信号的能量,这对线性预测分析是相当不利的1由于高频区域能量的降低可能会影响到自相关矩阵的正确性,导致自相关矩阵病态甚至可逆,因而通常在计算LPC(Lin-earPredictiveCoding)[4]系数之前利用只有一个零点的滤波器对语音信号进行处理,以增强语音信号高频区域的能量,这一过程称为语音信号的预加重1而用作预加重的滤波器被称为预加重滤波器,其系统函数如下所示:

H(z)=1-AZ-1[3]观测预测前后的语音信号1,(1)式中A称为预加重因子,用来控制预加重的程度,其值接近于11

在语音信号的合成端,为了去除预加重带来的影响,通常在重建语音输出之前,使其通过去加重滤波器,去加重滤波器是预加重滤波器的逆过程,其系统函数为:

=(2)H(z)1-Az-1

经过预加重数字滤波后,接下来就要进行加窗分帧处理,一般语音信号每帧数约为33~100帧,这 G(z)=要视实际情况而定1分帧虽然可以采用连续分段的方法,但一般要采用交叠分段方法,这是为了使帧与帧之间平滑过渡,保持其连续性1前一帧和后一帧的交叠部分称为帧移1帧移和帧长的比值一般取为0~1/21分帧是用可移动的有限长度窗口进行加权的方法来实现的,这就是用一定的窗函数w(n)来乘语音信号y(n),从而形成加窗后的语音信号:

yw(n)=w(n)#y(n)1(3)在语音信号数字处理中常用的窗函数是矩形窗和汉明窗等,窗函数的选择(形状和长度)对于短时分析参数的特性影响很大,为此应选择合适的窗函数,使其短时参数能够更好地反应语音信号的特性变化1

2 线性预测分析的基本原理

线性预测分析的基本思想[5]是:由于语音样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值,即一个语音的取 …… 此处隐藏：3271字，全部文档内容请下载后查看。喜欢就下载吧 ……

基于线性预测下的语音信号合成.doc 将本文的Word文档下载到电脑

下载这篇word文档

上一篇：第二章_财务管理的价值观念习题及答案

下一篇：化学计算方法—十字交叉法