语音信号处理课件__第04章短时傅里叶分析

发布时间:2024-11-17

语音,信号处理

第四章 短时傅立叶分析短时傅立叶变换的定义 短时傅立叶变换的某些性质 短时傅立叶变换的线性滤波实现 短时傅立叶谱的取样 语音的短时合成技术 短时分析-合成数字滤波器组的设计 用快速傅立叶变换进行短时傅立叶分析

语音,信号处理

4.1 短时傅立叶变换--概述

语音,信号处理

4.2.1 短时傅立叶变换--定义定义:短时傅立叶变换也叫短时谱(加窗的方式)

X n (e ) = ∑ x(m) w(n m)e j mj

短时谱的特点: 1)时变性:既是角频率ω的函数又是时间n的函数 2)周期性:是关于ω的周期函数,周期为2π短时傅立叶变换主要用于语音分析合成系统,由其逆变换可以精确地恢复语音波形;

m = ∞

语音,信号处理

4.2.1 短时傅立叶变换--定义短时傅里叶变换是窗选语音信号的标准傅里叶变换。下 标n区别于标准的傅里叶变换。w(n-m)是窗口函数序 列。不同的窗口函数序列,将得到不同的傅里叶变换的 结果。 短时傅里叶变换有两个自变量:n和ω,所以它既是关 于时间n的离散函数,又是关于角频率ω的连续函数。 与离散傅里叶变换和连续傅里叶变换的关系一样,若令 ω=2πk/N,则得离散的短时傅里叶变换,它实际上是 在频域的取样。

X n (e

j

2 kπ N

) = X n (k ) =

m = ∞

∑ x(m)w(n m)e

j

2 kπm N

0 ≤ k ≤ N 14

语音,信号处理

4.2.1 短时傅立叶变换--定义这两个公式都有两种解释:① 当n固定不变时,它们是序列w(n-m)x(m) (-∞<m<∞)的标准傅里叶变换或标准的离散傅里 叶变换。此时与标准傅里叶变换具有相同的性质, 而Xn(k)与标准的离散傅里叶变换具有相同的特性。 ② 当ω或k固定时,和Xn(k)看做是时间n的函数。 它们是信号序列和窗口函数序列的卷积,此时窗口 的作用相当于一个滤波器。

语音,信号处理

4.2.1 短时傅立叶变换--定义频率分辨率 f、取样周期T、加窗宽度N三者关系:

1 f = NT窗形状对短时傅立叶变换的影响 - 矩形窗——主瓣窄,衰减慢; - 汉明窗——主瓣宽,衰减快; 窗宽对短时频谱的影响 -窗宽长——频率分辨率高,能看到频谱快变化; -窗宽短——频率分辨率低,看不到频谱的快变化;

语音,信号处理

4.2.2 短时傅立叶变换--标准傅里叶变换的解释短时傅里叶变换可写为 ∞

X n ( e jω ) =

m = ∞

[ x (m)w(n m)]e jωm ∑

当n取不同值时窗w(n-m)沿着x(m)序列滑动, 所以w(n-m)是一个“滑动的”窗口。 由于窗口是有限长度的,满足绝对可和条件,所 以这个变换是存在的。与序列的傅里叶变换相同, 短时傅里叶变换随着ω作周期变化,周期为2π。7

语音,信号处理

4.2.2 短时傅立叶变换--标准傅里叶变换的解释

语音,信号处理

4.2.2 短时傅立叶变换--标准傅里叶变换的解释根据功率谱定义,可以写出短时功率谱

与短时傅里叶变换 之间的关系 S (e jω ) = X (e jω ) X * n (e jω ) =| X (e jω ) | 2n n n

式中*表示复共轭运算。同时功率谱是短时自相关函数 ∞ Rn (k ) = ∑ w(n m) x(m)w( n k m) x( m + k ) 的傅里叶变换。 m = ∞ 下面将短时傅里叶变换写为另一种形式。设信号序列和窗 口序列的标准傅里叶变换为 X (e ) =jω m = ∞

∑ x(m)e

j ωm

W (e ) =

m = ∞

∑ w(m)e

j ωm

均存在。当n取固定值时,w(n-m)的傅里叶变换为 m = ∞

∑ w(n m)e

jωm

= e jω n W ( e jω )9

语音,信号处理

4.2.2 短时傅立叶变换--标准傅里叶变换的解释根据傅里叶变换的频域卷积定理,有

X n (e jω ) = X (e jω ) * [e jωn W (e jω )]

语音,信号处理

4.2.2 短时傅立叶变换--标准傅里叶变换的解释用波形乘以窗函数,不仅为了在窗口边缘两端不引起急剧 变化,使波形缓慢降为零,而且还相当于对信号谱与窗函 数的傅里叶变换进行卷积。 为此窗函数应具有如下特性: 窗函数应具有如下特性: 窗函数应具有如下特性① 频率分辨率高,即主瓣狭窄、尖锐; (矩形窗) (矩形窗) ② 通过卷积,在其他频率成分产生的频谱泄漏少,即旁瓣 衰减大。 (海明窗) (海明窗) 这两个要求实际上相互矛盾,不能同时满足。

窗口宽度N、取样周期T和频率分辨率 f之间存在下列关 系 f=1/NT 可见:窗口宽度↑→频率分辨率↑ 时间分辨率↓ 窗口宽度↓→频率分辨率↓ 时间分辨率↑,因而二者是矛 盾的。 11

语音,信号处理

4.2.2 短时傅立叶变换--标准傅里叶变换的解释第一个零点位置为2π/N,显然它与窗口宽度成反比。 ,显然它与窗口宽度成反比。 第一个零点位置为矩形窗,虽然频率分辨率很高,但由于第一旁瓣的衰减只 矩形窗 有13.2dB,所以不适合用于频谱成分动态范围很宽的语音 分析中。 海明窗在频率范围中的分辨率较高,而且由于旁瓣的衰减 海明窗 大于42dB,具有频谱泄漏少的优点,频谱中高频分量弱、 波动小,因而得到较平滑的谱。 汉宁窗是高次旁瓣低,第一旁瓣衰减只有30dB。 汉宁窗

对语音波形乘以海明窗,压缩了接近窗两端的部分波形, 等效于用作分析的区间缩短40%左右,因此,频率分辨 率下降40%左右。所以,即使在基音周期性明显的浊音 频谱分析中,乘以合适的窗函数,也能抑制基音周期与分 析区间的相对相位关系的变动影响,从而得到稳定的频谱。 因为乘以窗函数将导致分帧区间缩短,所以为跟踪随时间 变化的频谱,要求一部分区间重复移动。12

语音,信号处理

4.2.2 短时傅立叶变换--标准傅里叶变换的解释

语音,信号处理

4.2.2 短时傅立叶变换--标准傅里叶变换的解

释其中图(a)是海明窗的窗选信号, 图(b)是其对数功率谱;图 (c) 是矩形窗下的窗选信号,图(d) 是其对数功率谱。 从图 (a)可以明显看出时间波 形的周期性,此周期性同样在 图(b)中表现出来。图中基频及 其谐波在频谱中表现为等频率 间隔的窄峰。图(b)中的频谱大 约在300~400Hz附近有较强 的第一共振峰,而约在 2000Hz附近有一个对应于第 二、三共振峰的宽峰。此外, 还能在3 800Hz附近看到第四 个共振峰。最后,由于声门脉 冲谱的高频衰减特性,频谱在 高频部分表现出下降的趋势。 14

给出了N=500时(取样率10 kHz,窗持续时间50 ms)时直角窗及海明窗下浊音语音的频谱。

语音,信号处理

4.2.2 短时傅立叶变换--标准傅里叶变换的解释将图(b)和图(d)比较可看出它 们在基音谐波、共振峰结构以 及频谱粗略形状上的相似性, 同样也能看到其频谱之间的差 别。 最明显的是图(d)中基音谐波尖 锐度增加,这主要是由于矩形 窗频率分辨率较高。 另一差别是矩形窗较高的旁瓣 产生了一个类似于噪声的频谱。 这是由于相邻谐波的旁瓣在谐 波间隔内的相互作用(有时加强 有时抵消),因而在谐波间产生 了随机变化。这种相邻谐波间 不希望有的“泄漏”抵消了其 主瓣较窄的优点, 因此在语音频谱分析中极少采 用矩形窗。 给出了N=500时(取样率10 kHz,窗持续时间50 ms)时直角窗及海明窗下浊音语音的频谱。15

语音,信号处理

4.2.2 短时傅立叶变换--标准傅里叶变换的解释图4-3给出了N=50的 比较结果(取样率与图 4-2中相同,因而窗口 持续时间为5ms)。 由于窗口很短,因而时 间序列(图(a)和(c))及 信号频谱(图(b)和(d)) ( (b) (d)) 均不能反映信号的周期 性。 与图4-2相反,图4-3只 大约在400、1 400及2 200Hz频率上有少量较 宽的峰值。它们与窗内 语音段的前三个共振峰 相对应。比较图4-3(b) 及(d)的频谱后,再次 表明矩形窗可以得到较 高的频率分辨率。 16

语音信号处理课件__第04章短时傅里叶分析.doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:7 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:29元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219