语音信号特征提取中Mel倒谱系MFCC的改进算法

时间：2025-07-11

５４

２００８，４４（２２）

ｃｏ，印Ⅱ御’Ｅ，铆船ｅｒｉｎｇ肌ｄＡ即比越幻瑚计算机工程与应用

语音信号特征提取中Ｍｅｌ倒谱系ＭＦＣＣ的改进算法

张震，王化清

ＺＨＡＮＧ

Ｚｈｅｎ，ＷＡＮＧＨｕａ—ｑｉｎｇ

郑州大学，郑州４５０００ｌ

ＺｈｅｎｇｚｈｏｕＵｎｉｖｅ侣ｉｔｙ，ｚｈｅｎｇｚｈｏｕ４５０００ｌ，Ｃｈｉｎａ

Ｚ姒ＮＧ

Ｚｈｅｎ．ＷＡＮＧＨ岫一ｑｉｎｇ．ＩＩＩＩｐｒｏｖｅｄ

ｂａｓｅｄ蚰ｖｏｉ∞ｓｉ印ａＩ．Ｃｏｍｐｕ钯ｒ

Ａｂｓｔｍｃｔ：Ｅｘｔｒ∞ｔｉｎｇｉｎｄｉｖｉｄｕａｌ

Ｅ咖ｒｉ呜ａｎｄ

ｏｆ

ｔｈｅ

ａｌｇｏｒｉ岫Ｉ

ｏｆＭｅＩ－Ｆ他ｑｕｅ眦ｅＣｅｐｓｔｒａｌ

Ｃ∞ｍｃｉｅ吣ｉｎｃｈａⅢｔｅｒｉｓ６璐ｅｘｔｒａｃｔｉｏｎ

ＡｐｐＩｉｃａｌｊｏ璐，２∞８，４４（２２）：５４－５５．

ｔｈｅ

ｔｒａｉｔｓ

ｓｐｅａｋｅ璐ｆｍｍｔｈｅ打ｖｏｉｃｅ８

ｉｓ

ｋｅｙ

ｏｆＶｏｉｃｅｐｒｉｎｔ

ｒｅｃｏｎｇＩｌｉｔｉｏｎ．ｎｉｓ

ｃｏｕｎｔ

ｐａｐｅｒｃｈｉｅｎｙ

ｉｎｔｌｌｏｄｕｃｅｓＭｅｌ—ＦｒｅｑｕｅｎｃｅＣｅｐｓｔＩｍＣｏｅｍｃｉｅｎｔｓａｎｄ“’ｓｉｍｐｍｖｅｄａｌｇｏｒｉｔｈｍ（３（７＋１），ａｎａｌｙｚｅｓａｎｄｇｉｖｅｓｄｅｔａｉｌｅｄ

ｐｍｃｅｓｓ，ａｎｄ

ａｌ∞ｇｉｖｅｓｔｈｅｄｉｆｆｅｒｅｎｃｅｓｆ而ｍｔｈｅｎｏｍａｌ

ａｌｇｏｒｉｔｈｍ

ｂｙｅｘｐｅｒｉｍｅｎｔ．

Ｋｅｙ帅ｒｄｓ：ｖｏｉｃｅ

ｒｅｃｏｇＩＩｉｔｉｏｎ；ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ

ｅｘ咖ｔｉ叩；Ｍｅｌ—ＦｒｅｑｕｅｎｃｅＣｅｐ涮Ｃ∞佑ｃｉｅＩｌｔｓ（ＭＦＣＣ）

摘要：从说话人的语音信号中提取说话人的个性特征是声纹识别的关键。主要介绍语音信号特征提取方法中的Ｍｅｌ倒谱系数（Ｍｅｌ—Ｆｒｅｑｕｅｎｃｅ

ｃｅｐｓｔｒａｌ

ｃｏｅｍｃｉｅｎｔｓ，ＭＦｃｃ）的特点及其改进算法（３Ｑ＋１），分析给出了较详细的计算过程并通过实验比较了其和

传统算法在语音识别系统中的差别。关键词：语音识别；特征提取；ＭＦＣＣＤｏＩ：１０．３７７８，ｊ．ｉｓｓｎ．１００２—８３３１．２００８．２２．０１５

文章编号：ｌ００２—８３３１（２００８）２２—００５４－０２

文献标识码：Ａ

中图分类号：ＴＮ９１２．３

语音信号的特征矢量在频域上主要有线性预测系数（ＬＰＣ），ＬＰＣ倒谱系数（ＬＰｃｃ），ＭＥＬ频率倒谱系数（ＭＦＣｃ）。ＬＰＣｃ逼近人类发声机理但对于辅音的描述能力较差，抗噪声性能较差。ＭＦｃｃ充分考虑人耳听觉结构和人类发声和接受声

厶＝２

５９５ｌｇ（１＋二）如图ｌ所示（其中横坐标为线性频率，纵

３５００３０００２５００

坐标为Ｍｅｌ频率）。

音的机理特性具有很好的鲁棒性。而且在没有任何假设前提条件，其具有较好的识别性能和抗噪能力。但标准的ＭＦｃｃ只反

映ｒ语音参数的静态特性，而人耳对语音的动态特性更为敏感，

气２０００蓦ｌ５００

ｌ０（）０５０００

Ｆｒｅｑｕｅｎ。ｙ，Ｈｚ

本系统特色是引入一阶差分（埘彤ｃ），二阶差分（△△Ｍ粥ｃ）再

加Ｅ时域特征信息的帧能量参数构成了（３ｐ＋１）维的特征矢量，更好地消除了语音帧之间的相关性，更优的逼近语音的动态特征，大大提高了识辨率。

根据生理学的研究成果表明，人耳对不同频率的声波有不同的听觉灵敏度。从２００—５

０００

图ｌＭｅｌ标度与频率的关系

Ｈｚ之Ｉ’日】的语音的清晰度影响

１传统特征提取计算方法

ＭＦｃｃ特征参数提取及计算如图２所示。特征提取及计算过程：

（１）原始语音信号ｓ（ｎ）经过预加重、分帧、加窗等处理得到每个语音帧的时域信号ｘ’（ｎ）。预加重目的是为了对语音的高频部分进行加重增加其高频分辨率，一般通过传递函数为Ⅳ（：）＝ｌ－０澎～，ｎ取０．９７；根据语音信号短时平稳的特性，通过分帧操作提取语音短时特性便于建模，一般取帧长３０ｍｓ此时帧移ｌＯｍｓ；为了平滑信号以减少每帧信号两端的预检测误差。避免频谱出现“破碎”现象采用加窗处理。每帧用窗函数相乘以减少帧起始和结束处的信号不连续性。在语音信号的时域分析

Ｈｅｎ锄ＰｍｖｉｎｃｅｕｎｄｅｒＧｍｎｔＮｏ．０３２４４ｌ００９２）。

最大。听觉系统有两个关键特征：

（１）人耳对于声波频率的感觉呈现对数关系；

（２）一个声音月被感知的域值由于另一个声音Ｂ的出现而提高。即所谓的掩蔽效应。也就是说．当两个频率相近的音调同时发出时，人只能听到—个音调。掩蔽效应的生理依据是频率群，在２０￣１６０００Ｈｚ范围内的频率可以分成２４个频率群。

因此在进行声学测量时，频率刻度常取为非线性刻度。实验表明，人类在对约ｌ …… 此处隐藏：6666字，全部文档内容请下载后查看。喜欢就下载吧 ……

语音信号特征提取中Mel倒谱系MFCC的改进算法.doc 将本文的Word文档下载到电脑

下载这篇word文档

上一篇：艺考广播影视编导专业必看电影

下一篇：2013年9月10日教师节新教师代表发言稿