汉语连续语音识别系统的研究与实现(11)
发布时间:2021-06-08
发布时间:2021-06-08
语音信号处理相关论文
西北大学硕士学位论文
第二章语音识别系统概述
2.1语音的声学基础及汉语语音基础
2.1.1语音的产生
人类的语音信号是由发声器官的物理运动引起的,在发声时,通过肺部收缩压迫气流进入气管并经过声门和声道,从而引发音频振荡产生了语音。其中声道是从声门开始,包括咽喉、口腔,终止于嘴唇,鼻道则是从小舌开始到鼻孔为止。当小舌自然下垂时,鼻道与声道发生耦合就可以产生鼻音‘21。
按照人类发音激励方式的不同,语音可以分为浊音、清音和爆破音三类。浊音(VoiceSpeech):气流通过声门时,声带的张力使声带产生低频率张弛振动,产生~股准周期脉冲气流,在这种气流的激励下声道就产生浊音,也称作有声语音,如汉语中的a,O,l,r等;清音(UnvoicedSpeech):声带不振动,声道在某处收缩使横截面积变小,迫使气流以高速通过这一收缩部分并产生湍流,当气流速度与横截面积的比值大于临界门限时,就产生清音或者摩擦音,也称作无声语音,如汉语中的f,s等;爆破音(PlosiveSpeech):声道某处先完全闭合使气压增大,然后突然释放就会产生爆破音,如汉语中的P,b,d,k等。
2。1.2汉语语音基本特征
按照我国传统分类方法,汉语音节是由声母、韵母加声调构成,或者仅有韵母加声调构成。音节开始部分的辅音是声母,剩余部分是韵母,整个音节的音高变化叫做声调或字调。
当气流从肺部出发,经过气管、喉腔、咽腔进入口腔最后从唇腔出去时,这些声腔完全开放,使气流得以顺利通过,这种情况下产生的开放性的音称之为元音。元音是汉语音节中不可缺少的部分,一个汉语音节内最多可有3个元音(如iao、uai)。汉语的元音及发音方式如表2.1所示【21。
表2-1汉语元音及发音方式表
类别
舌前后
唇圆度
开口度
闭
中
开舌高低高中低不圆i(知)cr舌尖元音刖舌后元音后前圆不圆l中不圆圆圆不圆中圆圆U后圆不圆e不圆Ui(资)eoa7