汉语连续语音识别系统的研究与实现(14)

发布时间:2021-06-08

语音信号处理相关论文

第二章语音识别系统概述

语音识别系统在具体实现时要综合考虑识别任务的性质、词汇量的大小、工作环境、说话人发音方式和服务对象等诸多因素。不同的语音识别系统虽然在具体实现细节上有所不同,但所采用的基本技术是相似的。语音识别一般分为两个步骤:第一步是系统的“训练’’,通过对语料库中语音以及相关文法、语法的学习与分析,提取出参考模板和统计概率,建立识别系统的声学模型和语言模型;第二步是“识别’’,通过输入语音进行分析处理,提取出相应的特征参数,按照一定的准则与测度和参考模式库中的模板进行比较,并通过判决得出最终识别结果。语音识别基本原理如图2.1所示【5’6'71。

图2-1语音识别基本原理

2.2。2语音识别系统的组成

语音识别系统是建立在一定硬件平台上的语音识别应用软件,由硬件和软件两部分组成‘1,61。软件包括语音识别的核心程序以及相关的声学模型、词典、文法和语法模型等;硬件可以是计算机或者语音识别专用芯片,此外还包括语音录入设备、识别结果输出设备等。语音识别系统一般都要求对语音识别的结果作进一步处理,综合考虑环境适应、软、硬件接口等因素,在实际环境下实现具体的应用,如汽车的语音控制系统、家电声控系统、智能玩具等。因此,实际应用中的语音识别系统是由语音识别软件和相关的外围设备组合而成的。从系统的功能角度出发,可以将语音识别系统分为语音信号预处理、语音识别核心算法、应用动作处理以及相关数据库等。一般语音识别系统框图如图2.2所示【l,2,51。

语音识别预处理部分的主要工作是对输入语音进行数字化采样、滤波、预加重等,在端点检测阶段检测出各种语音段落;语音识别核心算法主要包括参数分析和语音识别,参数分析部分负责提取待识别语音的特征参数,将输入的语音信号序列转化为特定的语音特征参数序列。语音识别部分进行输入语音特征矢量和系统模板的匹配识别,并

10根据字典、语法约束等生成识别结果;应用动作处理部分主要负责对识别结果进行实用化转换,把识别结果转化为具体的输出格式或动作,从而实现具体应用。

精彩图片

热门精选

大家正在看