汉语连续语音识别系统的研究与实现(8)

发布时间:2021-06-08

语音信号处理相关论文

第一章绪论

进入70年代,美国国防部高级研究计划署(A砒,A)资助多个研究机构对语音识别系统进行研究,在语言理解、语言统计模型等方面取得了一定的进展。70年代初,动态时间规整(DynamicTimeWarping,DTW)技术被广泛应用于语音识别,隐马尔可夫模型(HiddenMarkovModel,HMM)也被引入并取得了初步成功;70年代中期,Itakura提出了线性预测残差原理并将这一原理成功应用于语音识别、语音编码等领域,线性预测技术在语音处理的多个方面都取得了巨大成功;70年代末,Linda、Gray等人将矢量量化(VectorQuantization,VQ)技术引入语音识别,成功应用于语音编码当中,随后,矢量量化技术也被推广到了其它领域。

20世纪80年代,语音识别研究取得了巨大突破。语音识别研究进一步走向深入,隐马尔可夫模型(HMM)被广泛应用于语音识别中,人工神经网络(ArtificialNeuralNetworks,砧州)也被成功引入到语音识别领域。这一时期,语音识别工作者在实验室突破了大词汇量、非特定人和连续语音这三大障碍,第一次把这三个特性都集成在一个系统中。比较典型的是美国卡耐基梅隆大学基于VQ和HMM实现的SPHINX系统,它是第一个高性能的大词汇量、非特定人连续语音识别系统。

进入20世纪90年代,人工神经网络(砧蝌)的研究得到进一步深化,语音识别各个方面的技术都取得了关键性的进展。许多著名公司如IBM、Microsoft、Sun等均投入大量资金对语音识别系统的实用化进行研究,开发出了许多实用性的产品,如IBM公司的ⅥaVoice、Microsoft公司的Whisper和Sun公司的VoiceTone等【5一。

我国语音识别研究起步较晚,最早开始于中科院声学所。80年代后,国内各大院校和研究所也相继开始了语音识别的研究,中科院、北京大学、清华大学、哈尔滨工业大学、上海交通大学、中国科技大学、华中科技大学等科研机构都有语音识别的研究实验室。其中最具有代表性的是清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室,研究成果也逐步从实验室走向实用。我国语音识别的研究也得到了国家科技计划的支持,国家863计划开始实施后,863智能计算机专家组为语音识别技术研究专门立项。目前我国语音识别技术的研究水平已经与国外同步,在汉语语音识别技术研究上有自己的特点与优势,对汉语连续语音识别的研究已经达到国际先进水平,取得了很多成果,汉语语音识别产品也从实验室逐步走向实用[7’引。

1.3本课题研究背景和内容

语音识别的研究工作已经进行了近60年,取得了很多的研究成果,语音识别产品也已经逐步进入市场。但就目前的研究水平来看,现有的语音识别技术还远远达不到人4

精彩图片

热门精选

大家正在看