汉语连续语音识别系统的研究与实现(7)
发布时间:2021-06-08
发布时间:2021-06-08
语音信号处理相关论文
西北大学硕士学位论文
词汇量语音识别系统可以识别几百个,大词汇量语音识别系统则是指可以识别一千个词汇以上的语音识别系统。词汇量越大,系统训练、识别的工作量就越大,实现就越困难。
根据使用方式可以分为实时语音识别系统和离线语音识别系统。实时语音识别系统要求能够实时进行识别交互,对系统的实时性要求较高;离线语音识别系统则并不要求系统马上给出识别结果,对系统的实时性要求较低。
目前,语音识别研究的重点和难点是大词汇量、非特定人、实时连续语音识别技术。1.2语音识别技术的研究与发展
国际上对语音识别的研究已经有近60年的历史,取得了很多的成果,尤其是近二、三十年,提出了许多有效的语音处理方法和识别策略,语音识别系统正逐步走向实用化。由于综合国力的不断增强,中国在国际上的地位与日俱增,在全球政治、经济、军事、文化等领域发挥的作用也越来越大,汉语语音识别也越来越被重视,很多世界著名公司如IBM、APPLE、MOTOROLA等都相继投入到汉语语音识别系统的开发中来。
语音信号处理的研究工作最早可以追溯到20世纪30年代。1939年,H.Dudley提出了基于负载信息参量的语音信号传输方法,并研制出了第一个声码器(Vocoder);1947年,Bell实验室的L.GKesta等人提出了语谱图的概念,将语音转化为图形,提供了一种较为方便的语音处理方式;1948年,美国Haskins实验室成功研制出了语图回放机;同时,R.K.Potter等人在分析多种语言的发音后,出版了《可见语音(VisibleSpeech)))一书,这些都为语音识别的发展打下了良好的基础。
语音识别技术的研究是从20世纪50年代开始的,这一时期,一些简单的语音识别系统开始问世:1952年美国Bell实验室的K.H.Davis等人成功研制出了第一个特定人孤立字识别系统,该系统可以识别特定人的十个英文数字【4】;1956年美国声学家H.F.Olson等人研制出了第一台语音打字机(PhoneticTypewriter);同时,语音学家也加入到了语音识别的研究当中,英国伦敦大学的D.B.Fry第一次提出了利用语言的统计信息来帮助语音识别的实现。
20世纪60年代,日本~些语音识别研究者致力于语音识别硬件的开发,出现了一些基于硬件的语音识别系统,如东京无线电研究实验室的Suzuki等人研制出了基于硬件的元音识别系统;在理论方面,针对语音信号时长不统一的问题,日本研究者提出了时间规整方法,同时苏联的Vintsyuk也提出了用动态规划方法来解决语音时间对准问题;由于计算机、信息处理等相关技术的限制,这一时期语音识别研究并没有取得突破性的进展。3