基于DSP的语音识别系统研究与设计开题报告
2020-02-18 19:37:02
1. 研究目的与意义(文献综述)
语音是人类交流沟通的重要手段,承载着大量信息,具有便捷性。而自动语音识别技术的目的是让机器能够“听懂”人类的语音,将人类语音信息转化为可读的文字信息,为人们与各种智能设备进行人机交互提供了新的方式,使人们能更加快捷、方便地产生、传输、存储、获取和运用语音信息,这对于促进社会的进步具有及其重要的意义。近年来语音识别技术已经逐步从实验室走入了人们的日常生活中,被广泛地应用于电话语音拨号、汽车的语音控制、工业控制、医疗领域、个人数字助理、智能玩具、家电遥控等领域,给人类的生活方式带来了巨大的影响。
从1952年第一个语音识别系统audry诞生以来,线性预测分析技术、动态规划技术、矢量量化技术、隐马尔可夫模型理论、动态贝叶斯网络等技术在语音识别中的应用大大推动了该领域相关技术的发展。最近几年,随着深度神经网络的应用,加上海量大数据的使用和云计算的普及,语音识别取得了突飞猛进的进展,在多个行业突破了实用化的门槛,越来越多的语音技术产品进入了人们的日常生活,如苹果的siri、亚马逊的alexa。2011年,微软研究院的研究人员在国际语音通讯协会的年会上提出了神经网络一隐马尔可夫混合模型,该模型可应用于大词汇量语音识别系统以及上下文的语音识别系统,它是目前实现非特定人实时语音识别的最好方法。
我国在语音识别方面的研究工作相对国外起步要晚,但近年来我国的语音识别技术发展十分迅速,从之前的单纯针对特定人发展到面向非特定人的语音识别,从孤立词的语音识别发展到连续词识别,从小词汇量的语音识别发展到基于大型语音模板库的语音识别,其中部分研究成果己经可以和国际上的研究相媲美。百度、阿里、讯飞、思必驰、科大讯飞、云知声等公司已经推出了各自较为成熟的基于语音交互的产品,语音识别技术在工业控制、汽车的语音控制方面的应用也已较为普遍与成熟。
2. 研究的基本内容与方案
本次设计针对非特定人的孤立词语音识别,设计系统能够实现非特定人、小词汇表、孤立词的语音识别。首先,从算法层面来看,该系统功能的实现主要经由以下几个步骤:预处理、特征提取、识别。
预处理主要是对经过转换的音频信号进行处理,提高信号的信噪比及使得语音信号能被计算机处理,其中预加重对输入音频信号的高频进行补偿,使得高频更清晰。由于计算机只能处理有限长度的信号,故需对输入信号进行分帧加窗。端点检测确定信号中语音的起始点及结束点,从而滤去静音部分噪声。
经过语音预处理中端点检测后,己经将语音信号中清音、噪音区别出来,这
3. 研究计划与安排
第1-3周:查阅相关文献资料,明确研究内容,了解各部分算法原理及实现方法。确定方案,完成开题报告和外文文献翻译。
第4-6周:熟练掌握各部分算法的原理及其实现方法,完成算法编程。
第7-9周:根据设计算法进行matlab仿真,进行算法优化,比较系统语音识别的性能。
4. 参考文献(12篇以上)
[1] 张涛.低信噪比环境下改进的语音识别系统研究[d].安徽:安徽工业大学,2018.
[2] 周炳良.非特定人孤立词语音识别算法研究 [d].江苏:南京邮电大学,2018.
[3] 张宝峰.基于dsp的语音识别算法研究与实现 [d].甘肃:兰州理工大学,2011.
最新文档
- 石榴物候期观测与春夏栽培技术开题报告
- 基于关键性影响因素的农村“煤改气”工程分析——以北京地区为例文献综述
- 酰基化黑米花色苷稳定性与抗氧化活性研究开题报告
- 应变片方位偏差对测量结果影响分析文献综述
- 海南省土壤环境功能区划研究开题报告
- 过去百年山西省耕地网格化重建研究文献综述
- 石蒜植物EST资源的SSR信息分析及EST-SSR标记开发开题报告
- 1979-2017年华北地区极端高温事件季节内尺度特征初探文献综述
- 磁化水对火炬松种子休眠解除的影响开题报告
- 酸雨对含磷物质钝化修复的农田土壤磷流失影响研究文献综述
- 甜橙油纳米乳液的制备及稳定性研究开题报告
- 基于单片机的温湿度实时测量系统文献综述
- 不同品种薄壳山核桃花粉形态特性的比较研究开题报告
- WRF模式边界层参数化方案对漳河流域一次降水模拟的影响研究文献综述
- 利用反向原子转移自由基聚合合成聚丙烯酸甲酯开题报告


