基于MATLAB的语音端点检测系统设计

2022-10-25 02:10

论文总字数：24381字

摘要

语音信号在现代生活中有着重要的影响作用，因此如何高效准确的处理语音信号便成了关键。而语音端点检测在语音信号的处理技术中发挥着重要作用，有效的检测可以准确的判断出语音段的起止位置，区分出语音段与非语音段，从而提取出一段语音信号中的有效信息。准确的检测出有效信号不仅缩短了对整个语音处理的运算量，节省了存储空间，还提高了系统的性能、效率和质量。

一般语音端点检测的方法可分为两大类：一种是通过阈值设定上下限的方法，另一种是通过模式而识别语音与噪声的方法。本文所采用的的双门限检测法类属第一种，双门限检测法主要基于短时能量和过零率两个特征参数进行判断，通过设定短时能量阈值检测浊音，过零率检测清音，大致判断语音信号的起始位置。但目前该算法在背景噪声大、信噪比低的情况下的准确率依然较低。

关键词：语音端点检测；双门限检测法；短时能量；过零率；

Design of speech endpoint detection system based on matlab

Abstract

Speech signal plays an important role in modern life, how to process speech signal efficiently and accurately becomes the key. Speech endpoint detection plays an important role in the processing technology of speech signal, and effective detection can accurately determine the starting and ending position of speech segment, distinguish between speech segment and non-speech segment, and extract the effective information in a speech signal.

Accurate detection of effective signals not only shortens the computation of the whole speech processing, saves the storage space, but also improves the performance, efficiency and quality of the system. The general speech endpoint detection method can be divided into two categories: one is the method of setting the upper and lower limit by threshold, the other is the method of identifying speech and noise through the pattern. In this paper, the two-threshold detection method is the first, the double threshold detection method is mainly based on short-time energy and over 0 rate of two characteristic parameters to judge, by setting the short-time energy threshold detection turbid, over 0 rate detection qingyin, roughly judge the starting position of the speech signal.But at present, the accuracy of the algorithm is still low under the condition of large background noise and low signal-to-noise ratio.

Keywords: Speech endpoint detection; Double threshold method; Short-term energy; The zero rate

目录

摘要 I

Abstract II

第一章绪论 1

1.1 研究背景 1

1.2 研究目的及意义 2

1.3 论文框架 4

第二章端点检测技术基础 5

2.1语音信号处理 5

2.1.1 语音端点检测预处理 5

2.1.2 语音信号的时域分析 7

2.1.3 语音信号的频域分析 7

2.2端点检测基本原理 9

2.3双门限检测法 10

2.4不同端点检测方法比较 10

第三章基于短时能量和短时过零率的端点检测 12

3.1 双门限检测法结构框图 12

3.2 双门限端点检测 13

3.2.1 短时平均能量 13

3.2.2 短时过零率 14

3.2.3 绘制坐标图 15

3.2.4基于短时能量和短时过零率的双门限端点检测 15

3.3 双门限端点检测实验仿真 17

第四章结论与展望 18

4.1 结论 18

4.2 现阶段端点检测存在的问题 21

4.3 对端点检测算法的展望 22

参考文献（References） 24

致谢 25

附录系统主程序 26

第一章绪论

1.1 研究背景

声音是涉及生理学、心理学、语言学、文学等多个领域的重要内容，是人与人之间进行信息传递与交换的枢纽。而语言作为人类所特有的功能，既在很大程度上便捷了人类衣食住行等生活上的需求，也在不断推动着社会科技的进步与发展。在人工智能领域上，人们对于智能机器的功能需求在不断的增加，而机器的智能化所依赖的关键要素就是人与机器之间信息的传递。由于人机之间视觉交换具有巨大的障碍，至今未在机器的“视觉”上取得很大的突破，因而主要依靠赋予机器“听觉”，即通过语音信号的处理检测等一系列操作，使机器辨别出人的语音内容，所下达的指示以及说话人的身份信息，为了实现人与机器之间更为平滑准确的信息交换。在科研领域上，5G手机的研发，信号探测，线路的传输等都与语音信号传输密切相关。在国家安全保卫工作上，多段线路的实时监控中，语音信号也发挥着举足轻重的作用。

语音信息对现代生活的重要影响，推动了无数学者在该领域进行不断地探索，不断开拓了语音处理技术在生活方面的应用市场。例如，我们每天都要用到的手机的语音拨号，iPhone 里面的siri都是身边很常见的技术的应用，家居中的声控系统也日趋常见，产品的发展变化与智能化都让我们从中获益，使我们在日常生活中的活动更加便捷高效。鉴于我们对语音信息技术的巨大需求，一系列产业也应运而生并得以蓬勃发展，诸如语音输入系统，将原本需要手写的纸质版或逐字逐句打字输入进电脑的电子版改进为口头陈述便可随之转化为文字的模式，大规模简化了原有模式的繁琐，使信息的传输更加高效便捷。除此之外还有运用于家庭安全、国防安全等的声纹识别和语音识别系统，通过对不同人语音的特征进行区别，然后进行个人身份识别，判断个人的身份信息，同时也可反向通过系统的语音特征定位搜寻到所吻合的那个。准确高效的语音系统所带来的巨大经济效益、安全效益、社会效益等都极大推进了语音技术方面的探索和研究，比如改进的语音编码技术让语音信号的质量更高、误码率更低，人机交互技术的不断推进都得益于对语音信息技术的社会需求。

剩余内容已隐藏，请支付后下载全文，论文总字数：24381字

您需要先支付 80元 才能查看全部内容！立即支付

注册

找回密码