本文的主要工作体现在以下几方面:
1、在语音增强过程中,语音激活检测是一个重要环节。精确地确定输入语音的起点和终点将保证语音处理系统良好的性能。本文首先对一些常用的语音激活检测(VAD)如:基于短时谱的短时能量和短时过零率的双门限算法,进行分析研究总结出其优缺点,在此基础上研究分析了一种基于子带能量和阈值比较的语音激活检测算法。
2、对传统谱相减算法进行研究,分析其优缺点,并在实验中对理论分析结果进行验证。
3、通过对经典谱减法公式的推导,分析谱相减经典算法的几个常用的改进形式,同样对这些改进形式进行研究和实验仿真,分析其优缺点,用MATLAB语言编写出这些算法的源程序。
4、通过实验仿真对比传统谱相减和本文研究的其他的谱相减形式的语音增强性能。
本文的组织结构如下:
第1章 介绍了语音增强和谱相减语音增强技术的发展概况。
第2章 研究了语音短时处理技术等语音增强处理所需要的基础知识。
第3章 研究语音激活检测,主要分析基于短时谱的短时能量和短时过零率的双门限算法,分析其局限性。
第4章 研究背景噪声检测方法,先介绍传统的背景噪声检测算法。然后研究一种基于子带能量和特征阈值比较的背景噪声估计方法。
第5章 研究了传统谱相减方法及近年来被广泛采用的一些谱相减改进算法(如引如了过减系数和谱平滑系数的算法)、基与噪声残差的谱相减算法、另外研究了不以噪声是零均值的高斯分布为前提的一种改进形式的谱相减算法。
第6章 在前面的研究基础上,对第五章研究的经典的谱相减语音增强算法及其改进算法用MATLAB软件进行仿真。分析在加入不同信噪比的和不同类型的带噪语音时各个算法的语音增强性能,总结出各个算法的优缺点。
第7章 全文工作总结。