毕 业 设 计 (论 文)
设计(论文)题目:______基于小波变换的语音增强___
_ 算法的分析_______________
重庆邮电大学移通学院本科毕业设计(论文)
重庆邮电大学移通学院毕业设计(论文)任务书
设计(论文)题目 基于小波变换的语音增强算法的分析 学生姓名 系别 通信工程系 专业 通信工程 班级 01111008 指导教师 胡章芳 职称 副教授 联系电话 18725875566 教师单位 重庆邮电大学 下任务日期__2014__年__1_月__4__日
主 要 一、主要研究内容: 研 1、了解语音增强技术的基础理论及重要性; 究 2、掌握语音增强技术的国内外研究现状及相关技术; 内 3、掌握基于小波变换的语音增强算法技术; 容 4、通过仿真实验完成基于小波变换的语音增强算法技术。 、 二、方法和要求 方 通过认真查阅科技文献和相关资料,掌握相应的语音信号处理知识,使用 法 MATLAB软件对各种正交小波进行了深入的研究,利用小波变换的方法仿真实现 和 语音信号增强,并验证算法的有效性。 要 求 1月4日~3月6日:按照任务书完成开题报告,查找相关资料; 进 3月7日~3月15日:通过掌握的资料撰写并提交开题报告; 度 3月16日~5月4日:根据掌握资料完成初稿; 计 5月5日~5月13日:修改论文主要格式完成论文二稿; 划 5月13日~5月20日:论文定稿,整理提交全部毕业设计相关资料; 5月21日~5月22日:制作PPT,准备答辩。 主 要 1、杨行峻,迟惠生等.语音信号数字处理[M].北京:电子工业出版社,1995. 参 2、萧宝谨.信息论与编码[M].山东:兵器工业出版社,2000. 考 3、杨力华.信号处理的小波导引[M].北京:机械工业出版社,2003. 文 献 指导教师签字: 2014年 1 月5 日 教研室主任签字: 2014年 1 月6日 备注:此任务书由指导教师填写,并于毕业设计(论文)开始前下达给学生。
-I-
重庆邮电大学移通学院本科毕业设计(论文)
摘 要
语音信号处理的实际应用中,不可避免地会受到来自周围环境噪声的影响从而导致语音质量的下降。语音增强的目的就是从带噪语音中提取尽可能纯净的原始语音。
小波理论是一门新兴的时频分析技术,是分析类似于语音信号、地震信号等非平稳信号的有力工具。小波阈值去噪的主要思想是当含噪信号经小波变换由时域变换到小波域时,信号的小波系数相对集中在有限的区域内,而噪声的小波系数将分散到整个小波域。因此,即使输入信噪比比较低,信号变换后的小波系数也要大于噪声的小波系数。此时,可采用适当的阈值函数,在小波域内去除噪声系数,保留信号的系数,再由剩余的系数进行小波重构,即可恢复信号,达到去噪的目的。
本文详细分析了小波变换的基本理论、小波变换用于语音增强的基本原理。介绍了几种常用的小波及其应用特点。通过实例分析比较不同小波类型的应用特点,通过对他们的优缺点的了解,能够在不同的环境下选取合适的小波类型进行故障检测,同时针对不同的着重点选取恰当的小波。
通过使用MATLAB 软件进行了信号降噪的模拟仿真实验;用小波变换的增强算法在不同的信噪比带噪语音下降噪,仿真结果表明小波变换具有良好降噪的效果。
【关键词】语音增强 小波变换 降噪 Matlab仿真
-II-
重庆邮电大学移通学院本科毕业设计(论文)
ABSTRACT
The practical application of speech signal processing, are inevitably influenced by ambient noise, which degrades the speech quality. The purpose of speech enhancement is extracted from the noisy speech as possible the pure original speech.
Wavelet theory is a newly developed time-frequency analysis techniques, is a powerful tool for the analysis of speech signal, similar to the seismic signal and non-stationary signal. The main idea of wavelet thresholding denoising is when the signal with noise by wavelet transformation from time domain to wavelet domain, the wavelet coefficients of signal is relatively concentrated in a limited area, and the wavelet coefficients of noise will spread to the entire wavelet domain. Therefore, even if the input SNR is low, the wavelet coefficients of the transformed signal is greater than that of the noise. At this point, we can use thresholding function, remove the noise in the wavelet domain, coefficients retain signal, then the remaining coefficients of the wavelet reconstruction, to restore the signal, to achieve de-noising purpose.
This paper analyzes the basic theory of wavelet transform, basic principle for speech enhancement. This paper introduces wavelet several common characteristics and their application. By analyzing the application characteristics of different wavelet types, based on the advantages and disadvantages of their understanding, can be in different environment of the wavelet type suitable for fault detection, and according to the different focus of selecting wavelet.
Simulation of noise signal is carried out by using MATLAB software; with the enhancement algorithm of wavelet transform under different SNR noisy speech down noise, simulation results show that the wavelet transform has good noise reduction effect.
【Key words】speech enhancement wavelet transform denoising Matlab simulation
III- -
重庆邮电大学移通学院本科毕业设计(论文)
目 录
前 言 ········································································································ - 1 - 第一章 绪论 ······························································································· - 2 - 第一节 语音增强技术的发展与现状 ····························································· - 2 - 一、语音增强技术的意义 ········································································· - 2 - 二、噪声的种类和特点 ············································································ - 3 - 三、语音增强技术的发展 ········································································· - 4 - 第二节 语音信号处理技术概况 ··································································· - 5 - 一、语音合成························································································· - 5 - 二、语音编码························································································· - 5 - 三、语音识别························································································· - 6 - 第三节 课题研究的背景与意义 ··································································· - 6 - 第四节 课题研究的主要内容与结构 ····························································· - 6 - 第二章 几种常用的语音增强方法 ··································································· - 8 - 第一节 自适应噪声抵消法 ········································································· - 8 - 第二节 谱减法语音增强技术 ······································································ - 9 - 第三节 基于维纳滤波法的语音增强 ····························································· - 9 - 第四节 本章小结 ···················································································· - 10 - 第三章 小波变换在信号处理中的应用 ···························································· - 11 - 第一节 小波理论的提出与发展 ·································································· - 11 - 第二节 小波变换的基本性质 ····································································· - 11 - 一、小波变换与傅里叶变换 ····································································· - 11 - 二、连续小波变换与离散小波变换 ···························································· - 12 - 三、多分辨分析 ···················································································· - 13 - 四、Mallat快速分解法 ············································································ - 14 - 五、几种常用的小波函数介绍 ·································································· - 16 - 第三节 小波变换在降噪中的应用 ······························································· - 19 - 一、屏蔽去噪法 ···················································································· - 20 -
IV- -
重庆邮电大学移通学院本科毕业设计(论文)
二、模极大值法 ···················································································· - 20 - 三、阈值去噪法 ···················································································· - 20 - 第四节 本章小结 ···················································································· - 21 - 第四章 基于MATLAB的算法实现与分析 ······················································· - 22 - 第一节 MATLAB语言介绍 ······································································· - 22 - 一、MATLAB的特点及优势 ···································································· - 22 - 第二节 MATLAB仿真结果分析 ································································· - 24 - 一、算法实现························································································ - 24 - 二、实验仿真························································································ - 24 - 三、实验结果分析 ················································································· - 24 - 第三节 本章小结 ···················································································· - 27 - 结 论 ······································································································· - 28 - 致 谢 ······································································································· - 29 - 参考文献 ···································································································· - 30 - 附 录 ······································································································· - 32 - 一、英文原文 ··························································································· - 32 - 二、英文翻译 ··························································································· - 36 - 三、源程序 ······························································································ - 40 -
V- -
重庆邮电大学移通学院本科毕业设计(论文)
前 言
日常生活中,经常会遇到在噪声干扰下进行语音通信的问题。例如在汽车、火车上使用移动电话,旁人的喧闹声,马路旁和市场里的公用电话等。军事通信中,指挥员的作战命令和战斗员的战情汇报都需要用语音来表达,由于战斗环境中的声环境恶劣,特别是炸弹产生的冲击性噪声,使有用信号完全淹没在噪声中。窃听技术中需要语音增强。语音识别技术也需要语音增强。
语音增强不但与语音信号数字处理理论有关,而且涉及到人的听觉感知和语音学范畴。在实际生活中,语音信号无时无地不受各种噪声干扰。人们正常的生活环境就是一个声级为60dB左右的噪声环境。被强噪声污染的场合,噪声达120dB以上。噪声的来源众多,因应用场合而异,它们的特性也各不相同。所以必须针对不同噪声,采用不同的语音增强对策。
- 1 -
重庆邮电大学移通学院本科毕业设计(论文)
第一章 绪论
第一节 语音增强技术的发展与现状
一、语音增强技术的意义
随着语音信号处理技术的不断发展,不论是语音编码,语音合成还是语音识别技术都在不断的发展,实际应用也越来越广泛[1]。这些技术在理论研究阶段都是以纯净的信号进行研究和分析的,然而在实际应用中,语音信号会不可避免的受到周围环境的影响,很多因素都会导致语音信号受到噪声的污染,比如语音信号在传输媒介中引入的噪声,电子设备内部的电噪声,还有来自其他音源的干扰等。这些干扰导致语音信号处理系统中使用的是非纯净的语音信号,直接使用带有噪声的语音会使系统的整体性能明显降低。在很多语音处理系统中,为了提高系统的整体性能,需要事先对语音信号进行预处理,降低噪声对语音信号的影响。
语音增强是提高语音质量的一种有效方法,从受噪声污染的语音信号中尽量分离噪声并尽可能地还原纯净语音信号,使接受语音的人觉得语音质量得到改善,增强语音信号的可懂性,提高语音处理系统的识别率和抗干扰能力。语音增强技术已经发展成了数字语音信号处理的一个重要分支,广泛地应用在降低听觉噪声以及语音识别系统和线性预测编码系统的预处理部分。
图1.1 语音增强系统结构图
- 2 -
重庆邮电大学移通学院本科毕业设计(论文)
二、噪声的种类和特点
噪声是指人们不需要的声音,此外,杂乱的振幅和频率,断续或统计上无规律的声震动也称为噪声。噪声来源于实际的环境中,其特性复杂,很难找到一种语音增强系统可以适应所有的噪声环境。因此,要根据实际情况来制定相应的语音增强算法。
根据噪声对语音频谱的干扰方式不同,可以将噪声分为加性噪声和非加性噪声。当噪声对语音的干扰表现为两者在时域上进行相加时,该噪声被称为加性噪声。实际环境中背景噪声可以看做加性噪声。当噪声和语音在频域上表象为相乘的关系,含噪信号表现在时域上即为噪声和语音信号的卷积。非加性噪声可以通过某种变换转换为加性噪声,从而用处理加性噪声的方法处理非加性噪声。为简化讨论,本文所分析的噪声都是加性噪声。语音处理中的加性噪声大致上有:周期性噪声、脉冲噪声、宽带噪声和同声道的其他语音干扰等。
(一)周期性噪声
周期性噪声主要来源于发动机等周期性运转的机械,电气干扰,特别是电源交流声也会引起周期性噪声,其特点是在频域上有许多离散的线谱。可现实环境中产生的周期性噪声并非只含线谱分量,还有许多的窄谱。而且往往是时变的,并与语音信号频谱重叠,只有用自适应滤波的方法才可以处理这类噪声。
(二)脉冲噪声
脉冲噪声来源于爆炸、撞击和放电等,表现为时域波形中突然出现的窄脉冲。脉冲噪声不太密,一般容易用内插法来去掉这种噪声。
(三)宽带噪声
宽带噪声来源于热噪声、气流(如风、呼吸)噪声及各种随机噪声源,量化噪声也可视为宽带噪声。平稳的宽带噪声,通常也可认为是白色高斯噪声;不具有白色频谱的噪声,也可以通过白化处理转化为白噪声。
(四)同声道语音干扰
多个语音信号在一个信道中同时传输相互干扰而产生的现象称为同声道语音干扰。根据人耳的感知特性,一个较弱的语音信号会由于出现一个更强的语音信号而被感知阈值掩蔽,即人耳的掩蔽效应。然而,由于人的双耳输入效应,人耳可以根据需要分辨出其中某个人的声音,这种能力被称作“鸡尾酒会效应”。人的主观感觉决定了语音增强的效果,因
- 3 -
重庆邮电大学移通学院本科毕业设计(论文)
此,合理的利用人耳的感知特性可以在语音增强中得到更好的增强效果。
三、语音增强技术的发展
正如前面提到的,由于噪声特性各异,因此语音增强方法也不同。在语音增强技术发展的40多年里,国内外的学者在对加性噪声研究了各种语音增强算法。至目前应用的方法可分为四种:参数方法、非参数方法、统计方法和其他方法。
(一)参数方法
此类方法主要依赖于使用的语音生成模型(例如AR模型),需要提取模型参数(如基因周期、LPC系数),常常使用迭代方法。如果实际噪声或语音条件与模型的有较大的差距或提出模型参数有困难,这类方法容易失效。常用的滤波器模型有梳状滤波器,维纳滤波器和卡曼滤波器等。
(二)非参数方法
因为不需要从带噪信号中估计模型参数,非参数方法应用范围广,限制少,但没有利用可能的统计信息,故结果一般不是最优。这种方法包括:谱减法、自适应滤波等。
(三)统计方法
统计方法较多的利用了语音和噪声的统计特性,一般需要建立模型库,需要训练过程获得初始统计参数,它与语音识别系统的联系很密切。如最小均方误差估计(MMSE)、听觉掩蔽效应等。在实际应用中发现,将统计方法与其他语音增强算法结合可以得到很好的降噪效果。在小波变换和离散余弦变换中常使用来寻找合适的阈值参数,在基于听觉掩蔽效应的语音增强系统中叶经常使用统计方法来确定听觉掩蔽阈值。在对语音信号和噪声信号进行分析时,选择合适的统计方法可以有效地确定语音和噪声的特征参数。
(四)其他方法
如小波变换、卡亨南-洛维变换(KLT)、离散余弦变换(DCT)、人工神经网络等。 利用之前的各种方法进行语音增强,需要知道噪声的有一些特征或统计性质。在没有噪声先验知识的情况下,从唯一带噪语音信号中分离出语音信号,这非常困难。小波变换能将信号在多个尺度上进行小波分解,各尺度上分解所得到的小波变换系数代表信号在不同分辨率上的信息。语音信号和噪声之间具有不同的Lipschitz指数,即信号具有正奇异性,而随机噪声具有负奇异性。这种性质在小波变换中,表现为信号的变换模值随尺度的增加而增加,随机噪声的变换模值随尺度的增加而减小。
- 4 -
重庆邮电大学移通学院本科毕业设计(论文)
第二节 语音信号处理技术概况
语言是人类交换信息最方便,最快捷的一种方式[2]。在这个信息化高度发达的现代社会,数字语音信号的传送、存储、识别、合成以及增强是现代信息网络中极为重要的组成部分。语音信号处理与很多领域的知识体系都有非常密切的关系,是语音和数学信号处理这两个学科衍生出来的边缘学科。随着心理学、语言学、信息论、密码学、模式识别以及人工智能等领域的不断进步以及电子技术的不断发展,数字语音信号处理也开始广泛应用于各个领域。数字语音信号合成的主要分支。
一、语音合成
在语音合成技术的发展中,早期的研究主要是采用参数合成方法。但真正具有实用意义的近代语音合成技术是随着计算机技术和数字信号处理技术的发展而发展起来的,主要是采用计算机产生高清晰度、高自然度的连续语音。使用语音合成技术的好处是不需要事先进语音信号的录入,只需要根据建立相应的语音合成法则,将需要表达的内容在机器内部进行编码,自动地生成相应的语音信号。相对于传统的语音播放系统,语音合成技术节省了资源空间并且提高了系统的的可扩展性。
现阶段语音合成的最大进展是已经能够实时地将任意文本转换成连续可懂的自然语句输出。文语转换使得数据通信和语音通信在终端一级实现交融,人们将有望在获取Internet信息时,使短信消息服务、电子邮件等多数以文本方式提供的信息也能用语音的方式输出。语音合成技术经历了从参数合成到拼接合成,再到两者的逐步结合,其不断发展的动力是人们认知水平和需求的提高。
二、语音编码
语音编码是将机器采集来的模拟语音信号按照一定规则转化为数字信号,而最简单的方法就是对模拟信号进行A/D采样。
语音编码是通过减少语音信号的冗余度和利用人耳掩蔽等特性实现数据压缩,目的就是在保证一定语音质量的前提下,尽可能降低编码的比特率,以节省频率资源。
- 5 -
重庆邮电大学移通学院本科毕业设计(论文)
三、语音识别
语音识别就是让机器能够识别和理解人类的语言内容,从而转化成相应的文本或命令的技术。在实际应用中,语音识别技术具有很多的优势。比如,在输入信息的时候,直接说出语音指令比通过键盘输入要更方便很多,在速度上也要快很多。然而语音识别也有缺陷,它涉及的分类众多,技术难点多,环境影响大,识别率不高等等,这都是未来需要解决的难题。
第三节 课题研究的背景与意义
在语音通信过程中不可避免地会受到来自周围环境和传输媒介引入的噪声、通信设备内部电噪声乃至其他说话者的干扰。这些干扰最终使得收听者收到的语音已经不是纯净的原始语音信号,而是受到噪声污染的带噪语音信号。语音识别系统在背景噪声很强时,识别正确率大大下降;在低速率语音参数编码中当模型参数受到混杂在语音信号中的背景噪声严重干扰时,重建语音质量将急剧恶化等等。
语音增强算法的研究对人的语音感知和听觉机理、听觉生理学实验的借鉴仍然是不充分的。一方面是由于神经的复杂结构和大脑的复杂作用,使得人们对听觉机理的研究和认识尚处于非常粗浅的阶段,另一方面则是因为语音增强算法的研究人员一般来自于信号处理领域,对语音学、心理学和生理学的结果没有给予足够的重视。所以,语音增强的研究有待于进一步的完善和发展,还具有很大的研究空间和研究价值。
第四节 课题研究的主要内容与结构
本文首先对语音信号处理和语音增强系统的发展与现状做了详细的介绍;其次对几种常用的语音增强算法进行了介绍,接着简要的介绍了小波分析的基本原理以及在信号处理中的应用;深入分析了小波阈值降噪算法的原理,最后利用MATLAB 软件进行了信号降噪的模拟仿真实验。
全文结构如下:
- 6 -
重庆邮电大学移通学院本科毕业设计(论文)
第一章简要介绍了语音信号处理的概况和语音增强技术的基本概念,本文主要的研究内部和论文结构;
第二章深入研究了几种常见的语音增强算法;
第三章介绍了小波变换的基本概念以及多分辨小波分析的构造,并介绍了小波在信号处理中的应用;
第四章详细介绍Matlab软件的功能与应用,利用Matlab进行仿真实验。
- 7 -
重庆邮电大学移通学院本科毕业设计(论文)
第二章 几种常用的语音增强方法
第一节 自适应噪声抵消法
自适应噪声抵消法可以在未知环境中跟踪时变的语音信号[3],通过构建自适应噪声滤波器来估计噪声,使增强后的语音信号达到最优,其原理如图2.1所示:
图2.1 自适应噪声抵消法结构图
如图2.1所示,s(n)为纯净语音信号,d(n)为加性平稳噪声,y(n)为带噪声语音信号,r(n)为自适应滤波器的参考噪声输入,v(n)是该滤波器的输出。自适应滤波器在输入过程中,当参考噪声发生变化时,可以自适应的调整滤波器参数,以达到最佳的语音增强效果。自适应滤波器通过对输入r(n)进行处理,使得输出的噪声估计v(n)尽量逼近噪声d(n),从带噪声语音中减去噪声分量,从而实现语音增强的效果。自适应滤波器通常采用FIR滤波器,以误差e(n)最小为标准,滤波器系数通过最小均方误差准则迭代估计。误差的表达式为:
e(n) s(n)d(n)v(n)s(n)d(n)wkr(nk) (2.1)
k1N式(2.1)中的为自适应滤波器的系数,N为滤波器抽头数。最小均方误差准则要求语音信号与噪声信号相互独立,这时得到的最小误差en可以保证对噪声的最优估计。如果噪声与语音信号不独立,需要在无音期进行噪声采集来确定滤波系数。
由于自适应噪声抵消法使用参考噪声作为辅助输入,可以随时对噪声分量做出比较好的估计,该方法对于带噪语音信号的增强效果较好。当参考噪声与语音中的噪声分量完全
- 8 -
重庆邮电大学移通学院本科毕业设计(论文)
相关时,该算法可以很彻底地抵消掉语音信号中噪声的分量,大大提升语音信号的可懂度。
第二节 谱减法语音增强技术
1979年,Boll首次提出了谱减法的语音增强思想,该方法由于原理简单、计算量小、易于实现等特性,是目前最通用的语音增强方法之一。其基本思想是[4]:
①假设语音和噪声统计独立噪声,按帧对语音进行处理; ②将所有帧分为语音帧和噪声帧;
③在噪声帧对噪声谱|N()|进行跟踪和更新,在语音帧用带噪语音频谱|Y()|减去噪
声谱幅度则可得到干净语音频谱|S|。
通过引入参数,谱减法可以提供更大的灵活性,式(2.2)给出代参谱减法表达式:
bb|Y||N|,|S|b|N|bb |S| (2.2) b|N|其它 当b1时,式(2.2)代表幅度谱减;当b2时,表示功率谱减。与为自由参数。 一旦在频域完成了谱减运算,便可由式(2.3)中的反变换得到增强语音:
S(k)IFFTS[(|)ejarYg()|] (2.3) 谱减法虽然简单,却有一个很大缺陷,那就是引入了恼人的“音乐噪声”。这种残留噪声是由于噪声估计不准确引起的,它们随机地分布在各个频率阶段并且具有一定的节奏起伏感,被形象地称之为“音乐噪声”。
第三节 基于维纳滤波法的语音增强
另一种可供选择的方法是设计一个线性滤波器H使得增强后信号具有最小均方误差,
也即skykhk,满足Esksk2最小。式(2.4)给出了频域上统计意义最优滤波器的解决方案:
- 9 -
重庆邮电大学移通学院本科毕业设计(论文)
H()|S()| (2.4) |S|2|N|2式(2.4)也被称为维纳滤波,是由Lim和Oppenheim于1979年首次提出来。实际情况下干净语音功率谱以及噪声功率谱均不可预先得到,常采用谱估计器、噪声估计器等方法分别得到干净语音功率谱的估计值S以及噪声功率谱估计值N。类似于谱减法,也可对维纳滤波器进行改进,得到带参数型维纳滤波器: |S2()| H() S2N2 (2.5)对照式(2.5)可知式(2.4)相当于1,1/2的情况,当1,1/2,式(2.5)相当于功率谱滤波。维纳滤波相对谱减法的主要优势在于:增强后语音的残留噪声类似于白噪声,“音乐噪声”得到了很大抑制。但是维纳滤波是基本平稳条件下最小均方误差下的最优估计,实际环境中,由于噪声是非平稳的,语音也是非平稳的,这使得维纳滤波存在一定的缺陷。 第四节 本章小结
本章介绍了几种常用的语音增强算法,包括自适应噪声抵消法,谱减法以及维纳滤波法,但每种方法都有各自的缺陷,比如,自适应噪声抵销法需要参考噪声输入,这样就增加了硬件上的成本;谱减法会引入类似音乐的噪声残余;维纳滤波法也只能使用傅里叶变换对信号进行处理,但傅里叶变换无法体现信号的细节特征。下一章将介绍能够在频域同时对信号进行处理的小波变换,并研究基于小波分析的语音增强算法。
- 10 -
重庆邮电大学移通学院本科毕业设计(论文)
第三章 小波变换在信号处理中的应用
小波分析的主要优点就是能够分析信号的局部特征和检测出许多其他分析方法忽略的信号特征,因此它拥有“数学显微镜”的称号。小波变换作为一种数字理论和方法在科学技术和工程界引起了越来越多的关注和重视。尤其在工程应用领域,特别是信号处理,应用数学,应用物理,地震勘测,故障诊断等领域被认为是近年来在工具和方法上的重大突破[5]。
第一节 小波理论的提出与发展
小波变换是近10年来迅速发展起来的一种时频局部分析方法,它克服了短时傅里叶变换固定分辨率的缺点,能够将信号在多尺度多分辨率上进行小波分解,各尺度上分解得到的小波系数代表信号在不同分辨率上的信息。同时小波变换与人耳的听觉特性非常相似,便于研究利用人耳的听觉特性,是分析语音这种非平稳信号的有力工具,所以近年来有很多研究者都利用小波变换来处理语音信号。小波变换去噪的原理是:语音信号的能量集中在低频段,而噪声能量则主要集中高频段,这样就可将噪声小波系数占主要成分的那些尺度上的噪声小波分量置零或给予很小的权重,然后用处理后的小波系数重构恢复信号。同时,随着小波变换理论的发展,小波变换去噪不断丰富,并且取得良好的效果,如1992年Mallat提出了利用小波变换模极大值去噪,Donobo在1995年提出了非线性小波变换阈值去噪,这种方法使得小波去噪得到广泛应用,吸引了众多研究者。
第二节 小波变换的基本性质
一、小波变换与傅里叶变换
在信号处理领域,傅里叶变换无疑是最重要的方法之一,是一个强有力的信号分析工具,并且具有很重要的物理意义[6]。信号f(x)的傅里叶变换公式和反演公式为:
- 11 -
重庆邮电大学移通学院本科毕业设计(论文)
fxeixdx (3.1)
1ixfxFedx2F()傅里叶变换能够反映信号的频谱特性,这点决定了他在信号分析中的地位。对平稳信号来说,理想工具是傅里叶变换,然而实际中,大多数的信号均含有大量的非稳态成份。例如语音信号,在不同的时间对应不同音节,它的频域特性随时间而变化,对这类时变信号进行分析,通常需要提取一种具有一定的时间和频率的基函数来分析时变信号。而傅里叶变换是一种全局的变换,只能反映信号的整体特征,在时域不能局部化,难以检测到局域突变信号,然而在实际应用中,人们感兴趣的信息往往都是在局部突然变化的信号里体现。 另一方面,在分析信号时发现,在分析高频信号时需要对时域中时间长度较短的信号分析才能得到高频分量;对低频信号,由于周期较长则需要对时域中时间较长的信号进行分析,这样才能得到一个周期内的完整信号。小波变换正具有这样的调节能力。 二、连续小波变换与离散小波变换
如果在L2R空间中的函数满足容许性条件: C||dR||RR0 (3.2)
就可以作为一个小波母函数,其中为ψ(x)的傅里叶变换。小波母函数根据参数a,b生成连续小波序列:
a,bx信号sx的连续小波变换为:
WSa,bsxa,bxdxsx,a,bx (3.4)
xb|a|a1a0 (3.3)
式(3.4)中a,bx为a,bx的共轭复数。
连续小波变换中的参数a,b以及x都是连续的变量,为了能更好的将小波算法移植到机器上,必须使用离散小波变换DWT(Discrete wavelet transform)。
- 12 -
重庆邮电大学移通学院本科毕业设计(论文)
mmTS为该尺度上的首先对参数a和b离散化,定义aa0为小波函数的尺度参数,bna0平移参数,得到离散小波序列
m/2 m,nxa0xnTSma0m,nZ (3.5)
在大多数的离散小波中,a02,TS1,即:
m/22mxn (3.6) m,nxa0
还有一种特殊的情况,只对尺度因子a做离散化处理并令a02,得到的小波函数称为二进小波:
(m,b)x2m/2xbm2mZ (3.7)
这就相当于尺度参数a取离散二进制数值am2m时的连续小波变换。
离散小波变换在信号细节的表现上不如连续小波变换,但具有计算量低的优点[7]。在连续的尺度参数和平移参数上计算小波系数的工作量非常大,并且会得到更多冗余的数据。 实际应用中,处理的信号基本上时能量有限的离散数字信号,使得离散小波变换已经足够。
三、多分辨分析
由于连续小波变换(CWT)和离散小波变换(DWT)对小波基函数都没有正交性,因此,得到的变换系数存在大量的冗余。要想得到冗余度尽量小的小波函数,最理想的情况是得到一组正交的小波基函数[8]。
在信号分析中,无论是傅里叶变换还是小波变换,其根本思想都是将信号分解成有限或者无限个简单信号的叠加,变换系数由信号与基函数做内积得到,如果使用的基函数具有正交的性质,那么各个基函数互相不干扰,这样就可以得到不冗余的变换系数了。
当满足P0stP说明函数族1,nt21stD1st条件时,函数族1,nx21/21/221t-n组成的空间V1和
21x-n组成的空间W1互为空间V0的正交补,即
V0V1W1 (3.8)在多分辨分析中,正交小波t的构造非常重要,直接决定了低通滤波器和高通滤波器的特性。如果hn,nZ和gn,nZ都为有限长的冲激响应,对信号做多分辨分析时
- 13 -
重庆邮电大学移通学院本科毕业设计(论文)
会非常方便。不同与傅里叶变换,小波变换中有多种小波函数可以选择,因此,小波函数的选择也会影响到信号分析的效果。
四、Mallat快速分解法
法国数学家Stephane Mallat于1988年在多分辨分析的基础上提出了Mallat快速算法。利用hn,nZ和gn,nZ作为滤波器的冲激响应,构建低通滤波器H反映信号的低频趋势,高通滤波器G反映信号的高频细节,从而对信号进行递推分解[8]。
m,ntn,nZ和m,ntn,nZ分解对空间Vm1上的信号st,利用正交基函数cm,n,nZ和细节系数dm,n,nZ,得到: 得到Vm空间上的概貌系数nm,ntdm,nm,nt (3.9) stcm,
nZnZcm,n,nZ可以继续分解得到: 因为VmVm1Wm1,Vm空间上的概貌系数
cnZm,nm,ntcm1,nm1,ntdm1,nm1,nt (3.10)
nZnZ结合低通滤波器hn,nZ和高通滤波器gn,nZ的性质可以得到各层系数的分解关系与重构关系:
分解关系:
ccm,khk-2nm1,nk- (3.11) dm1,ncm,kgk-2nk-重构关系:
cm,n
k-cm1,khk-2nk-cm1,kgk-2n (3.12)
图3.1 尺度空间分解
- 14 -
重庆邮电大学移通学院本科毕业设计(论文)
图3.2 尺度空间重构
根据分解和重构的关系我们可以将Mallat快速算法理解为:低层空间的低频概貌系数在通过低通分解滤波器和高通分解滤波器后接着进行二抽样,即得到高一层空间上的概貌系数和细节系数;相应地,高一层空间上的概貌系数和细节系数进行二差值后接着通过低通重构滤波器后即可得到低层空间上的低频概貌系数。
Mallat设计了一种快速的小波分解和重构算法,从离散信号s开始做分解算法,通过离散小波变换分解得到低频系数cA1和高频系数cD1,再由cA1分解得到下一层的低频系数cA2和高频系数cD2,依此类推。重构算法称为反离散小波变换,从第j层的低频系数cAj和高频系数cDj得到上一层的低频系数cAj-1,依此类推得到最初的离散信号s。
图3.3 j层小波分解
- 15 -
重庆邮电大学移通学院本科毕业设计(论文)
图3.4 小波分解示意图
图3.5 小波重构示意图
对信号进行小波分解实际上就是对离散信号做双通道滤波的过程,双通道滤波器组
hn,nZ和gn,nZ有所选取的小波函数决定。长度为n的信号s在通过长度为2N的
滤波器之后得到长度为n2N1的信号序列,再经过2抽取后得到的下一层低频和高频系数长度都为N(n1)/2。每一次分解都把离散信号分解为一个低频尺度系数和相应的高频细节系数,由于每次信号通过滤波器后输出序列长度都减半,使得总的输出序列长度不变,从而保证在对离散信号进行多分辨分析时无信息损失。
五、几种常用的小波函数介绍
(一)Haar小波
Haar函数是在小波分析中最早用到的一个具有紧支撑的正交小波函数,同时也是最简单的一个函数,它是非连续的,类似一个阶梯函数[9]。Haar函数与下面将要介绍的db小波函数是一样的。Haar函数的定义为:
- 16 -
重庆邮电大学移通学院本科毕业设计(论文)
110t21t1 (3.18) t120其他可知Haar小波的支集长度为1,滤波器长度为2,其确定时域不连续,频域局部性差,因此Haar小波常用于理论研究。
(二)Daubechies(dbN)小波系
Daubechies函数是由世界著名的小波分析学者Inrid Daubechies构造的小波函数,除了db1(即haar小波)外,dbN其他小波没有明确的表达式,但转换函数hk的平方模是很明确的。函数是紧支撑标准正交小波,它的出现使离散小波分析成为可能。
假设
PyCk0N1,其中
ykN1kkCkN1k,为二项式的系数,则
cos2Psin2 (3.19)22N m0其中,
21 m02该小波系有如下特性:
2N1k0hekjk (3.20)
①小波函数y和尺度函数f的有效支撑长度为2N-1,小波函数y的消失矩阶数为N。②大多数dbN不具有对称性,对于有些小波函数,不对称性是非常明显的。 ③正则性随着序号N的增加而增加。 ④是具有紧支集的正交小波。
Daubechies小波函数提供了比Haar函数更具有效的分析和综合。Daubechies系中的小波基记为DbN,N为序号,且N =1,2,...,10,由于 Daubechies小波函数具有紧支集,可以在数字信号分解过程中提供一种有限的数字滤波器,所以广泛应用于许多场合。
(三)Biorthogonal(biorNr.Nd)小波系
Biorthogonal正交小波系的主要特性体现在具有线性相位性,它主要应用在信号与图像的重构中。简记为BiorNr.Nd,其中,N为阶数,r表示重构(Reconstruction),d表示分解(Decomposition)。通常的用法是采用一个函数进行分解,用另外一个小波函数进行重构。
- 17 -
重庆邮电大学移通学院本科毕业设计(论文)
众所周知,如果使用同一个滤波器进行分解和重构,对称性和重构的精确性将成为一对矛盾,而采用两个函数,将有效地解决这个问题。
(四)Coiflet(coifN)小波系
Coiflet函数也是由Daubechies构造的一个小波函数,它具有coifN(N=1,2,3,4,5)这一系列。Coiflet具有比dbN更好的对称性。从支撑长度的角度看,coifN具有和db3N和sym3N相同的支撑长度;从消失矩的数目来看,coifN具有和db2N和sym2N相同的消失矩数目。
(五)SymletsA(symN)小波系
Symlets函数系是由Daubechies提出的近似对称的小波函数,它是对db函数的一种改进[10]。Symlets函数系通常表示为symN(N=2,3,„,8)的形式。Symlets函数系的构成思想主要是利用上述DbN小波系中的函数m0,建立一个函数Wz|m0|2,其中,zej,然后分解Wz为如下形式:
WzUzU (3.21)
Wz中不等于1的根会成对出现,如果一个等于z,另一个就等于1/z,适当地选择函
1z数U,使它所有根的模都小于1,就得到DbN小波,此时函数U所构成的滤波器为最小相位滤波器,如果选择U时,改变原则,使它构成的滤波器的对称性更好一些时,就得到了SymN小波系,它的其他特性与DbN类似。
(六)Morlet(morl)小波
Morlet小波是最常用的复值小波,其定义为
x2cos WxCe (3.22) 5x2Morlet小波是复值小波,因此它能提取信号的幅值和相位信息。它在时域和频域都有很好的局部化,但它的尺度函数不存在,且不具有正交性。
(七)Mexican Hat(mexh)小波
Mexican Hat函数为:
Wx231/41x2ex2/2 (3.23)
它是Gauss函数的二阶导数,因为它像墨西哥帽的截面,所以有时为墨西哥小帽函数。
- 18 -
重庆邮电大学移通学院本科毕业设计(论文)
墨西哥小帽函数在时域和频域都有很好的局部性,并且满足:
wxdx0 (3.20)
由于它的尺度函数不存在,因此分析不具有正交性。
(八)Meyer函数
Meyer小波的小波函数y和尺度函数f都是在频域中进行定义的,是具有紧支撑的正交小波。
342-1/2i/2sin||1,||2e2233384-1/2s||1,|| 2ei/2co (3.24) 2233280,||3,3其中,v(a)为构造Meyer小波的辅助函数,且有
423aa3584a70a20a
a0,1 (3.25) ,||-1/223-1/2s||1 2co2202324,|| (3.26)334,||3通过改变辅助函数a,可得到不同的Meyer小波系,它具有无穷阶导数。
第三节 小波变换在降噪中的应用
由于小波的窗口函数特性使得其在时频分析时可以很好地表现出信号的局部特征,噪声信号在时域上一般都会具有短时局部突变性,此时对信号做小波变换会随着时间窗口的不断减小而越加明显地反应出噪声局部特性,噪声信号对应的小波变换系数会表现得很明显[11]。根据小波变换的时频窗口函数的变换可以看出,当时间窗口变大时噪声的短时突变性对小波变换系数的影响逐渐减小,这时的小波变换系数基本上反映的是信号本身的边缘突变特性。正是由于具备了这样的时频分析特性,小波变换在信号降噪中得到了广泛的应
- 19 -
重庆邮电大学移通学院本科毕业设计(论文)
用,下面几种为常用的基于小波变换的去噪算法。
一、屏蔽去噪法
对信号进行多分辨分析,高分辨尺度中噪声引起的局部突表现得要比低分辨率尺度下明显得多,同时信号本身的边缘突变在低分辨率尺度下会反映的十分明显。屏蔽去噪法的思想是保留低分辨率尺度下的小波变换系数,将高分辨率尺度下的噪声部分去除,只保留信号的边缘突变部分。因此,屏蔽去噪法的关键是如何区分噪声和信号的边缘突变。
构建屏蔽滤波器是一个有效的方法,首先对带噪信号进行多分辨分析,利用可以明显体现信号本身边缘突变的低分辨率分解尺度下的小波系数构造滤波器,各层小波分解系数序列通过该滤波器时可以达到突出边缘突变以及削弱噪声的效果。最后将处理后的各层小波分解系数进行重构,得到降噪后的信号。
二、模极大值法
这种降噪方法由Mallat在1992年提出,在研究中发现对信号进行小波变换时,小波变换系数在一定区域内会达到一个极大值,该点即称为该区域内的小波变换模极大值。对于各个分辨率下的模极大值点进行分析,确定该模极大值是来源于噪声信号还是有用信号,进而进行信噪分离。
模极大值的基本思路是通过分析含噪信号在各分辨率下的小波系数,并观察其中的模极大值点,如果一个极大值点随分辨率的降低而减小即可判定为噪声信号,反之则判定为有用信号;去除噪声信号的极值点并保留有用信号的极值点后再对各层小波系数重构,从而得到去除噪声后的信号。
三、阈值去噪法
小波阈值去噪法最早由D.L.Dohono提出,是小波分析领域中最常用的一种算法,对于消除白噪声有很好的效果。对白噪声做小波变换后噪声能量分部在整个小波域上,而有用信号的能量在小波域内会集中体现在几个区域内,体现在小波系数上可以发现有用信号对应的小波系数要大于噪声对应的小波系数。
阈值去噪法的基本思路就是对带噪信号进行小波分解[12],根据有用信号和噪声的特性设置一个阈值,利用这个阈值对小波系数进行分析,当小波系数低于这个阈值时就判定这个小波系数对应的是噪声信号。在小波域内利用阈值来区分有用信号和噪声信号,最后将
- 20 -
重庆邮电大学移通学院本科毕业设计(论文)
处理后的小波系数进行重构从而得到降噪后的信号。
使用阈值去噪法首先要选取合适的小波函数,不同的小波函数在体现信号细节上有着不同的表现。之后再选定一个分解层数对信号进行多分辨分析,分解层一般根据经验来判断。接着利用各层的小波分解系数估计一个阈值并确定一个阈值函数,早期的阈值去噪法中的阈值函数直接将低于阈值的小波系数置零,这种方法被称为硬阈值函数。D.L.Dohono提出了一种新的阈值函数,通过计算小波系数与阈值的差值,按照一定关系对小波系数进行伸缩,这是著名的软阈值函数。软,硬阈值函数各有特点,硬阈值法计算量小,软阈值法得到的信号更加平滑,要根据实际情况选择合适的阈值函数。
第四节 本章小结
本章首先简要介绍小波变换的基本性质以及在信号处理中的应用;接着重点介绍了小波分析的原理,最后介绍小波变换在降噪中的应用,列出了几种常用的基于小波变换降噪算法,本文将采用阈值去噪算法对带噪语音信号进行语音增强处理。
- 21 -
重庆邮电大学移通学院本科毕业设计(论文)
第四章 基于MATLAB的算法实现与分析
第一节 MATLAB语言介绍
MATLAB是英文MATrix LABoratory(短阵实验室)的缩写,它的语言是一种解释执行的语言,调试程序手段丰富且调试速度快。MATLAB是集数值计算、符号运算及图形处理等强大功能于一体的科学计算语言。作为强大的科学计算平台,它几乎能够满足所有的计算需求[13]。
一、MATLAB的特点及优势
(一)编程效率高
它是一种面向科学与工程计算的高级语言,允许用数学形式的语言编写程序,而且比Basic、Fortran和C等语言更接近我们书写计算公式的思维方式,用Matlab编写程序犹如在演算纸上排列出公式与求解问题。因此,Matlab语言也可通俗的称为演算纸式科学算法语言。由于它编写简单,所以编程效率高,易学易懂。
(二)用户使用方便
Matlab语言是一种解释执行的语言(在没被专门的工具编译之前),它灵活、方便、调试程序手段丰富、调试速度快、需要学习时间少。人们用任何一种语言编写程序和调试程序一般都要经过四个步骤:编译、链接以及执行和调试。Matlab语言与其它语言相比,较好的解决了上述问题,把编译、连接和执行融为一体。它能在同一画面上进行灵活操作快速排除输入程序中的书写错误、语法错误甚至语意错误,从而加快了用户编写、修改和调试程序的速度。
(三)扩充能力强,交互性好
高版本的Matlab语音有丰富的库函数,在进行复杂的数学运算时可以直接调用,而且Matlab的库函数同用户文件在形式上一样,所以用户文件也可以作为Matlab的库函数来调用[14]。因而,用户可以根据自己的需要方便地建立和扩充新的库函数,提高Matlab使用效率和扩充它的功能。另外,为了充分利用FORTRAN、C等语言的资源,包括用户已编好的FORTRAN、C语言程序,通过建立M文件的形式,混合编程,方便地调用有关的
- 22 -
重庆邮电大学移通学院本科毕业设计(论文)
FORTRAN、C语言的子程序,还可以在C语言和FORTRAN语言中方便地使用Matlab的数值计算功能。良好的交互性使程序员可以使用以前编写过的程序,减少重复性工作,也使现在编写的程序具有重复利用的价值。
(四)移植性好,开放性好
Matlab是用C语言编写的,而C语言的可移植性很好。于是Matlab可以很方便地移植到能运用C语言的操作平台上。Matlab适合的工作平台有:WINDOWS系列、UNIX、LINUX、VMS6.1、POWERMAC.除了内部函数外,Matlab所有的核心文件和工具箱文件都是公开的,都是可读可写的源文件,用户可以通过对源文件的修改自己编程构成新的工具箱。
(五)语句简单,内涵丰富
Matlab语言中最基本最重要的成分是函数,其一般形式[a,b,c,...]=fun(x,y,z,...),即一个函数由函数名fun,输入变量(x,y,z,...)和输出变量[a,b,c,...]组成。同一函数名,不同数目的输入变量(包括无输入变量)及不同数目的输出变量,代表着不同的含义(有点像面向对象中的多态性)。这不仅使Matlab的库函数功能更丰富,而且大大减少了需要的磁盘空间,使得Matlab编写的M文件简单、短小而高效。
(六)高效方便的矩阵和数组运算
Matlab语言像BASIC、FORTRAN和C语言一样规定了矩阵的算术运算符、关系运算符、逻辑运算符、条件运算符及赋值运算符,而且这些运算符大部分可以毫无改变地照搬到数组间的运算中,有些如算术运算只要增加“.”就可用于数组间的运算。另外,它不需定义数组的维数,并给出矩阵函数、特殊矩阵专门的库函数,使之在求解诸如信号处理、建模、系统识别、控制、优化等领域的问题时,显得大方简洁、高效、方便,这是其他高级语言所不能相比的[15]。在此基础上,高版本的Matlab已逐步扩展到科学及工程计算的其他领域。因此,不久的将来,它一定能名符其实地成为“万能演算纸式的”科学算法语言。
(七)方便的绘图功能
Matlab的绘图功能是十分方便的,它有一些列绘图函数(命令),例如线性坐标、对数坐标、半对数坐标及极坐标[16]。只需调用不同的绘图函数(命令),即可在图上标出医题、XY轴标注。格(栅)绘制也只需调用相应的命令,简单易行。另外,在调用绘图函数时调整自变量可会出不变颜色的点、线、复线或多重线。这种为科学研究着想的设计是通过的编程语言所不及的。
- 23 -
重庆邮电大学移通学院本科毕业设计(论文)
第二节 MATLAB仿真结果分析
一、算法实现
我们的基于小波包变换的语音增强新算法的具体实现步骤如下[17]~[18]:
①采用5阶Daubechies小波对含噪语音进行Bark尺度小波包分解,得到68个终端结点分解结构;
②利用基于通用阈值[19]的UNIVu,j2lnN改进阈值算法计算每一级的结点阈值并对该结点的小波包分解系数进行基于我们提出的新的阈值函数的阈值处理; ③利用阈值处理后的小波包系数进行原始语音的小波包重建。
二、实验仿真
基于前面的算法,利用MATLAB软件平台进行实验仿真。我们的纯净语音的是“江苏苏州平台严重故障,请及时处理”的语音。噪声材料选自NOISEX.92数据库。
我们选用的是白噪声(White)通过改变噪声强度,对不同信噪比的带噪语音进行实验。
三、实验结果分析
语音增强效果的测试方法可以分为主观测方法和客观测试方法。实验中采用的客观测试方法是通过去噪前和去噪后的语音信号信噪比来检验语音增强的效果。主观测试方法是通过比较语音增强前后语音和可懂度来检验增强的效果。语音可懂度是指听音人对语音材料正确识别的比率,将处理后的语音信号和纯净的语音信号进行听觉上的对比,判断是否有明显的失真现象。
带噪语音信噪比:
SNRin10sn2n0L[xnsn]n0L (4.1)
2增强后语音信噪比:
- 24 -
重庆邮电大学移通学院本科毕业设计(论文)
L SNRout10sn2n0[xnsn]n0L (4.2)
2其中s(n)为纯净语音信号,x(n)为带噪语音信号,x(n)为增强后的语音信号。 图4.1、图4.2和图4.3分别是信噪比为5db、0db和-5db含白噪声的带噪语音的实验结果。
图4.1 信噪比为5dB的含白噪声的语音信号的实验结果
(a)纯净语音(b)带噪语音(c)增强后的语音
图4.1中(a)图形是纯净语音在Matlab中的仿真图形,我们可以看出(a)很干净,没有突(b)是在纯净语音中加入了信噪比为5dB的含白噪声语音在Matlab中的仿真图形,出。与(a)相比(b)有许多的突出,很明显地失真。(c)是在含噪语音(b)通过我们的增强算法得到的降噪后的仿真图形。与(b)做比较,减少了突出,更加的平滑。虽然无法和(a)一样干净,但也和(a)相差无几。
- 25 -
重庆邮电大学移通学院本科毕业设计(论文)
图4.2 信噪比为0dB的含白噪声的语音信号的实验结果
(a)纯净语音(b)带噪语音(c)增强后的语音
(b)为在纯净语音中加上的信噪比图4.2中的(a)与图4.1(a)是相同的纯净语音仿真图形。
为0dB的含噪语音仿真图形,和(a)相比有很多突出,与图4.1中的(b)相比突出的更多,说明也失真更多。(c)是经过我们语音增强算法后的降噪仿真图形,虽然与图4.1 (c)相比有多点的突出。与本图的(b)相比却是明显地减少了突出。
- 26 -
重庆邮电大学移通学院本科毕业设计(论文)
图4.3 信噪比为-5dB的含白噪声的语音信号的实验结果
(a)纯净语音(b)带噪语音(c)增强后的语音
图4.3中的(a)与图4.1、图4.2中的(a)是相同的纯净语音仿真图形,(b)为在纯净语音中加上的信噪比为-5dB的含噪语音仿真图形,突出比图4.2(b)的更多,已经不能分辨出(a)的基本图形,说明失真相当严重。(c)是在(b)基础上降噪后的仿真图形,虽然和图4.2(c)相比有还是有多一点的突出,但已经恢复了(a)的图形,只留少许的突出。
实验结果表明,无论是对信噪比高的带噪语音还是信噪比较低的带噪语音,我们的语音增强算法都有较好的客观上的增强效果,即较好的信噪比改善情况。
第三节 本章小结
在本章中,我们首先介绍了MATLAB软件并分析它的优势和特点。再利用MATLAB软件仿真:对纯净语音加噪得到带噪语音,再利用我们的语音增强算法降噪,两次变换带噪语音的信噪比,均可看出小波变换降噪明显。由此可得出小波变换具有良好的降噪能力。
- 27 -
重庆邮电大学移通学院本科毕业设计(论文)
结 论
本文开始介绍了语音信号处理的概况和语音增强的概念,接着研究了目前几种常见的语音增强算法,引出小波变换的概念,然后着重介绍小波变换的特点及优势,最后利用MATLAB软件仿真证明小波变换具有良好的降噪能力。
小波变换与傅里叶变换相比,具有明显的优越性。用小波变换进行信号降噪处理,既降低了噪声,同时又提高了信噪比,这说明小波降噪方法是切实可行的方案,但是由于小波函数很多,采用不同的小进行分解,得到的结果可能相差很大,而变换前并不能预知哪一种小波降噪效果更好,需反复试验比较才能得到良好的效果,这也是小波变换的难点之一。另外信号降噪过程中阈值的选取是十分重要的。
由于本人能力有限,不能深入研究小波。但看到前辈们对小波研究的认真、严谨和多样性,令我相信小波这个新兴的技术充满了活力,在不远的未来定会突飞猛进,在越来越多的领域得到应用,被越来越多的人认可。
- 28 -
重庆邮电大学移通学院本科毕业设计(论文)
致 谢
本设计是在胡章芳和刘金兰老师的悉心指导下完成的,论文从选题到测试成功再到最后成文,无不倾注着两位老师的心血,为我个人的成长和进步倾注了大量的汗水,诚挚地感谢两位老师给与我的关怀和教诲,老师们高深的学术造诣、严谨的治学态度、一丝不苟的工作作风、渊博的知识以及诲人不倦的导师风范,使我在学习生活中受益匪浅,并激励着我在今后的工作和学习中不断进步。在此,借论文完成之际,向我的导师们致以最诚挚的敬意和感谢。
感谢四年来给予我教诲的唐尚静老师,何方白老师,胡珺珺老师,杨浩澜老师,余晓玫老师,江宝安老师,赵瑞玉老师,高文文老师等等老师,因为有了诸位老师的耕耘才让我的大学生活过的充实而精彩,谢谢老师们!
我也要感谢我的母校重庆邮电大学移通学院,是她为我提供了良好的学习环境和生活环境,让我的大学生活丰富多姿,为我的人生留下精彩的一笔。
衷心感谢通信工程八班的同学们,我们一起学习、一起研究,共同进步,平日里大家关于毕业设计的讨论给了我很多启发,在此深表谢意。
最后,特别的向亲爱的家人表示深深的谢意,他们给予我的爱、理解、关心和支持是我不断前进的动力。
愿所有的老师、同学、朋友、亲人阖家欢乐,一生平安!
- 29 -
重庆邮电大学移通学院本科毕业设计(论文)
参考文献
[1] 韩纪庆等.语音信号处理[M].北京:清华大学出版社,2004.
[2] 张雪英.数学语音处理及MATLAB仿真[M].北京:电子工业出版社,2010. [3] 王振力,张雄伟,白志强.语音增强新方法的研究[J].南京邮电大学学报(自然科学版),2007,27(2),10-14.
[4] 张磊,王忠.基于自适应噪声估计的小波阈值语音增强[J].通信技术,2009,42(11):163-165.
[5] 冉启文等.小波分析及其分数阶傅里叶变换及应用[M].北京:国防工业出版社,2003. [6] Seok J W,Bae K S.Speech Enhance with Reduction of Noise of Components in the Wavelet Domain[A].Proc of the ICASSP[C].Munich.1997,2:1323-1326.
[7] Mallat S G,杨力华.信号处理的小波导引[M].北京:机械工业出版社,2002:340-358.
[8] 李冠,吴尽昭,范明钰.基于小波的信号去噪分析[M].通信技术,2010,43(9):79-81.
[9] 朱俊敏,张潇,王旌阳,吴粤北.小波域音频信号降噪研究[J].计算机工程与应用.2009,45(6):149-154.
[10] 林京,屈梁生.基于连续小波变换的奇异性检测与故障诊断[J],振动工程学报,2000(12).
[11] Zhu Hailong ,Kwok J T.Improving de2noising by coef2ficient de2noising and dyadic wavelet transform patternrecognition[C].New York:Proceedings of International Conference on Pattern Recognition ,2002,2:273-276.
[12] 林京,屈梁生.基于连续小波变换的奇异性检测与故障诊断[J],振动工程学报,2000 [13] 何坤,李健,乔强等.非平稳环境下基于小波变换的信号去噪,信号处理[J].2005,21(3):244-248.
[14] 曲天书,戴逸松,王树勋.基于SURE无偏估计的自适应小波阈值去噪[J],电子学报.2002,30(2):266-268.
[15] 马晓红,宋辉,殷福亮.自适应小波阈值语音增强新方法[J],大连理工大学学报,2006,46(4):561-566.
- 30 -
重庆邮电大学移通学院本科毕业设计(论文)
[16] 陈立伟,赵春晖,姜海丽.基于自适应提升小波变换的语音增强算法的研究[J],哈尔滨工程大学学报,2005,26(5),668-671.
[17] Sungwook Chang,Y.Kwon and Sung—i 1 Yang.Speech enhancement fornon—stationary noise environment by adaptive wavelet packet,AcoustiCS,Speech,and Signal Processing,2002(1CASSP-02)[C],V01.1,2002,561-564.
[18] Yu Shao,Chip—Hong Chang,A versatile speech enhancement system basedon perceptual wavelet denoising,Circuits and System[J],V01.2,May 2005. [19] 石钧.多小波理论和应用信号处理[J].信号处理,1999(4):25-27.
- 31 -
重庆邮电大学移通学院本科毕业设计(论文)
附 录
一、英文原文
Review of UMTS
John Knowles
The European/Japanese 3G standard is referred to as UMTS. UMTS is one of a number of standards ratified by the ITU-T under the umbrella of IMT-2000. It is currently the dominant standard, with the US CDMA2000 standard gaining ground, particularly with operators that have deployed cd ma One as their 2G technology. At time of writing,Japan is the most advanced in terms of 3G network deployment. The three incumbent operators there have implemented three different technologies: J-Phone is using UMTS,KDDI has a CDMA2000 network, and the largest operator NTT Do Co Mo is using a system branded as FOMA (Freedom of Multimedia Access). FOMA is based on the original UMTS proposal, prior to its harmonization and standardization.
The UMTS standard is specified as a migration from the second generation GSM standard to UMTS via the General Packet Radio System (GPRS) and Enhanced Data for Global Evolution (EDGE), as shown in Figure. This is a sound rationale since as of April 2003, there were over 847 Million GSM subscribers worldwide1, accounting for 68% of the global cellular subscriber figures. The emphasis is on keeping as much of the GSM network as possible to operate with the new system.
We are now well on the road towards Third Generation (3G), where the network will support all traffic types: voice, video and data, and we should see an eventual explosion in the services available on the mobile device. The driving technology for this is the IP protocol. Many cellular operators are now at a position referred to as 2.5G, with the deployment of GPRS, which introduces an IP backbone into the mobile core network.The diagram below, Figure 2, shows an overview of the key components in a GPRS network, and how it fits into the existing GSM infrastructure. The interface between the SGSN and GGSN is known as the G interface and uses the GPRS tunneling protocol (GTP, discussed later). The primary reason for the introduction of this infrastructure is to offer connections to external packet networks, such as the Internet or a corporate Intranet.
This brings the IP protocol into the network as a transport between the SGSN and GGSN. This allows data services such as email or web browsing on the mobile device,with users being charged based on volume of data rather than time connected.
The dominant standard for delivery of 3G networks and services is the Universal Mobile Telecommunications System, or UMTS. The first deployment of UMTS is the Release ‟99 architecture.
In this network, the major change is in the radio access network (RAN) with the introduction of CDMA technology for the air interface, and ATM as a transport in the transmission part. These changes have been introduced principally to support the transport of voice, video and data
- 32 -
重庆邮电大学移通学院本科毕业设计(论文)
services on the same network. The core network remains relatively unchanged, with primarily software upgrades. However, the IP protocol pushes further into the network with the RNC now communicating with the 3G SGSN using IP.
The next evolution step is the Release 4 architecture, Figure 4. Here, the GSM core is replaced with an IP network infrastructure based around Voice over IP technology.
The MSC evolves into two separate components: a Media Gateway (MGW) and an MSC Server (MSS). This essentially breaks apart the roles of connection and connection control. An MSS can handle multiple MGW, making the network more scale able.
Since there are now a number of IP clouds in the 3G network, it makes sense to merge these together into one IP or IP/ATM backbone (it is likely both options will be available to operators.) This extends IP right across the whole network, all the way to the BTS.This is referred to as the All-IP network, or the Release 5 architecture, as shown in Figure 5. The HLR/VLR/EIR are generalised and referred to as the HLR Subsystem(HSS).
Now the last remnants of traditional telecommunications switching are removed, leaving a network operating completely on the IP protocol, and generalised for the transport of many service types. Real-time services are supported through the introduction of a new network domain, the IP Multimedia Subsystem (IMS).
Currently the 3GPP are working on Release 6, which purports to cover all aspects not addressed in frozen releases. Some call UMTS Release 6 4G and it includes such issues as interworking of hot spot radio access technologies such as wireless LAN.
Like any CDMA system, UMTS needs a wide frequency band in which to operate to effectively spread signals. The defining characteristic of the system is the chip rate, where a chip is the width of one symbol of the CDMA code. UMTS uses a chip rate of 3.84Mchips/s and this converts to a required spectrum carrier of 5MHz wide. Since this is wider than the 1.25MHz needed for the existing cd ma One system, the UMTS air interface is termed „wideband‟ CDMA.
There are actually two radio technologies under the UMTS umbrella: UMTS FDD and TDD. FDD stands for Frequency Division Duplex, and like GSM, separates traffic in the uplink and downlink by placing them at different frequency channels. Therefore an operator must have a pair of frequencies allocated to allow them to run a network, hence the term „paired spectrum‟. TDD or Time Division Duplex requires only one frequency channel, and uplink and downlink traffic are separated by sending them at different times. The ITU-T spectrum usage, as shown in Figure 6, for FDD is 1920-980MHz for uplink traffic, and 2110-2170MHz for downlink. The minimum allocation an operator needs is two paired 5MHz channels, one for uplink and one for downlink, at a separation of 190MHz. However, to provide comprehensive coverage and services, it is recommended that an operator be given three channels. Considering the spectrum allocation, there are 12 paired channels available, and many countries have now completed the licencing process for this spectrum, allocating between two and four channels per licence. This has tended to work out a costly process for operators, since the regulatory authorities in some countries, notably in Europe, have auctioned these licences to the highest bidder. This has resulted in spectrum fees as high as tens of billions of dollars in some countries.
The Time Division Duplex (TDD) system, which needs only one 5MHz band in which to operate,often referred to as unpaired spectrum. The differences between UMTS FDD and TDD are only evident at the lower layers, particularly on the radio interface. At higher layers, the bulk of the operation of the two systems is the same. As the name suggests, the TDD system separates uplink and downlink traffic by placing them in different time slots. As will be seen later, UMTS
- 33 -
重庆邮电大学移通学院本科毕业设计(论文)
uses a 10ms frame structure which is divided into 15 equal times lots. TDD can allocate these to be either uplink or downlink,with one or more breakpoints between the two in a frame defined. In this way, it is well suited to packet traffic, since this allows great flexibility in dynamically dimensioning for asymmetry in traffic flow.
The TDD system should not really be considered as an independent network, but rather as a supplement for an FDD system to provide hotspot coverage at higher data rates. It is rather unsuitable for large scale deployment due to interference between sites, since a BTS may be trying to detect a weak signal from a UE, which is blocked out by a relatively strong signal at the same frequency from a nearby BTS. TDD is ideal for indoor coverage over small areas.
Since FDD is the main access technology being developed currently, the explanations presented here will focus purely on this system.
The procedures of a mobile device connecting to a UMTS network can be split into two areas: the access stratum (AS) and the non-access stratum (NAS). The access stratum involves all the layers and subsystems that offer general services to the non-access stratum. In UMTS, the access stratum consists of all of the elements in the radio access network, including the underlying ATM transport network, and the various mechanisms such as those to provide reliable information exchange. All of the non-access stratum functions are those between the mobile device and the core network, for example, mobility management. Figure 7 shows the architecture model. The AS interacts with the NAS through the use of service access points (SAP).
UMTS radio access network (UTRAN) provides this separation of NAS and AS functions, and allows for AS functions to be fully controlled and implemented within the UTRAN. The two major UTRAN interfaces are the U, which is the interface between the mobile device, or User Equipment (UE) and the UTRAN, and the Iu, which is the interface between the UTRAN and the core network. Both of these interfaces can be divided into control and user planes each with appropriate protocol functions.
A Bearer Service is a link between two points, which is defined by a certain set of characteristics. In the case of UMTS, the bearer service is delivered using radio access bearers.
A Radio access bearer (RAB) is defined as the service that the access stratum (i.e.UTRAN) provides to the non-access stratum for transfer of user data between the User Equipment and Core Network. A RAB can consist of a number of subflows, which are data streams to the core network within the RAB that have different QoS characteristics,such as different reliabilities. A common example of this is different classes of bits with different bit error rates can be realised as different RAB subflows. RAB subflows are established and released at the time the RAB is established and released, and are delivered together over the same transport bearer.
A Radio Link is defined as a logical association between a single User Equipment (UE) and a single UTRAN access point, such as an RNC. It is physically comprised of one or more radio bearers and should not be confused with radio access bearer.
Looking within the UTRAN, the general architecture model is as shown in Figure 8 below. Now shown are the Node B or Base Station (BTS) and Radio Network Controller (RNC) components, and their respective internal interfaces. The UTRAN is subdivided into blocks referred to as Radio Network Subsystems (RNS), where each RNS consists of one controlling RNC (CRNC) and all the BTS under its control. Unique to UMTS is the interface between RNS, the Iur iterface, which plays a key role in handover procedures. The interface between the BTS and RNC is the Iub interface.
All the „I‟ interfaces: Iu, Iur and Iub, currently3 use ATM as a transport layer. In the context
- 34 -
重庆邮电大学移通学院本科毕业设计(论文)
of ATM, the BTS is seen as a host accessing an ATM network, within which the RNC is an ATM switch. Therefore, the Iub is a UNI interface, whereas the Iu and Iur interfaces are considered to be NNI, as illustrated in Figure 9.
This distinction is because the BTS to RNC link is a point-to-point connection in that a BTS or RNC will only communicate with the RNC or BTS directly connected to it, and will not require communication beyond that element to another network element.
For each user connection to the core network, there is only one RNC, which maintains the link between the UE and core network domain, as highlighted in Figure 10. This RNC is referred to as the serving RNC or SRNC. That SRNC plus the BTS under its control is then referred to as the SRNS. This is a logical definition with reference to that UE only. In an RNS, the RNC that controls a BTS is known as the controlling RNC or CRNC. This is with reference to the BTS, cells under its control and all the common and shared channels within.
As the UE moves, it may perform a soft or hard handover to a nother cell. In the case of a soft handover, the SRNC will activate the new connection to the new BTS. Should the new BTS be under the control of another RNC, the SRNC will also alert this new RNC to activate a connection along the Iur interface. The UE now has two links, one directly to the SRNC, and the second, through the new RNC along the Iur interface. In this case, this new RNC is logically referred to as a drift RNC or DRNC, see Figure 10. It is not involved in any processing of the call and merely relays it to the SRNC for connection to the core. In summary, SRNC and DRNC are usually associated with the UE and the CRNC is associated with the BTS. Since these are logical functions it is normal practice that a single RNC is capable of dealing with all these functions.
A situation may arise where a UE is connected to a BTS for which the SRNC is not the CRNC for that BTS. In that situation, the network may invoke the Serving RNC Relocation procedure to move the core network connection. This process is described in Section 3.
- 35 -
重庆邮电大学移通学院本科毕业设计(论文)
二、英文翻译
通用移动通信系统的回顾
网络架构欧洲/日本的3G标准,被称为UMTS。UMTS是一个在IMT-2000保护伞下的ITU-T批准的许多标准之一。随着美国的CDMA2000标准的发展,它是目前占主导地位的标准,特别是运营商将cdmaOne部署为他们的2G技术。在写这本书时,日本是在3G网络部署方面最先进的。三名现任运营商已经实施了三个不同的技术:J - PHONE使用UMTS,KDDI拥有CDMA2000网络,最大的运营商NTT DoCoMo正在使用品牌的FOMA(自由多媒体接入)系统。FOMA是基于原来的UMTS协议,而且更加的协调和标准化。
UMTS标准被定义为一个通过通用分组无线系统(GPRS)和全球演进的增强数据技术(EDGE)从第二代GSM标准到UNTS的迁移,如图。这一个广泛应用的基本原理,因为自2003年4月起,全球有超过847万GSM用户,占全球的移动用户数字的68%。重点是在保持尽可能多的GSM网络与新系统的操作。
我们现在在第三代(3G)的发展道路上,其中网络将支持所有类型的流量:语音,视频和数据,我们应该看到一个最终的爆炸在移动设备上的可用服务。此驱动技术是IP协议。现在,许多移动运营商在简称为2.5G的位置,伴随GPRS的部署,即将IP骨干网引入到移动核心网。显示了一个在GPRS网络中的关键部件的概述,以及它是如何适应现有的GSM基础设施。
SGSN和GGSN之间的接口被称为Gn接口和使用GPRS隧道协议(GTP的稍后讨论)。引进这种基础设施的首要原因是提供连接到外部分组网络如,Internet或企业Intranet。这使IP协议作为SGSN和GGSN之间的运输工具应用到网络。这使得数据服务,如移动设备上的电子邮件或浏览网页,用户被起诉基于数据流量,而不是时间连接基础上的数据量。3G网络和服务交付的主要标准是通用移动通信系统,或UMTS。首次部署的UMTS是发行'99架构。
在这个网络中,主要的变化是在无线接入网络(RAN)的CDMA空中接口技术的引进,和在传输部分异步传输模式作为一种传输方式。这些变化已经引入,主要是为了支持在同一网络上的语音,视频和数据服务的运输。核心网络保持相对不变,主要是软件升级。然而,随着目前无线网络控制器使用IP与3G的GPRS业务支持节点进行通信,IP协议进一
- 36 -
重庆邮电大学移通学院本科毕业设计(论文)
步应用到网络。
未来的进化步骤是第4版架构,在这里,GSM的核心被以语音IP技术为基础的IP网络基础设施取代。
海安的发展分为两个独立部分:媒体网关(MGW)和MSC服务器(MSS)的。这基本上是打破外连接的作用和连接控制。一个MSS可以处理多个MGW,使网络更具有扩展性。因为现在有一些在3G网络的IP云,合并这些到一个IP或IP/ ATM骨干网是很有意义的(它很可能会提供两种选择运营商)。这使IP权利拓展到整个网络,一直到BTS(基站收发信台)。这被称为全IP网络,或推出五架构。在HLR/ VLR/VLR/EIR被推广和称为HLR的子系统(HSS)。现在传统的电信交换的最后残余被删除,留下完全基于IP协议的网络运营,并推广了许多服务类型的运输。实时服务通过引入一个新的网络域名得到支持,即IP多媒体子系统(IMS)。
目前3GPP作用于第6版,意在包含冷冻版本没有涵盖所有方面。有些人称UMTS 第6版为4G和它包括热点无线电接入技术,如无线局域网互联互通的问题。
像任何CDMA系统,UMTS需要一个宽的频带,在这个频带上有效地传播信号。该系统的特点是芯片的速度,芯片是一个符号的CDMA代码的宽度。 UMTS使用的芯片速率为3.84Mchips/秒,这转换到所需的频谱载波宽度为5MHz。由于这比现有的cdmaOn系统所需的1.25MHz带宽要宽,UNTS空中接口被称为“宽带”CDMA。
实际上在UMTS下有两个无线电技术:UMTS软盘驱动器和时分双工。FDD代表频分双工,如GSM,通过把它们放置在不同的频率信道分离为交通上行和下行。因此,一个运营商必须有一对频率分配,使他们能够运行网络,即术语成对频谱。TDD或时分双工只需要一个频率通道,上行和下行流量是在不同的时间分开发送。 ITU-T的频谱使用。对于FDD是1920 - 1980MHz的为上行流量,2110-2170MHz为下行的。运营商需要的最小分配是两个成对5MHz的信道,一个用于上行,一个用于下行的,两者相分离190MHz。然而,为了给客户提供全面的覆盖和服务,建议给予每个运营商三个信道。考虑到频谱分配,有12对可用的渠道,现在许多国家都完成了这个频谱的许可过程,每个许可证配置两个到四个信道。这趋向给运营商造成一个昂贵的花费,因为一些国家的监管部门,特别是在欧洲,已经将这些许可证拍卖给出价最高的人。这就造成了频谱费用在一些国家高达数十亿美元。
时分双工(TDD)系统,只需要一个5MHz的带宽在其中操作,通常被称为非成对频谱。UMTS FDD和TDD之间的差异只有在较低层明显,特别是在无线接口。在更高的层次,两个系统的运作大部分是相同的。正如它的名字表明,TDD系统通过把它们放置在不
- 37 -
重庆邮电大学移通学院本科毕业设计(论文)
同的时间空挡分为上行流量和下行流量。正如我们以后可以看到的, UMTS使用一个分为15个相等的时隙的10ms帧结构。时分双工可以分配这些为上行或下行,在一个确定的帧结构中这两者间可以有一个或多个断点。以这种方式,这是非常适合数据包通信的,因为这对于不对称的通信流的动态标注可以有极大的灵活性。
TDD系统真的不应该被视为一个独立的网络,而是作为一个FDD系统的补充,提供更高的数据传输率的热点覆盖。由于站点之间的干扰,它相当不合适用作大规模部署,因为一个基站可以尝试从UE检测微弱信号,这被来自邻近基站的相同频率的相对较强的信号阻止了。时分双工对于小面积的室内覆盖是理想的。
由于FDD是目前正在发展的主要的接入技术,这里介绍的解释将完全专注于这个系统。
移动设备连接到UMTS网络的程序可以分成两领域:接入层(AS)和非接入层(NAS)。接入层涉及所有提供普遍服务的非接入层和子系统阶层。在UMTS接入层包括无线接入的所有元素网络,包括潜在的ATM传输网络,各种机制提供可靠的信息交换等。所有的非接入层功能都在移动设备和核心网络之间,例如,移动性管理。AS通过使用服务接入点(SAPS)与NAS交互。
UMTS无线接入网(UTRAN)提供NAS和AS功能的分离,并允许AS功能在UTRAN中被完全控制和实施。两大UTRAN的接口是UU,这是移动设备之间的接口,或者用户设备(UE)和UTRAN之间,Iu,这是UTRAN和核心网之间的接口。这些接口都可以分为控制平面和用户平面,每个都有适当的协议功能。承载服务是两点间的连接,这是由一组特定的特点定义的。在UMTS的情况下,使用无线接入承载提供承载服务。
无线接入承载(RAB)被定义为用户设备和核心网络之间的服务,即接入层(IEUTRAN)为非接入层提供用户数据传输。一个RAB可以由一些支流组成,这是数据流在有不同的QoS特性的RAB流向核心网络,如不同的可靠性。一个常见的例子是不同类别的位有不同的位错误率,可以实现不同的RAB子流。RAB子流在RAB建立和释放的同时建立和释放,并通过相同的传输承载一起传输。
无线电链路被定义为一个单一的用户设备(UE)和一个单一的UTRAN接入点之间的逻辑关联,如一个RNC。它实际上是由一个或多个无线承载组成和不应和无线接入承载混淆。在UTRAN内部来看,总体架构模型在下面的图B基站(BTS)和无线网络控制器(RNC)组件,以及它们各自的内部接口。UTRAN分为被称为无线网络子系统(RNS)的块,其中每个RNS由一个控制RNC和控制下的所有基站组成。UMTS的独特之处是RNS之间的接
- 38 -
重庆邮电大学移通学院本科毕业设计(论文)
口,Iur接口,在交接过程起了关键作用。基站和RNC之间的接口是Iub接口。
所有“I”接口:Iu,Iur和Iub,currently3将ATM用作传输层。在ATM的背景下,BTS被看作是ATM网络的主机访问,在这个网络中RNC是一个ATM交换机。因此,Iub是一个UNI接口,而Iu和Iur接口被认为是NNI。
这种区别是因为基站到RNC的链接是一个点至点连接,在这个连接中一个基站或RNC只和与它直接连接的RNC或基站通信,并且不会要求和其他网络元素的元素。
对于每个用户连接到核心网络,这里只有一个RNC,保持UE和核心网域之间的联系,突出显示。RNC是指服务RNC或SRNC。SRNC加上在其控制下的基站被称为SRNS。这是一个只以UE为参考的逻辑定义。在一个RNS中,控制基站的RNC被称为控制RNC或CRNC。这是以基站为参考,其控制下的部分和所有常见的和共享的渠道内。
因为UE移动,它可能执行软或硬切换到另一个蜂窝。在软切换的情况下,SRNC将启动新的连接到新的基站。新的基站应该是在另一个RNC控制下,SRNC中也会提醒这个新的RNC启动沿Iur接口连接。UE现在有两个连接,一个直接连接SRNC,第二个通过新的RNC连接Iur接口。在这种情况下,这个新的RNC在逻辑上被称为漂移RNC或DRNC。它不涉及任何呼叫处理,只是将它中继到SRNC以连接核心网络,总之,SRNC和DRNC通常与UE相关联,CRNC与BTS相关联。由于这些是逻辑功能,一个单一的RNC是能够处理所有这些功能是很正常的做法。
一个UE连接到基站,它的SRNC并不是这个基站的控制RNC,这种情况可能会出现。在这种情况下,这个网络可以调用SRNC的搬移程序来移动核心网络的连接。
- 39 -
重庆邮电大学移通学院本科毕业设计(论文)
三、源程序
%% a little clean work clear;clc;close all;
%% a.生成混杂白噪声的带噪语音部分 %读入纯净语音并显示
x=wavread('D:\\EXPERI\\clean.wav'); subplot(3,1,1); plot(x);
axis([0 55521 -0.5 0.5]); x1=length(x); %给定信噪比 SNR=5;
%利用信噪比和语音能量求得要添加的白噪声 clean_energy=sum(x.*x);
addnoise_energy=clean_energy*(10^-(SNR/10)); noise=normrnd(0,1,x1,1); noise_energy=sum(noise.*noise);
q=addnoise_energy/noise_energy;noise_new=sqrt(q)*noise; %在纯净语音中加入白噪声 y=x+noise_new;
%将数据写入语音文件并显示
wavwrite(y,8000,'D:\\EXPERI\\WN_clean.wav'); subplot(3,1,2); plot(y);
axis([0 55521 -0.5 0.5]);
%% b.基于听觉特性的小波包语音增强算法实现部分 %Bark小波包分解
x=wavread('D:\\EXPERI\\WN_clean.wav');
- 40 -
重庆邮电大学移通学院本科毕业设计(论文)
wptree=wpdec(x,7,'db5');
%把Bark小波分解包中的第五层的叶结点合并 for k=47:62
wptree=wpjoin(wptree,k); end
%把Bark小波分解包中的第六层的叶结点合并 for k=79:86
wptree=wpjoin(wptree,k); end for k=91:94
wptree=wpjoin(wptree,k); end
%plot(wptree);
%将各节点按相应阈值进行处理 sorh='n'; %所选阈值函数 %----------- %处理7层节点 %-----------
for i=0:31c70(:,i+1)=wpcoef(wptree,[7 i]); q70=median(abs(c70(:,i+1)));
arr70(i+1)=(q70/0.6745).*sqrt(2*log(442)); if(i>0)
c70(:,i+1)=wthresh(c70(:,i+1),sorh,arr70(i+1));
wptree=write(wptree,'data',[7 i],c70(:,i+1));%修改节点系数值 end end for i=48:55
c71(:,i-47)=wpcoef(wptree,[7 i]); q71=median(abs(c71(:,i-47)));
- 41 -
重庆邮电大学移通学院本科毕业设计(论文)
arr71(i-47)=(q71/0.6745).*sqrt(2*log(442)); c71(:,i-47)=wthresh(c71(:,i-47),sorh,arr71(i-47)); wptree=write(wptree,'data',[7 i],c71(:,i-47)); %修改节点系数值 end %----------- %处理6层节点 %----------- for j=16:23
c60(:,j-15)=wpcoef(wptree,[6 j]); q60=median(abs(c60(:,j-15)));
arr60(j-15)=(q60/0.6745).*sqrt(2*log(876)); c60(:,j-15)=wthresh(c60(:,j-15),sorh,arr60(j-15)); wptree=write(wptree,'data',[6 j],c60(:,j-15)); %修改节点系数值 end for j=28:31
c61(:,j-27)=wpcoef(wptree,[6 j]); q61=median(abs(c61(:,j-27)));
arr61(j-27)=(q61/0.6745).*sqrt(2*log(876)); c61(:,j-27)=wthresh(c61(:,j-27),sorh,arr61(j-27)); wptree=write(wptree,'data',[6 j],c61(:,j-27)); end
%修改节点系数值end %----------- %处理5层节点 %------- for k=16:31
c5(:,k-15)=wpcoef(wptree,[5 k]); q5=median(abs(c5(:,k-15)));
- 42 -
重庆邮电大学移通学院本科毕业设计(论文)
arr5(k-15)=(q5/0.6745).*sqrt(2*log(1743)); c5(:,k-15)=wthresh(c5(:,k-15),sorh,arr5(k-15));
wptree=write(wptree,'data',[5 k],c5(:,k-15));%修改节点系数值 end %重建信号 y=wprec(wptree); subplot(3,1,3); plot(y);
axis([0 55521 -0.5 0.5]);
wavwrite(y,8000,'D:\\EXPERI\\WtDeSpeech.wav'); %% c.修改后的wthresh.m文件 function y = wthresh(x,sorh,t)
%WTHRESH Perform soft、hard and new thresholding. switch sorh case's'
tmp=(abs(x)-t); tmp=(tmp+abs(tmp))/2; y=sign(x).*tmp; case'h'
y=x.*(abs(x)>t); case'n'
tmp=(sign(x).*(t/((exp(4.*t)-exp(2.*t)))).*(exp(4.*abs(x))-exp(2.*t))); y=tmp.*(abs(x)>(t/2)&(abs(x)<=t))+x.*(abs(x)>t); otherwise
error('Invalid argument value.') end
- 43 -
因篇幅问题不能全部显示,请点此查看更多更全内容
怀疑对方AI换脸可以让对方摁鼻子 真人摁下去鼻子会变形
女子野生动物园下车狼悄悄靠近 后车司机按喇叭提醒
睡前玩8分钟手机身体兴奋1小时 还可能让你“变丑”
惊蛰为啥吃梨?倒春寒来不来就看惊蛰
男子高速犯困开智能驾驶出事故 60万刚买的奔驰严重损毁