您的当前位置:首页基于声纹识别技术的仪器设备状态检测系统及其方法[发明专利]

基于声纹识别技术的仪器设备状态检测系统及其方法[发明专利]

来源:小侦探旅游网
(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号 CN 111524523 A(43)申请公布日 2020.08.11

(21)申请号 202010336816.7(22)申请日 2020.04.26

(71)申请人 中南民族大学

地址 430074 湖北省武汉市洪山区民院路

708号(72)发明人 杨春勇 付尧 

(74)专利代理机构 武汉宇晨专利事务所 42001

代理人 黄瑞棠(51)Int.Cl.

G10L 17/02(2013.01)G10L 15/05(2013.01)G10L 17/04(2013.01)G10L 25/18(2013.01)

权利要求书1页 说明书5页 附图2页

(54)发明名称

基于声纹识别技术的仪器设备状态检测系统及其方法(57)摘要

本发明公开了一种基于声纹识别技术的仪器设备状态检测系统及其方法,涉及语音信号处理技术领域。本系统是仪器设备(1)、声音传感器(2)和电脑(3)依次串行连接;电脑(3)是预处理程序(31)、特征提取程序32)、特征参考程序(33)和仪器工作状态判断结果(35)依次交互;标准数据集生成模块(34)和特征参考程序(33)比对。相较于现有技术,本发明的有益效果是:①使用AMDF算法增强非短时平稳和非周期声纹特征;②声音信号分频分类特征提取;③仪器设备声纹特征数据集创建。CN 111524523 ACN 111524523 A

权 利 要 求 书

1/1页

1.一种基于声纹识别技术的仪器设备状态检测系统,其特征在于:包括待检测的仪器设备(1),设置有声音传感器(2)和电脑(3);待检测的仪器设备(1)、声音传感器(2)和电脑(3)依次串行连接;电脑(3)包括预处理程序(31)、特征提取程序(32)、特征参考程序(33)、标准数据集生成模块(34)和仪器工作状态判断结果(35),预处理程序(31)、特征提取程序(32)、特征参考程序(33)和仪器工作状态判断结果(35)依次交互,标准数据集生成模块(34)和特征参考程序(33)比对;标准数据集生成模块(34)包括依次交互的仪器设备不同工作状态下的声音信号(341)、预处理程序(342)、特征提取程序(343)和模模式库训练与标准数据集生成程序(344)。

2.按权利要求1所述的仪器设备状态检测系统,其特征在于:所述的预处理程序(31),其所用算法为短时平均幅度差算法;所述的特征提取程序(32),所用算法为梅尔倒谱系数和线性倒谱系数法,输入信号短时频率高于阈值时采用线性倒谱系数法进行特征提取,输入信号短时频率低于阈值时采用线性倒谱系数法进行特征提取;

所述的预处理程序(342),其所用算法为短时平均幅度差算法;所述的特征提取程序(343),其所用算法为梅尔倒谱系数和线性倒谱系数法,输入信号短时频率高于阈值时采用线性倒谱系数法进行特征提取,输入信号短时频率低于阈值时采用线性倒谱系数法进行特征提取;

所述的模式库训练与标准数据集生成程序(344),其以仪器设备不同工作状态下的声纹特征为测试集,训练模型,获得仪器设备声纹特征标准数据集。

3.按权利要求1或2所述仪器设备状态检测系统的检测方法,其特征在于:①采集待检测的仪器设备在不同工作状态下的声音信号;②对步骤①中采集到的信号分别进行预处理,预处理步骤包括端点检测、预加重与去加重、分帧与加窗和短时平均幅度差算法处理;

③对步骤②中的信号分别进行特征提取;

④对于短时频率与人的语音信号接近的信号采用MFCC的方法进行特征提取,对于短时频率较高的信号采取LFCC的方式进行特征提取;

⑤将步骤④中的信号特征导入数据库,并进行模式库训练,获得标准数据集;⑥在待检测的仪器设备工作时,通过物联网传感器实时采集设备声音;提取声音信号特征,并与标准库进行对比,最后输出检测结果。

2

CN 111524523 A

说 明 书

1/5页

基于声纹识别技术的仪器设备状态检测系统及其方法

技术领域

[0001]本发明涉及语音信号处理技术领域,尤其涉及一种基于声纹识别技术的仪器设备状态检测系统及其方法。

背景技术

[0002]语音信号是声纹的特例。语音信号一般指人的语音,而声纹指广义上的声音信号,包括人的语音、动物语音以及仪器设备声音。然而,对人的语音信号进行识别的算法经过适当的修改和调整也能用于仪器设备的声纹识别。

[0003]仪器设备的声音信号识别相对于人的语音信号识别有一定区别。由于不具备短时平稳性和周期性也不具备语义,仪器设备的声纹识别更为困难。[0004]目前,有使用梅尔倒谱系数识别仪器设备声纹的案例,但是识别准确度不够理想。有些对动物的声纹识别准确率较高的算法不适用于仪器设备的声纹识别。因为这些算法要求待检测的信号本身需要有短时平稳性,而仪器设备的声纹不具备这种特性。还有仅通过深度神经网络的方法对仪器设备进行声纹识别,然而,这种方法对于硬件的消耗较高,而且算法灵活性和系统稳定性较差,极易受噪声干扰。发明内容

[0005]本发明的目的就在于克服现有技术存在的缺点和不足,提出一种基于声纹识别技术的仪器状态检测的系统及其方法,对仪器状态进行实时检测,避免不必要的损失,减少人力物力资源的浪费。

[0006]为实现上述目的,本发明的技术方案为:[0007]一、系统

[0008]本系统包括待检测的仪器设备,设置有声音传感器和电脑;[0009]待检测的仪器设备、声音传感器和电脑依次串行连接;[0010]电脑包括预处理程序、特征提取程序、特征参考程序、标准数据集生成模块和仪器工作状态判断结果,预处理程序、特征提取程序、特征参考程序和仪器工作状态判断结果依次交互,标准数据集生成模块和特征参考程序比对;标准数据集生成模块包括依次交互的仪器设备不同工作状态下的声音信号、预处理程序、特征提取程序和模模式库训练与标准数据集生成程序。[0011]二、方法

[0012]本方法包括以下步骤:

[0013]①采集待检测的仪器设备在不同工作状态下的声音信号;[0014]②对步骤①中采集到的信号分别进行预处理,预处理步骤包括端点检测、预加重与去加重、分帧与加窗和短时平均幅度差算法处理;[0015]③对步骤②中的信号分别进行特征提取;

[0016]④对于短时频率与人的语音信号接近的信号采用MFCC的方法进行特征提取,对于

3

CN 111524523 A

说 明 书

2/5页

短时频率较高的信号采取LFCC的方式进行特征提取;[0017]⑤将步骤④中的信号特征导入数据库,并进行模式库训练,获得标准数据集;[0018]⑥在待检测的仪器设备工作时,通过物联网传感器实时采集设备声音;提取声音信号特征,并与标准库进行对比,最后输出检测结果。[0019]相对于现有技术,本发明具有下列优点和积极效果:[0020]①使用AMDF算法增强非短时平稳和非周期声纹特征:在传统的语音信号处理中,AMDF(Average Magnitude Difference Function,短时平均幅度差函数)算法用于信号的特征提取,然而本发明使用ADMF算法对仪器设备声音信号增强声纹特征,这种算法可以使原本短时周期性和平稳性不佳的信号具有更好的短时平稳性和周期性,从而更有利于特征提取。

[0021]②声音信号分频分类特征提取:传统语音特征提取用MFCC(Mel Frequency Cepstrum Coefficient,梅尔频率倒谱系数)的方式。然而,仪器设备的声音信号频率不如人的语音信号稳定,预处理后的仪器设备声音信号具有多个频段,而且频率相差较大。对频率较高的部分,采用LFCC(Linear Frequency Cepstrum Coefficient)的方法进行特征提取,仪器设备声音信号的其他频段采用MFCC的方式进行特征提取,这种特征提取方法可以有效提高整体系统的稳定性。

[0022]③仪器设备声纹特征数据集创建:以待检测的仪器设备的声纹特征为样本,创建仪器设备声纹特征数据集,这种方法可以减小识别错误率。附图说明

[0023]图1是本系统的结构方框图;

[0024]图2是信号预处理算法的仿真实验图;[0025]图3是信号特征提取的仿真实验图。[0026]图中:

[0027]1—待检测的仪器设备;[0028]2—声音传感器;[0029]3—电脑,

[0030]31—预处理程序,[0031]32—特征提取程序,[0032]33—特征参考程序,

[0033]34—标准数据集生成模块,

[0034]341—仪器设备不同工作状态下的声音信号,[0035]342—预处理程序,[0036]343—特征提取程序,

[0037]344—模式库训练与标准数据集生成程序,[0038]35—仪器工作状态判断结果。具体实施方式

[0039]下面结合附图和实施例详细说明:

4

CN 111524523 A[0040]

说 明 书

3/5页

一、系统

[0041]1、总体

[0042]本系统包括待检测的仪器设备1,设置有声音传感器2和电脑3;[0043]待检测的仪器设备1、声音传感器2和电脑3依次串行连接。[0044]电脑3包括预处理程序31、特征提取程序32、特征参考程序33、标准数据集生成模块34和仪器工作状态判断结果35,预处理程序31、特征提取程序32、特征参考程序33和仪器工作状态判断结果35依次交互;标准数据集生成模块34和特征参考程序33比对;标准数据集生成模块34包括依次交互的仪器设备不同工作状态下的声音信号341、预处理程序342、特征提取程序343和模模式库训练与标准数据集生成程序344。[0045]2、功能块

[0046]1)待检测的仪器设备1

[0047]实验室中需要维护的仪器设备。[0048]2)声音传感器2

[0049]能够采集微弱声音信号的拾音器。[0050]3、电脑3

[0051]安装有2014a或以上版本的MATLAB并能完美运行。[0052]其内嵌有预处理程序31、特征提取程序32、特征参考程序33、标准数据集生成模块34和仪器设备工作状态判断结果35,其交互关系已前述。[0053](1)预处理程序31

[0054]所用算法为短时平均幅度差算法。[0055](2)特征提取程序32

[0056]所用算法为梅尔倒谱系数和线性倒谱系数法。

[0057]输入信号短时频率高于阈值时采用线性倒谱系数法进行特征提取,输入信号短时频率低于阈值时采用线性倒谱系数法进行特征提取。[0058](3)特征参考程序33

[0059]该程序实现的功能是将仪器设备在不同工作状态下的声纹特征与标准声纹特征数据集进行对比,并最终输出仪器设备工作状态检测结果。[0060](4)标准数据集生成模块34

[0061]其内嵌有依次交互的仪器设备不同工作状态下的声音信号341、预处理程序342、特征提取程序343和模式库训练与标准数据集生成程序344。[0062](4-1)仪器设备不同工作状态下的声音信号341[0063](4-2)预处理程序342

[0064]所用算法为短时平均幅度差算法。[0065](4-3)特征提取程序343

[0066]所用算法为梅尔倒谱系数和线性倒谱系数法,输入信号短时频率高于阈值时采用线性倒谱系数法进行特征提取,输入信号短时频率低于阈值时采用线性倒谱系数法进行特征提取。[0067](4-4)模式库训练与标准数据集生成程序344

[0068]以仪器设备不同工作状态下的声纹特征为测试集,训练模型,获得仪器设备声纹

5

CN 111524523 A

说 明 书

4/5页

特征标准数据集。[0069](5)仪器设备工作状态判断结果35。

[0070]仪器设备实际工作时的声纹与标准声纹特征进行对比,输出仪器设备工作状态判断结果。[0071]3、工作原理[0072]1、预处理程序31使用AMDF算法增强非短时平稳和非周期声纹特征。在传统的语音信号处理中,AMDF(Average Magnitude Difference Function)算法用于信号的特征提取;然而本系统使用ADMF算法对仪器设备声音信号增强声纹特征;这种算法可以使原本短时周期性和平稳性不佳的信号具有更好的短时平稳性和周期性,从而更有利于特征提取。[0073]2、特征提取程序32是声音信号分频分类特征提取。传统语音特征提取用MFCC(Mel Frequency Cepstrum Coefficient)的方式。然而,仪器设备的声音信号频率不如人的语音信号稳定;预处理后的仪器设备声音信号具有多个频段,而且频率相差较大。对频率较高的部分,采用LFCC(Linear Frequency Cepstrum Coefficient)的方法进行特征提取;仪器设备声音信号的其他频段采用MFCC(Mel Frequency Cepstrum Coefficient)的方式进行特征提取;这种特征提取方法可以有效提高整体系统的稳定性。[0074]3、标准数据集生成模块34是仪器设备声纹特征数据集创建。以待检测仪器设备的声纹特征为样本,创建仪器设备声纹特征数据集。这种方法可以减小识别错误率。[0075]二、方法[0076]操作步骤:

[0077]①采集待检测的仪器设备在不同工作状态下的声音信号。[0078]②对声纹信号进行端点检测、重采样、归一化和加窗处理后,再进行短时平均幅度差处理。图2中,从上到下,4个波形图分别为原始声纹信号、声纹信号第一部分、短时声纹信号、经过短时平均幅度差处理后的短时声纹信号;短时平均幅度差算法可以让短时周期特征不明显的声纹信号体现出更好的短时周期特性。[0079]短时平均幅度差算法的基本思路是:[0080]定义原始信号为xn(m),定义AMDF函数为Fn(k);

[0081]其中Fn(k)=|xn(0)-xn(0+k)|+|xn(1)-xn(1+k)|+...+|xn(N)-xn(N+k)|[0082]这种预处理算法可以稀释掉少数样本点误差对整体系统的影响,提升整体系统抗噪声干扰的能力。

[0083]③对步骤②中预处理后的信号进行特征提取,对频率接近人语音信号的短时信号采用MFCC的方法进行特征提取,对于频率较高的短时信号采用LFCC的方法进行特征提取;两种特征提取算法的基本思路类似,区别主要在于滤波器的不同。[0084]特征提取相关参数有:[0085]A、声源特征h(k);[0086]B、与声源特征无关的随机信号e(k);[0087]C、声源发出的声音信号x(k);

[0088][0089][0090]

其中

特征提取算法基本思路为:

a、将原始声音信号求频谱可得:X(w)=H(w)·E(w);

6

CN 111524523 A[0091]

说 明 书

5/5页

b、两边取对数得:log(X(w))=log(H(w)·E(w));

[0092]c、化简得:log(X(w))=log(H(w))+log(E(w));[0093]d、通过滤波的方式分离H(w)和E(w);[0094]e、取傅里叶反变换即可得到声源特征h(k);[0095]声源特征和随机信号分离效果如图3所示。[0096]LFCC算法采用线性滤波器,MFCC算法采用梅尔滤波器,对于短时频率与人语音接近的信号采用MFCC(梅尔倒谱系数)进行特征提取,对于短时频率高于人语音的信号采用LFCC(线性倒谱系数)进行特征提取;

[0097]④将提取的声纹特征导入数据库,并进行模式库训练,生成标准模式库。[0098]⑤用物联网传感器实时采集待检测设备的声纹信号。[0099]⑥对待检测设备声纹信号进行预处理。[0100]⑦计算待检测设备声纹信号的短时周期。[0101]⑧对于频率接近于人语音的短时信号,采用MFCC(梅尔倒谱系数)进行特征提取;对于频率较高的短时信号,采用LFCC(线性倒谱系数)进行特征提取;[0102]⑨将待检测设备的声纹特征与标准数据库进行对比,从而判断设备工作状态。[0103]三、本发明主要的创新点有3个:[0104]1、使用AMDF算法增强非短时平稳和非周期声纹特征。在传统的语音信号处理中,AMDF(Average Magnitude Difference Function)算法用于信号的特征提取。然而本文使用ADMF算法对仪器设备声音信号增强声纹特征。这种算法可以使原本短时周期性和平稳性不佳的信号具有更好的短时平稳性和周期性,从而更有利于特征提取。[0105]2、声音信号分频分类特征提取。在传统语音信号处理中,MFCC(Mel Frequency Cepstrum Coefficient)通常用于人的语音信号特征提取。然而本文对于不同频段的信号采用不同的特征提取方式。高频率信号采用LFCC(Linear Frequency Cepstrum Coefficient)的方法进行特征提取。对于其他频率的信号采用MFCC的方法进行特征提取。这种特征提取方法可以有效系统的可靠性。[0106]3、仪器设备声纹特征数据集创建。以待检测仪器设备的声纹特征为样本,创建仪器设备声纹特征数据集。与不创建数据集相比,这种方法可以减小识别错误率。

7

CN 111524523 A

说 明 书 附 图

1/2页

图1

图2

8

CN 111524523 A

说 明 书 附 图

2/2页

图3

9

因篇幅问题不能全部显示,请点此查看更多更全内容