01 现在的位置:首页 > 期刊导读 > 2017 > 01 >

基于高层信息特征的重叠语音检测

【作者】 马勇 鲍长春    北京工业大学电子信息与控制工程学院 北京100124 江苏师范大学物理与电子工程学院 徐州221009

【关键词】 重叠语音检测 高层信息特征

摘要】重叠语音是影响说话人分割性能的主要因素之一。该文提出了基于语音高层信息特征的重叠语音检测方法以提高说话人分割效果。首先用通用背景模型(universal background model,uBM)提取语音的语言学高层信息特征,并融合这些特征和Mel频率倒谱系数(Mel frequency cepstral coefficient,MFCC)特征建立隐Markov模型(hid—denMarkovmodel,HMM)检测重叠语音,然后对处理后的语音进行说话人分割。实验结果表明:对于由TIMIT语音库生成的数据集,该方法对重叠语音检测的错误率比单一采用MFCC特征有显著降低,而且说话人分割性能有明显的提高。

上一篇:基于NMF和FCRF的单通道语音分离
下一篇:基于边界扩展的图像显著区域检测

版权所有@清华大学  京公网安备 110402430053 号
地址:北京市海淀区清华园   邮政编码:100084