01 现在的位置:首页 > 期刊导读 > 2017 > 01 >

基于NMF和FCRF的单通道语音分离

【作者】 李煦 屠明 吴超 国雁萌 纳跃跃 付强 颜永红    中国科学院声学研究所 语言声学与内容理解重点实验室 中国北京100190 亚利桑那州立大学 信号分析与感知实验室 坦佩85281 美国

【关键词】 单通道语音分离 因子条件随

摘要】近年来,非负矩阵分解(non-negative matrix factor—ization,NMF)被广泛应用于单通道语音分离问题。然而,标准的NMF算法假设语音的相邻帧之间是相互独立的,不能表征语音信号的时间连续性信息。为此,该文提出了一种基于NMF和因子条件随机场(factorial conditionalran—dorafield,FcRF)的语音分离算法,首先将NMF和女均值聚类结合对纯净语音的频谱结构以及时间连续性进行建模,然后利用得到的模型训练FCRF模型,进而对混合语音信号进行分离。结果表明:该算法相比没有考虑语音时间连续特性的基于NMF的算法如激活集牛顿算法(active-set Newton algorithm,ASNA),在客观指标上有明显提高。

上一篇:永磁直流电机定子的振动分析
下一篇:基于高层信息特征的重叠语音检测

版权所有@清华大学  京公网安备 110402430053 号
地址:北京市海淀区清华园   邮政编码:100084