基于空间交叉学习多尺度注意力特征模块的声纹识别方法与流程

2026-02-16 14:00:02 294次浏览

技术特征：

1.一种基于空间交叉学习多尺度注意力特征模块的声纹识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，在根据所述融合特征图，对所述音频进行声纹识别，得到所述音频的声纹识别结果之前，还包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述目标特征图，对所述音频进行声纹识别，得到所述声纹识别结果，包括：

4.根据权利要求1所述的方法，其特征在于，所述对所述原始子特征图组分别进行时域特征识别、频域特征识别和全局特征识别，得到所述原始子特征图组的时域特征、频域特征和全局特征，包括：

5.根据权利要求1所述的方法，其特征在于，所述根据所述时域特征和所述频域特征生成基础权重，包括：

6.根据权利要求1至5任一项所述的方法，其特征在于，所述提取音频的二维频谱特征，包括：

7.一种基于空间交叉学习多尺度注意力特征模块的声纹识别装置，其特征在于，所述装置包括：

8.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

10.一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

技术总结
本申请涉及一种基于空间交叉学习多尺度注意力特征模块的声纹识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品，可用于计算机技术领域。该方法包括：提取音频的二维频谱特征；对二维频谱特征进行特征图识别得到多通道三维特征图；将多通道三维特征图分组得到原始子特征图组；对原始子特征图组分别进行时域特征识别、频域特征识别和全局特征识别；根据时域特征和频域特征生成基础权重，对原始子特征图组进行加权处理；根据目标子特征图组和全局特征生成目标权重；利用目标权重对原始子特征图组进行加权融合处理，得到融合特征图；根据融合特征图对音频进行声纹识别，得到音频的声纹识别结果。采用本方法能够提高声纹识别的效率。

技术研发人员：吴石松,董召杰,李轩昂,梁寿愚,卢志良,陈柔伊,梁凌宇,赵翔宇,王鹏凯,郑桦,冯勤宇,任正国,林全郴,李晋伟,陈骞
受保护的技术使用者：南方电网人工智能科技有限公司
技术研发日：
技术公布日：2024/12/10

文档序号 : 【 40283263 】

技术研发人员：吴石松,董召杰,李轩昂,梁寿愚,卢志良,陈柔伊,梁凌宇,赵翔宇,王鹏凯,郑桦,冯勤宇,任正国,林全郴,李晋伟,陈骞
技术所有人：南方电网人工智能科技有限公司

备注：该技术已申请专利，仅供学习研究，如用于商业用途，请联系技术所有人。
声明 ：此信息收集于网络，如果你是此专利的发明人不想本网站收录此信息请联系我们，我们会在第一时间删除

吴石松丨董召杰丨李轩昂丨梁寿愚丨卢志良丨陈柔伊丨梁凌宇丨赵翔宇丨王鹏凯丨郑桦丨冯勤宇丨任正国丨林全郴丨李晋伟丨陈骞丨南方电网人工智能科技有限公司