人形机器人的智能语音降噪交互方法和系统与流程

2026-06-15 17:00:07 515次浏览

本申请涉及人工智能，尤其涉及一种人形机器人的智能语音降噪交互方法和系统。

背景技术：

1、在人形机器人的应用场景中，语音交互是其与人类沟通的重要方式。然而，不同应用场景的环境噪声是难以一致，并伴随多声源干扰等问题往往影响语音识别的准确性和交互体验。

技术实现思路

1、本申请实施例的主要目的在于提供一种人形机器人的智能语音降噪交互方法和系统。

2、本发明所采取的技术方案是：

3、一方面，本发明实施例提供了一种人形机器人的智能语音降噪交互方法，所述方法包括以下步骤：

4、采集声源信息；

5、根据所述声源信息，得到目标声源位置信息；

6、采集音频数据；

7、根据所述目标声源位置信息和所述音频数据，得到目标音频数据；

8、根据所述目标音频数据，完成降噪处理。

9、进一步地，所述采集声源信息，包括以下步骤：

10、获取视觉信息和声觉信息；

11、根据所述视觉信息和所述声觉信息，得到空间位置信息；

12、根据所述空间位置信息，得到声源信息。

13、进一步地，所述根据所述声源信息，得到目标声源位置信息，包括以下步骤：

14、预设若干个目标采集区域；

15、根据所述目标采集区域和所述声源信息，得到目标声源位置信息。

16、进一步地，所述根据所述目标声源位置信息和所述音频数据，得到目标音频数据，包括以下步骤：

17、根据所述目标声源位置信息，从所述音频数据中提取与目标声源位置对应的语音信息；

18、根据所述语音信息，得到目标音频数据。

19、进一步地，所述根据所述目标音频数据，完成降噪处理，包括以下步骤：

20、预设神经网络模型；

21、根据所述神经网络模型，确定掩蔽值；

22、根据所述掩蔽值和所述目标音频数据，完成降噪处理。

23、另一方面，本发明实施例还提供一种人形机器人的智能语音降噪交互系统，所述系统包括：

24、第一模块，用于采集声源信息；

25、第二模块，用于根据所述声源信息，得到目标声源位置信息；

26、第三模块，用于采集音频数据；

27、第四模块，用于根据所述目标声源位置信息和所述音频数据，得到目标音频数据；

28、第五模块，用于根据所述目标音频数据，完成降噪处理。

29、进一步地，所述系统还包括：

30、声源定位模块，用于确定说话人的空间位置信息；

31、目标声源识别模块，用于根据目标采集区域匹配目标声源位置；

32、音频数据采集模块，用于采用自动增益控制算法技术优化音频采集；

33、目标音频数据提取模块，用于提取目标音频数据；

34、降噪处理模块和多模态信息融合模块，用于执行降噪处理。

35、进一步地，所述系统还包括视觉模块和声觉模块；

36、所述视觉模块包括视觉传感器；所述声觉模块包括麦克风阵列。

37、另一方面，本发明实施例还提供一种人形机器人的智能语音降噪交互装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如前面所述的人形机器人的智能语音降噪交互方法。

38、另一方面，本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行如前面所述的方法。

39、本申请实施例至少包括以下有益效果：本申请提供一种人形机器人的智能语音降噪交互方法和系统。本发明采集声源信息；根据所述声源信息，得到目标声源位置信息；采集音频数据；根据所述目标声源位置信息和所述音频数据，得到目标音频数据；根据所述目标音频数据，完成降噪处理。本发明能够提高人形机器人在复杂声学环境中的语音识别准确度。

技术特征：

1.一种人形机器人的智能语音降噪交互方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，所述采集声源信息，包括以下步骤：

3.根据权利要求1所述的方法，其特征在于，所述根据所述声源信息，得到目标声源位置信息，包括以下步骤：

4.根据权利要求1所述的方法，其特征在于，所述根据所述目标声源位置信息和所述音频数据，得到目标音频数据，包括以下步骤：

5.根据权利要求1所述的方法，其特征在于，所述根据所述目标音频数据，完成降噪处理，包括以下步骤：

6.一种人形机器人的智能语音降噪交互系统，其特征在于，所述系统包括：

7.根据权利要求6所述的系统，其特征在于，所述系统还包括：

8.根据权利要求6所述的系统，其特征在于，所述系统还包括视觉模块和声觉模块；

9.一种人形机器人的智能语音降噪交互装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至5中任意一项所述的人形机器人的智能语音降噪交互方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行如权利要求1至5任意一项所述的方法。

技术总结
本申请实施例提供了一种人形机器人的智能语音降噪交互方法和系统，属于人工智能技术领域。本发明采集声源信息；根据所述声源信息，得到目标声源位置信息；采集音频数据；根据所述目标声源位置信息和所述音频数据，得到目标音频数据；根据所述目标音频数据，完成降噪处理。本发明能够提高人形机器人在复杂声学环境中的语音识别准确度。

技术研发人员：李卫铳
受保护的技术使用者：广州里工实业有限公司
技术研发日：
技术公布日：2024/12/19

文档序号 : 【 40404837 】

技术研发人员：李卫铳
技术所有人：广州里工实业有限公司

备注：该技术已申请专利，仅供学习研究，如用于商业用途，请联系技术所有人。
声明 ：此信息收集于网络，如果你是此专利的发明人不想本网站收录此信息请联系我们，我们会在第一时间删除

李卫铳丨广州里工实业有限公司