一种基于DNN降噪技术的车载多音区系统的制作方法

2025-09-09 13:20:02 473次浏览

本发明涉及车载多音区系统，特别是涉及一种基于dnn降噪技术的车载多音区系统。

背景技术：

1、随着汽车技术的快速发展，越来越多的汽车针对汽车内的音区进行优化，以提高驾乘人员对车内音频的体验感；常用的方式是通过反向声波对车内不同的区域进行屏蔽，从而使得不同区域的声音不会相互干扰；例如：通过反向声波将后排乘客区域或者副驾区域进行屏蔽，使得后排乘客区域以及副驾区域内的声音无法传播至驾驶区域，从而避免司机被后排或副驾区域内的人员发出的声音干扰；然而，屏蔽区域内的人员在一些情况下，是需要与司机沟通的，在声音屏蔽功能开启的情况下，如果屏蔽区域内的用户发出与司机沟通的语音，司机想要听到该语音，需要先关闭屏蔽功能，再向司机发出语音，过程较为复杂，导致车内驾乘人员语音沟通效率较低。

技术实现思路

1、发明提供一种基于dnn降噪技术的车载多音区系统，以解决现有技术中车辆屏蔽区域内的用户发出与司机沟通的语音，司机想要听到该语音，需要先关闭屏蔽功能，再向司机发出语音，过程较为复杂，导致车内驾乘人员语音沟通效率较低的技术问题。

2、根据本申请提供的基于dnn降噪技术的窗口对讲系统，所述系统包括：处理器和存储介质；所述存储介质中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由处理器加载并执行以实现以下步骤：

3、s100，获取目标车辆的屏蔽区域内的初始音频qr；其中，屏蔽区域包括副驾区域和后排区域；qr包括用户发出的语音。

4、s200，将qr输入至预设的dnn降噪模型，以得到qr对应的降噪后的初始用户语音qt。

5、s300，获取qt对应的每一关键词并进行去重处理，以得到qt对应的关键词列表a=（a1，a2，…，ai，…，an），i=1，2，…，n；其中，ai为qt对应的第i个关键词，n为qt对应的关键词的数量。

6、s400，若qt对应的用户位于副驾区域，则根据副驾区域图像和a，确定qt是否为目标用户语音。

7、s500，若qt对应的用户位于后排区域，且后排用户的数量为1，则根据后排区域图像和a，确定qt是否为目标用户语音。

8、s600，若qt对应的用户位于后排区域，且后排用户的数量大于1，则qr后预设时长的待比对音频te。

9、s700，获取qr与te的相似度η。

10、s800，根据η、a和后排区域图像，确定qt是否为目标用户语音。

11、s900，若qt为目标用户语音，则将qt通过设置于主驾区域的音频设备进行播放。

12、本发明至少具有以下有益效果：

13、本发明的基于dnn降噪技术的车载多音区系统，获取目标车辆的屏蔽区域内的初始音频，使用预设的dnn降噪模型对初始音频进行降噪，以得到初始用户语音；提取初始用户语音中的每一关键词，进而根据初始用户语音中的每一关键词以及初始用户语音对应的用户在车内所坐的座位，以及该座位对应的区域的图像，并结合后排区域用户的数量，确定初始用户语音是否为目标用户语音；如果是目标用户语音，则将目标用户语音通过设置于主驾区域的音频设备进行播放，从而在不关闭屏蔽功能的前提下，有针对性的将用户说给司机的语音通过音频设备播放给司机，从而简化用户语音沟通的过程，提高车内驾乘人员语音沟通的效率。

技术特征：

1.一种基于dnn降噪技术的车载多音区系统，其特征在于，所述系统包括：处理器和存储介质；所述存储介质中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由处理器加载并执行以实现以下步骤：

2.根据权利要求1所述的基于dnn降噪技术的车载多音区系统，其特征在于，qr通过以下步骤得到：

3.根据权利要求1所述的基于dnn降噪技术的车载多音区系统，其特征在于，步骤s400包括以下步骤：

4.根据权利要求3所述的基于dnn降噪技术的车载多音区系统，其特征在于，步骤s450包括以下步骤：

5.根据权利要求1所述的基于dnn降噪技术的车载多音区系统，其特征在于，步骤s500包括以下步骤：

6.根据权利要求5所述的基于dnn降噪技术的车载多音区系统，其特征在于，步骤s800包括以下步骤：

7.根据权利要求1所述的基于dnn降噪技术的车载多音区系统，其特征在于，步骤s700包括以下步骤：

技术总结
本发明提供了一种基于DNN降噪技术的车载多音区系统，涉及车载多音区系统技术领域，所述新系统包括：获取目标车辆的屏蔽区域内的初始音频，使用预设的DNN降噪模型对初始音频进行降噪，以得到初始用户语音；提取初始用户语音中的每一关键词，进而根据初始用户语音中的每一关键词以及初始用户语音对应的用户在车内所坐的座位，以及该座位对应的区域的图像，并结合后排区域用户的数量，确定初始用户语音是否为目标用户语音；将目标用户语音通过设置于主驾区域的音频设备进行播放；本发明能够在不关闭屏蔽功能的前提下，有针对性的将用户说给司机的语音通过音频设备播放给司机，从而简化用户语音沟通的过程，提高车内驾乘人员语音沟通的效率。

技术研发人员：魏祥成,张卢军,胡程远,朱恩德,吴真飞
受保护的技术使用者：深圳波洛斯科技有限公司
技术研发日：
技术公布日：2024/11/28

文档序号 : 【 40165094 】

技术研发人员：魏祥成,张卢军,胡程远,朱恩德,吴真飞
技术所有人：深圳波洛斯科技有限公司

备注：该技术已申请专利，仅供学习研究，如用于商业用途，请联系技术所有人。
声明 ：此信息收集于网络，如果你是此专利的发明人不想本网站收录此信息请联系我们，我们会在第一时间删除

魏祥成丨张卢军丨胡程远丨朱恩德丨吴真飞丨深圳波洛斯科技有限公司

Septin9基因甲基化检测引物探针体系及其试剂盒的制作方法一种用于猪肉的快速冷却装置及方法与流程