基于语音识别的数字人驱动方法、设备及系统与流程

2025-10-26 10:00:07 429次浏览

技术特征：

1.一种基于语音识别的数字人驱动方法，其特征在于，所述基于语音识别的数字人驱动方法包括：

2.根据权利要求1所述的基于语音识别的数字人驱动方法，其特征在于，所述从各所述声源的音频数据中确定属于交互用户的语音的目标独立成分语音包括：

3.根据权利要求2所述的基于语音识别的数字人驱动方法，其特征在于，所述根据所述声音频率序列中的极值点的第一数量、相邻极大值点之间的第一时间间隔、相邻极小值点之间的第二时间间隔以及所述声音频率序列中声音频率的方差确定所述独立成分音频的有效性包括：

4.根据权利要求2所述的基于语音识别的数字人驱动方法，其特征在于，所述声音采集设备包括处于所述目标区域的第一位置的声音采集设备和处于所述目标区域的第二位置的声音采集设备，所述确定相似语音组包括：

5.根据权利要求4所述的基于语音识别的数字人驱动方法，其特征在于，所述根据处于所述目标区域的第一位置的声音采集设备和处于所述目标区域的第二位置的声音采集设备的目标独立成分语音之间的相似性，确定所述相似语音组包括：

6.根据权利要求1-5任意一项所述的基于语音识别的数字人驱动方法，其特征在于，所述根据所述第一目标独立成分语音的第一采集时刻、所述第二目标独立成分语音的第二采集时刻以及声音传播速度，确定所述交互用户到所述第一位置的第一参考位置以及所述交互用户到所述第二位置的第二参考位置之间的距离差包括：

7.根据权利要求1-5任意一项所述的基于语音识别的数字人驱动方法，其特征在于，所述根据所述第一参考位置与所述第二参考位置之间的距离以及所述距离差确定所述交互用户在所述目标区域内的目标位置包括：

8.根据权利要求1-5任意一项所述的基于语音识别的数字人驱动方法，其特征在于，所述利用所述交互用户在所述目标区域内的目标位置驱动数字人面向所述交互用户包括：

9.一种基于语音识别的数字人驱动系统，其特征在于，包括：

10.一种基于语音识别的数字人驱动设备，其特征在于，该基于语音识别的数字人驱动设备包括：处理器和存储器；其中，存储器用于存储可在处理器上运行的计算机程序；处理器，用于执行存储器上所存放的程序，实现如权利要求1-8任意一项所述的基于语音识别的数字人驱动方法的步骤。

技术总结
本发明涉及语音识别技术领域，具体涉及一种基于语音识别的数字人驱动方法、设备及系统，该方法包括：获取目标区域的各声源的音频数据；确定属于交互用户的语音的目标独立成分语音；确定相似语音组；根据第一目标独立成分语音的第一采集时刻、第二目标独立成分语音的第二采集时刻以及声音传播速度，确定交互用户到第一位置的第一参考位置以及交互用户到第二位置的第二参考位置之间的距离差；根据第一参考位置与第二参考位置之间的距离以及距离差确定交互用户的目标位置；利用交互用户在目标区域内的目标位置驱动数字人面向交互用户。如此，本发明提高了数字人与观众的交互灵活性，保证了观众在交互的过程中的参与感，提高了观众的互动体验感。

技术研发人员：鞠帆,韩清霞,栾飞
受保护的技术使用者：新之航传媒科技集团有限公司
技术研发日：
技术公布日：2024/12/2

文档序号 : 【 40203249 】

技术研发人员：鞠帆,韩清霞,栾飞
技术所有人：新之航传媒科技集团有限公司

备注：该技术已申请专利，仅供学习研究，如用于商业用途，请联系技术所有人。
声明 ：此信息收集于网络，如果你是此专利的发明人不想本网站收录此信息请联系我们，我们会在第一时间删除

鞠帆丨韩清霞丨栾飞丨新之航传媒科技集团有限公司