一种语音交互的方法及电子设备与流程

2026-05-07 11:20:07 432次浏览

本申请涉及电子，具体涉及语音助手领域，尤其涉及一种语音交互的方法及电子设备。

背景技术：

1、语音助手(或者称为“智能助手”)是电子设备等电子设备的重要功能之一，通过语音指令控制电子设备等电子设备已经成为了一种常见的人机交互形式。当用户在电子设备上启动语音助手之后，可以通过语音指令操控电子设备上的多款第三方应用程序(application，app)执行相应的动作，例如播放音乐、设置闹钟、查找信息等，该过程可以解放用户的双手，方便用户操控电子设备，提升用户体验。

2、近年来，随着电子技术和设备的发展，用户已经不满足于语音助手仅仅能够辅助电子设备的操作、闲聊功能，用户对语音助手的能力有了更多的诉求。例如，用户可能更希望语音助手更加智能化，在和语音助手的语音交互过程中更加地灵活。目前语音助手的智能化程度和灵活性还存在不足。

技术实现思路

1、本申请提供一种语音交互的方法及电子设备，该方法能够提高语音助手的智能化程度和灵活性，提高用户的语音交互体验。

2、第一方面，提供了一种语音交互的方法，应用于安装有语音助手的电子设备，所述方法包括：获取第一用户的语音数据，根据所述第一用户的语音数据确定所述第一用户的身份标识；当所述第一用户是预设数据库中的已注册用户时，根据所述第一用户的身份标识从所述预设数据库中获取与所述第一用户的身份标识关联的记忆内容，所述第一用户的身份标识关联的记忆内容是所述语音助手基于获取到的所述第一用户发出的语音数据提取的内容；根据所述第一用户的身份标识关联的记忆内容，确定针对所述第一用户的语音数据的第一答复文本，并向所述第一用户呈现所述第一答复文本。

3、在用户和语音助手的对话过程中，上述方法能够基于用户发出的语音进行用户身份的识别，当识别到用户为预设数据库中的已注册用户时，本申请可以获取预设数据库中与用户身份识别的结果相关联的记忆内容，并基于该关联的记忆内容，确定用户发出的语音的答复文本，呈现给用户。该方法能够基于与该用户关联的记忆内容确定语音答复文本或内容，使得该语音对话具有更好的交互效果，提高了语音助手的智能化程度和灵活性，进而提高了用户的语音交互体验。

4、特别是针对多人共用同一个语音助手的情况，本申请可以根据用户发出的语音数据进行用户身份识别，判断当前用户是否属于历史用户或者新用户。当判断当前用户为历史用户时，直接读取该历史用户的记忆内容，输出合适的回复内容，保持该回复内容与该用户的历史记忆、人设风格等保持一致，并最后将文本回复内容转换为音频，输出给用户。

5、第二方面，提供了一种电子设备，包括：获取单元，用于获取第一用户的语音数据；处理单元，用于根据所述第一用户的语音数据确定所述第一用户的身份标识；当所述第一用户是目标预设数据库中的已注册用户时，所述处理单元还用于根据所述第一用户的身份标识从所述目标预设数据库中获取与所述第一用户的身份标识关联的记忆内容，所述第一用户的身份标识关联的记忆内容是所述语音助手基于获取到的所述第一用户发出的所有语音数据提取的内容；根据所述第一用户的身份标识关联的记忆内容，确定针对所述第一用户的语音数据指令的第一答复文本；响应单元，用于向所述第一用户呈现所述第一答复文本。

6、第三方面，提供了一种服务器，其特征在于，包括：接收模块，用于接收电子设备的语音助手发送的和用户标识关联的记忆内容，存储模块，用于存储所述记忆内容。

7、第四方面，提供了一种装置，该装置包含在电子设备中，该装置具有实现上述第一方面中电子设备行为的功能。

8、该功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块或单元。例如，显示模块或单元、检测模块或单元、处理模块或单元等。

9、第五方面，本申请提供了一种电子设备，包括：显示屏；一个或多个处理器；存储器；多个应用程序；以及一个或多个计算机程序。其中，一个或多个计算机程序被存储在存储器中，一个或多个计算机程序包括指令。当指令被电子设备执行时，使得电子设备执行上述第一方面中的方法。

10、第六方面，本申请提供了一种电子设备上的图形用户界面系统，所述电子设备具有显示屏、一个或多个存储器、以及一个或多个处理器，所述一个或多个处理器用于执行存储在所述一个或多个存储器中的一个或多个计算机程序，所述图形用户界面系统包括所述电子设备执行如第一方面的方法时显示的图形用户界面。

11、第七方面，本申请提供了一种计算机存储介质，包括计算机指令，当计算机指令在电子设备上运行时，使得电子设备执行上述第一方面的方法。

12、第八方面，本申请提供了一种计算机程序产品，当计算机程序产品在电子设备上运行时，使得电子设备执行上述第一方面中的方法。

技术特征：

1.一种语音交互的方法，其特征在于，应用于安装有语音助手的电子设备，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述第一用户的身份标识关联的记忆内容中包括所述第一用户的姓名、个性化喜好、与所述第一用户关联的事件要素中的一种或多种信息，所述根据所述第一用户的身份标识关联的记忆内容，确定针对所述第一用户的语音数据的第一答复文本，包括：

3.根据权利要求1或2所述的方法，其特征在于，所述第一用户的身份标识关联的记忆内容中还包括所述第一用户的角色信息，所述方法还包括：

4.根据权利要求1或2所述的方法，其特征在于，所述预设数据库中还存储有多个已注册用户的声纹特征，所述根据所述第一用户的语音数据确定所述第一用户的身份标识，包括：

5.根据权利要求4所述的方法，其特征在于，所述将所述第一用户的声纹特征和所述预设数据库中多个已注册用户的声纹特征进行匹配处理，包括：

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

7.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：

8.根据权利要求7所述的方法，其特征在于，所述方法还包括：

9.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：

10.根据权利要求9所述的方法，其特征在于，所述方法还包括：

11.根据权利要求1或2所述的方法，其特征在于，获取所述第一用户的语音数据之后，所述方法包括：

12.一种语音交互的装置，其特征在于，所述装置安装有语音助手，所述装置包括：

13.一种电子设备，其特征在于，包括：

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，当所述计算机指令在电子设备上运行时，使得所述电子设备执行如权利要求1至11中任一项所述的方法。

15.一种计算机程序产品，其特征在于，当所述计算机程序产品在计算机上运行时，使得所述计算机执行如权利要求1至11中任一项所述的方法。

技术总结
本申请提供了一种语音交互的方法及电子设备，在语音助手的语音交互场景下，该方法可以通过获取说话人的语音，根据说话人的语音数据获取说话人的声纹特征；根据说话人的声纹特征，实时地进行说话人的角色识别；再结合说话人的角色获取关联的多用户记忆内容，根据说话人的语音数据和关联的多用户记忆内容，确定针对该语音数据的答复文本，并向说话人播放答复文本，该方法能够基于与该用户关联的记忆内容确定语音答复文本或内容，使得该语音对话具有更好的交互效果，提高了语音助手的智能化程度和灵活性，进而提高了用户的语音交互体验。

技术研发人员：石凯
受保护的技术使用者：深圳市欢太科技有限公司
技术研发日：
技术公布日：2024/12/12

文档序号 : 【 40314733 】

技术研发人员：石凯
技术所有人：深圳市欢太科技有限公司

备注：该技术已申请专利，仅供学习研究，如用于商业用途，请联系技术所有人。
声明 ：此信息收集于网络，如果你是此专利的发明人不想本网站收录此信息请联系我们，我们会在第一时间删除

石凯丨深圳市欢太科技有限公司