一种设备的语音识别方法、装置、设备及存储介质与流程

本发明涉及设备控制,特别是涉及一种设备的语音识别方法、一种设备的语音识别装置、相应的一种电子设备以及相应的一种计算机可读存储介质。
背景技术:
1、随着ai技术的发展,语音技术正在逐步广泛应用于家居领域,越来越多的家居产品能够通过语音交互的模式进行操作,以满足用户的快捷服务,且随着语音技术在家居场景的应用,对支持语言种类的需求变高,特别是一个家庭中成员可能存在多种方言的情况。
2、然而,一旦用户需要进行语言切换,通常需要通过app或小程序进入语音识别引擎设置界面,手动切换成使用的方言方能实现家居设备的语音识别,前述语音切换方式的切换效率低,且只适用于搭载app及小程序的产品,不够智能化。
技术实现思路
1、鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种设备的语音识别方法、一种设备的语音识别装置、相应的一种电子设备以及相应的一种计算机可读存储介质。
2、本发明实施例公开了一种设备的语音识别方法,所述方法包括:
3、响应语音唤醒指令,进行声纹识别得到用户声纹信息;
4、根据所述用户声纹信息与预设声纹信息的匹配结果,获取所述预设声纹信息的目标语言种类编码信息;
5、向云端传输所述目标语言种类编码信息,所述云端基于所述目标语言种类编码信息切换所述设备的语言识别模型为目标语言种类的目标语言识别模型;
6、按照所述目标语言种类进行语音播报。
7、可选的,所述预设声纹信息存储于预设存储库中,在所述预设存储库中预先存储有所述预设声纹信息的声纹信息编码和预先设置的语言种类的语言种类编码信息的绑定关系;
8、所述根据所述用户声纹信息与预设声纹信息的匹配结果,获取所述预设声纹信息的目标语言种类编码信息,包括:
9、响应所述用户声纹信息与预设声纹信息匹配,基于所述绑定关系,从所述预设存储库中获取所述预设声纹信息的目标语言种类编码信息。
10、可选的,所述响应所述用户声纹信息与预设声纹信息的匹配结果,获取所述预设声纹信息的目标语言种类编码信息,还包括:
11、响应在预设存储库中不存在预设声纹信息与所述用户声纹信息匹配,将所述用户声纹信息存储至所述预设存储库。
12、可选的,所述将所述用户声纹信息存储至所述预设存储库,包括:
13、生成针对所述用户声纹信息的声纹信息编码,提示语言种类选择信息;
14、响应用户的语言种类选择指令,生成针对所选择语言种类的语言种类编码信息,将所选择语言种类的语言种类编码信息和所述用户声纹信息的声纹信息编码存储至所述预设存储库。
15、可选的,所述响应语音唤醒指令,进行声纹识别得到用户声纹信息,包括:
16、检测到用户语音音频中存在预设唤醒词,将所述设备的语音识别模块由睡眠模式切换至唤醒状态;
17、通过处于唤醒状态的语音识别模块,对所述用户语音音频进行声纹识别,得到用户声纹信息。
18、可选的,在所述语音识别模块处于唤醒状态时,所述方法还包括:
19、响应用户的语言切换指令,获取所要切换的语言种类,并获取所要切换的语言种类的语言种类选择信息;
20、在预设存储库存在与所述用户声纹信息匹配的预设声纹信息时,获取所述预设声纹信息的声纹信息编码,将所要切换的语言种类的语言种类选择信息与所述预设声纹信息的声纹信息编码进行绑定并存储至所述预设存储库。
21、可选的,所述方法还包括:
22、在预设存储库不存在与所述用户声纹信息匹配的预设声纹信息时,生成针对所述用户声纹信息的声纹信息编码,提示语言种类选择信息;
23、响应用户的语言种类选择指令,生成针对所选择语言种类的语言种类编码信息,将所选择语言种类的语言种类编码信息和所述用户声纹信息的声纹信息编码存储至所述预设存储库。
24、可选的,所述将所选择语言种类的语言种类编码信息和所述用户声纹信息的声纹信息编码存储至所述预设存储库,包括:
25、将所述用户声纹信息的声纹信息编码和所选择语言种类的语言种类编码信息进行绑定并存储至所述预设存储库。
26、可选的,所述方法还包括:
27、在预设时间段内,若未接收到用户的语言种类选择指令,确定预设语言种类为针对所述用户声纹信息所选择的语言种类。
28、本发明实施例还公开了一种设备的语音识别装置,所述装置包括:
29、声纹识别模块,用于响应语音唤醒指令,进行声纹识别得到用户声纹信息;
30、声纹匹配模块,用于根据所述用户声纹信息与预设声纹信息的匹配结果,获取所述预设声纹信息的目标语言种类编码信息;
31、语言识别模型切换模块,用于向云端传输所述目标语言种类编码信息,所述云端基于所述目标语言种类编码信息切换所述设备的语言识别模型为目标语言种类的目标语言识别模型;
32、语音播放模块,用于按照所述目标语言种类进行语音播报。
33、可选的,所述预设声纹信息存储于预设存储库中,在所述预设存储库中预先存储有所述预设声纹信息的声纹信息编码和预先设置的语言种类的语言种类编码信息的绑定关系;所述声纹匹配模块包括:
34、目标语言种类编码信息获取子模块,用于响应所述用户声纹信息与预设声纹信息匹配,基于所述绑定关系,从所述预设存储库中获取所述预设声纹信息的目标语言种类编码信息。
35、可选的,所述声纹匹配模块还包括:
36、声纹信息存储子模块,用于响应在预设存储库中不存在预设声纹信息与所述用户声纹信息匹配,将所述用户声纹信息存储至所述预设存储库。
37、可选的,所述声纹信息存储子模块包括:
38、声纹信息存储单元,用于生成针对所述用户声纹信息的声纹信息编码,提示语言种类选择信息;响应用户的语言种类选择指令,生成针对所选择语言种类的语言种类编码信息,将所选择语言种类的语言种类编码信息和所述用户声纹信息的声纹信息编码存储至所述预设存储库。
39、可选的,所述声纹信息存储单元包括:
40、声纹信息存储子单元,用于将所述用户声纹信息的声纹信息编码和所选择语言种类的语言种类编码信息进行绑定并存储至所述预设存储库。
41、可选的,所述声纹信息存储子模块包括:
42、语言种类设置单元,用于在预设时间段内,若未接收到用户的语言种类选择指令,确定预设语言种类为针对所述用户声纹信息所选择的语言种类。
43、可选的,所述声纹识别模块包括:
44、声纹识别子模块,用于检测到用户语音音频中存在预设唤醒词,将所述设备的语音识别模块由睡眠模式切换至唤醒状态;通过处于唤醒状态的语音识别模块,对所述用户语音音频进行声纹识别,得到用户声纹信息。
45、可选的,在所述语音识别模块处于唤醒状态时,所述装置还包括:
46、语言切换模块,用于响应用户的语言切换指令,获取所要切换的语言种类,并获取所要切换的语言种类的语言种类选择信息;在预设存储库存在与所述用户声纹信息匹配的预设声纹信息时,获取所述预设声纹信息的声纹信息编码,将所要切换的语言种类的语言种类选择信息与所述预设声纹信息的声纹信息编码进行绑定并存储至所述预设存储库。
47、可选的,语言切换模块还用于在预设存储库不存在与所述用户声纹信息匹配的预设声纹信息时,生成针对所述用户声纹信息的声纹信息编码,提示语言种类选择信息;响应用户的语言种类选择指令,生成针对所选择语言种类的语言种类编码信息,将所选择语言种类的语言种类编码信息和所述用户声纹信息的声纹信息编码存储至所述预设存储库。
48、本发明实施例还公开了一种电子设备,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现任一项所述设备的语音识别方法。
49、本发明实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现中任一项所述设备的语音识别方法。
50、本发明实施例包括以下优点:
51、在本发明实施例中,通过响应语音唤醒指令进行声纹识别得到用户声纹信息,并根据用户声纹信息和预设声纹信息的匹配结果,获取预设声纹信息的目标语言种类编码信息,向云端传输所获取到的目标语言种类编码信息,进而使得云端能够基于目标语言种类编码信息将设备的语言识别模型切换至目标语言种类的语言识别模型,以便设备切换至目标语言识别模型的设备能够按照目标语言种类进行语音播报。通过采用语音识别技术和声纹识别技术,对用户语音音频进行分析识别,以对用户声纹信息进行识别,获得设备对应需要使用的目标语言种类,进而自动选择并使用目标语言种类进行语音交互,提高多种语言情况下的切换准确性,从而实现对多语言种类的灵活切换,满足不同人群对语言种类的交互需求,能够适用于多种语言种类下的语音交互产品。
技术研发人员:王瑞瑞,李绍斌,陈彦宇,朱鹏飞,郑晓岩,方利杰
技术所有人:珠海格力电器股份有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
