问答方法、装置、计算机设备、计算机可读存储介质与流程

本技术涉及自然语言处理,特别是涉及一种问答方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
背景技术:
1、随着人工智能技术的发展,智能问答开始被普遍应用于智能客服、ai检索等。目前较常用的是faq(frequently asked questions)检索式问答系统,但大多faq检索式问答是基于问题进行检索,依赖问题的数据质量,易导致检索结果不够准确。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高检索结果准确度的问答方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本技术提供了一种问答方法,包括:
3、根据用户问题检索常见问题解答知识库,获取第一检索结果;
4、在所述第一检索结果包括至少一条常见问题解答数据的情况下,根据所述用户问题、各所述常见问题解答数据的问题部分和答案部分,分别确定每条所述常见问题解答数据对应的问题相似度和答案相似度;
5、根据所述答案相似度和所述问题相似度对所述第一检索结果进行筛选,获取第二检索结果;
6、在所述第二检索结果包括至少一条所述常见问题解答数据的情况下,根据所述第二检索结果中各所述常见问题解答数据的答案相似度和问题相似度,分别确定所述第二检索结果中每条所述常见问题解答数据对应的常见问题解答相似度;
7、根据所述常见问题解答相似度确定所述用户问题的检索结果。
8、在其中一个实施例中,所述根据所述用户问题、各所述常见问题解答数据的问题部分和答案部分,分别确定每条所述常见问题解答数据对应的问题相似度和答案相似度,包括:
9、根据第一向量化模型,分别对所述用户问题和所述答案部分进行向量化处理,获取第一用户问题向量和答案向量集合;所述答案向量集合中至少包括一答案向量;
10、计算所述答案向量集合中每一所述答案向量与所述第一用户问题向量的向量相似度,作为所述答案向量对应的常见问题解答数据的答案相似度;
11、根据第二向量化模型,分别对所述用户问题和所述问题部分进行向量化处理,获取第二用户问题向量和问题向量集合;所述问题向量集合中至少包括一问题向量;
12、计算所述问题向量合集中每一所述问题向量与所述第二用户问题向量的向量相似度,作为所述问题向量对应的常见问题解答数据的问题相似度。
13、在其中一个实施例中,所述问题向量集合包括标准问向量和相似问向量;
14、所述计算所述问题向量合集中每一问题向量与所述第二用户问题向量的向量相似度,包括:
15、分别计算每一所述标准问向量与所述第二用户问题向量的标准问相似度;
16、分别计算每一所述相似问向量与所述第二用户问题向量的相似问相似度;
17、计算同一所述标准问向量对应的多个相似问向量的相似问相似度均值;
18、根据所述标准问相似度和所述相似问相似度均值,获取每一所述问题向量与所述第二用户问题向量的向量相似度。
19、在其中一个实施例中,所述根据所述第二检索结果中各所述常见问题解答数据的答案相似度和问题相似度,分别确定所述第二检索结果中每条所述常见问题解答数据对应的常见问题解答相似度,包括:
20、对所述第二检索结果中的各所述常见问题解答数据对应的答案相似度和问题相似度进行归一化处理;
21、根据归一化处理后的答案相似度和问题相似度,分别获取答案相似度权重和问题相似度权重;
22、根据所述答案相似度权重和所述问题相似度权重,对所述第二检索结果中的各所述常见问题解答数据的答案相似度和问题相似度进行加权求和计算处理,获取每条所述常见问题解答数据对应的常见问题解答相似度。
23、在其中一个实施例中,所述根据归一化处理后的答案相似度和问题相似度,分别获取答案相似度权重和问题相似度权重,包括:
24、根据所述根据归一化处理后的答案相似度,获取每一所述常见问题解答数据对应的答案比重;
25、根据多个所述答案比重获取答案熵值;
26、根据所述答案熵值获取答案信息熵冗余度;
27、据所述归一化处理后的问题相似度,获取每一所述常见问题解答数据对应的问题比重;
28、根据多个所述问题比重获取问题熵值;
29、根据所述问题熵值获取问题信息熵冗余度;
30、根据所述问题信息熵冗余度和所述答案信息熵冗余度,分别计算所述答案相似度权重和所述问题相似度权重。
31、在其中一个实施例中,所述方法还包括:
32、在所述第一检索结果,或,所述第二检索结果为空的情况下,根据所述用户问题检索文档知识库,获取文档检索结果;
33、在所述文档检索结果包括至少一条文档检索数据的情况下,根据所述文档检索结果确定所述用户问题的检索结果;
34、在所述文档检索结果为空的情况下,根据所述用户问题对应的预设答案作为所述用户问题的检索结果。
35、第二方面,本技术还提供了一种问答装置,所述装置包括:
36、检索结果获取模块,用于根据用户问题检索常见问题解答知识库,获取第一检索结果,根据答案相似度和问题相似度对所述第一检索结果进行筛选,获取第二检索结果,以及根据常见问题解答相似度确定所述用户问题的检索结果;
37、相似度获取模块,用于在所述第一检索结果包括至少一条常见问题解答数据的情况下,根据所述用户问题、各所述常见问题解答数据的问题部分和答案部分,分别确定每条所述常见问题解答数据对应的问题相似度和答案相似度;以及,在所述第二检索结果包括至少一条所述常见问题解答数据的情况下,根据所述第二检索结果中各所述常见问题解答数据的答案相似度和问题相似度,分别确定所述第二检索结果中每条所述常见问题解答数据对应的常见问题解答相似度。
38、第三方面,本技术还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例提供的问答方法的步骤。
39、第四方面,本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例提供的问答方法的步骤。
40、第五方面,本技术还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述任一实施例提供的问答方法的步骤。
41、上述问答方法、装置、计算机设备、计算机可读存储介质和计算机程序产品中,通过根据用户问题检索常见问题解答知识库,获取第一检索结果,在第一检索结果包括至少一条常见问题解答数据的情况下,根据用户问题、各常见问题解答数据的问题部分和答案部分,分别确定每条常见问题解答数据对应的问题相似度和答案相似度,根据答案相似度和问题相似度对第一检索结果进行筛选,获取第二检索结果,在第二检索结果包括至少一条常见问题解答数据的情况下,根据第二检索结果中各常见问题解答数据的答案相似度和问题相似度,分别确定第二检索结果中每条常见问题解答数据对应的常见问题解答相似度,进一步地,根据常见问题解答相似度确定用户问题的检索结果。相较于传统方式中依赖用户问题的提问质量进行检索的方式,本技术综合考虑了根据用户问题初步检索的常见问题解答数据中,答案部分和用户问题的答案相似度、以及问题部分和用户问题的问题相似度,并基于该答案相似度和问题相似度获取常见问题解答数据对应的常见问题解答相似度,可以明显提高检索答案的准确性,提高用户的满意度。
技术研发人员:柏雪,韩剑平,宋磊,刘芳芳,艾若琳
技术所有人:一汽解放汽车有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
