一种提升大模型回答应急知识问题准确性的生成方法与流程
技术特征:
1.一种提升大模型回答应急知识问题准确性的生成方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种提升大模型回答应急知识问题准确性的生成方法,其特征在于,所述步骤s1中获取应急行业相关的信息并进行预处理操作的具体方法为:从多渠道收集应急行业相关的文本内容,包括法律法规、事故案例、专业书籍、安全考试资料以及日常问答;然后,对上述文本内容的文字信息数据进行清洗,去除无关信息,仅保留与应急行业紧密相关的内容。
3.根据权利要求2所述的一种提升大模型回答应急知识问题准确性的生成方法,其特征在于,所述步骤s2中构建应急行业专业知识库的方法为:
4.根据权利要求3所述的一种提升大模型回答应急知识问题准确性的生成方法,其特征在于,所述步骤s3中具体通过混合检索的方式从知识库中筛选出与问题相关的候选答案;其具体步骤如下:
5.根据权利要求4所述的一种提升大模型回答应急知识问题准确性的生成方法,其特征在于,所述步骤s4中利用cross-encoder模型对候选答案进行重排序的方法为:
6.根据权利要求5所述的一种提升大模型回答应急知识问题准确性的生成方法,其特征在于,所述步骤s4.2在模型训练过程中,采用二元交叉熵损失函数,来优化模型参数;通过最小化损失函数,模型能够逐渐学习到如何准确地判断答案a是否与问题q相关,最终期望属于正例的样本模型能够输出为1,而负例的样本模型输出为0。
7.根据权利要求5所述的一种提升大模型回答应急知识问题准确性的生成方法,其特征在于,所述步骤s5中通过大模型整合并生成最终答案的具体方法为:将经过cross-encoder模型重排序后的候选答案p_final和问题经提示词模板拼接输入到大模型中,由大模型进行整合和推理,生成最终的回答。
技术总结
本发明涉及应急知识问答模型生成的技术领域;本发明提出了一种提升大模型回答应急知识问题准确性的生成方法,通过构建应急行业专业知识库并在检索时提升召回率,以提升模型对于应急行业相关问题和答案的理解和回答准确性。本发明的主要思路是,首先查找关于应急行业方向不同类型的知识,根据不同类型特征进行知识库的构建和存储。其次,在检索时,采用二阶段的检索策略,提升知识库中相关答案的命中率。最后,将检索到的答案输入到大模型中进行推理和生成,从而得到更加准确和专业的回答。本发明不仅优化了应急行业专业知识库的构建策略和存储方案;并且提出了一种能够基于混合检索算法和Cross‑Encoder模型重排序的二阶段检索策略。
技术研发人员:俞一奇,李华松,邱彦林
受保护的技术使用者:深蓝感知(杭州)物联科技有限公司
技术研发日:
技术公布日:2024/11/28
文档序号 :
【 40164176 】
技术研发人员:俞一奇,李华松,邱彦林
技术所有人:深蓝感知(杭州)物联科技有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
技术研发人员:俞一奇,李华松,邱彦林
技术所有人:深蓝感知(杭州)物联科技有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
