基于神经网络预训练大模型的旁路定向微调方法和系统与流程
技术特征:
1.一种基于神经网络预训练大模型的旁路定向微调方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种基于神经网络预训练大模型的旁路定向微调方法,其特征在于,所述的从原始问答数据集中剔除情感置信度不满足情绪阈值的数据得到剔除后的新的问答数据集,具体包括:
3.根据权利要求1所述的一种基于神经网络预训练大模型的旁路定向微调方法,其特征在于,所述的采用所述训练集在预训练大模型的旁路进行微调,同时约束模型的工程性能与情感倾向,具体包括:
4.根据权利要求3所述的一种基于神经网络预训练大模型的旁路定向微调方法,其特征在于,采用负对数似然损失函数,具体表示为:
5.根据权利要求4所述的一种基于神经网络预训练大模型的旁路定向微调方法,其特征在于,具体表示为:
6.根据权利要求1-5任一项所述的一种基于神经网络预训练大模型的旁路定向微调方法,其特征在于,所述预训练大模型采用chatgpt或llama。
7.一种基于神经网络预训练大模型的旁路定向微调系统,其特征在于,所述系统包括:
8.根据权利要求7所述的一种基于神经网络预训练大模型的旁路定向微调系统,其特征在于,所述数据处理模块还包括:
9.根据权利要求7所述的一种基于神经网络预训练大模型的旁路定向微调系统,其特征在于,所述迭代训练模块在所述预训练大模型的旁路引入低秩矩阵来修改所述预训练模型的权重矩阵,具体表示为:
10.根据权利要求9所述的一种基于神经网络预训练大模型的旁路定向微调系统,其特征在于,采用负对数似然损失函数,具体表示为:
技术总结
本申请公开了一种基于神经网络预训练大模型的旁路定向微调方法和系统,涉及自然语言处理技术领域,该方法包括:从原始问答数据集中剔除情感置信度不满足情绪阈值的数据得到新的问答数据集,并将其划分训练集和测试集;采用训练集在预训练大模型的旁路进行微调,同时约束模型的工程性能与情感倾向;迭代更新模型权重参数,当工程性能指标与情感倾向指标同时达到设定阈值时,结束训练,得到最终模型;选择不同的情绪阈值重复上述步骤,得到多个最终模型。本申请通过在预训练大模型的旁路进行高效微调,同时约束模型的工程性能与情感倾向,使得大模型的输出在满足一般性工程性能的基础上,能够倾向于指定的情绪,提高了用户的体验感。
技术研发人员:白登辉,王家良,赵红蕾,付韵潮,邱翔,曾丽竹,邱壮,刘艳
受保护的技术使用者:四川省建筑设计研究院有限公司
技术研发日:
技术公布日:2024/11/28
文档序号 :
【 40165196 】
技术研发人员:白登辉,王家良,赵红蕾,付韵潮,邱翔,曾丽竹,邱壮,刘艳
技术所有人:四川省建筑设计研究院有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
技术研发人员:白登辉,王家良,赵红蕾,付韵潮,邱翔,曾丽竹,邱壮,刘艳
技术所有人:四川省建筑设计研究院有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
