基于数据排序的大模型微调训练方法、系统、设备及介质与流程
技术特征:
1.一种基于数据排序的大模型微调训练方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于数据排序的大模型微调训练方法,其特征在于,所述根据所述预热大模型确定所述微调训练数据的输入问题向量和质量得分,其具体包括:
3.根据权利要求1所述的一种基于数据排序的大模型微调训练方法,其特征在于,所述根据所述质量得分对所述微调训练数据进行划分,得到简单训练数据和复杂训练数据,其具体包括:
4.根据权利要求1所述的一种基于数据排序的大模型微调训练方法,其特征在于,所述根据所述输入问题向量对所述简单训练数据和所述复杂训练数据分别进行向量聚类和排序,得到简单排序数据和复杂排序数据,其具体包括:
5.根据权利要求1至4中任一项所述的一种基于数据排序的大模型微调训练方法,其特征在于,所述依次通过所述简单排序数据和所述复杂排序数据对所述预热大模型进行多阶段微调训练,得到目标微调大模型,其具体包括:
6.根据权利要求5所述的一种基于数据排序的大模型微调训练方法,其特征在于,所述根据所述损失值从当前训练数据中选取出多个低损失值数据和多个高损失值数据,其具体包括:
7.根据权利要求5所述的一种基于数据排序的大模型微调训练方法,其特征在于,所述对所述高损失值数据进行数据清洗,其具体包括:
8.一种基于数据排序的大模型微调训练系统,其特征在于,包括:
9.一种电子设备,其特征在于,所述电子设备包括存储器、处理器、存储在所述存储器上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,所述程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于数据排序的大模型微调训练方法的步骤。
10.一种存储介质,所述存储介质为计算机可读存储介质,用于计算机可读存储,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1至7中任一项所述的基于数据排序的大模型微调训练方法的步骤。
技术总结
本发明公开了基于数据排序的大模型微调训练方法、系统、设备及介质,包括:从微调训练数据中选取多个预热训练数据,通过预热训练数据对目标大模型进行预热,得到预热大模型;根据预热大模型确定微调训练数据的输入问题向量和质量得分;根据质量得分对微调训练数据进行划分,得到简单训练数据和复杂训练数据,进而根据输入问题向量对简单训练数据和复杂训练数据分别进行向量聚类和排序,得到简单排序数据和复杂排序数据;依次通过简单排序数据和复杂排序数据对预热大模型进行多阶段微调训练,得到目标微调大模型。本发明提高了大模型微调训练的效率以及模型性能,可应用于人工智能技术领域。
技术研发人员:黄钰瑶,李学龙,赵宇,宋双永,李永翔
受保护的技术使用者:中电信人工智能科技(北京)有限公司
技术研发日:
技术公布日:2024/11/18
技术研发人员:黄钰瑶,李学龙,赵宇,宋双永,李永翔
技术所有人:中电信人工智能科技(北京)有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
