首页  专利技术  电子电路装置的制造及其应用技术

序列处理方法、电子设备和存储介质与流程

2025-12-20 11:20:01 628次浏览

技术特征:

1.一种序列处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的序列处理方法,其特征在于,所述将大语言模型的输入数据转换成对应的输入序列,并确定所述输入序列的第一长度,包括:

3.根据权利要求1所述的序列处理方法,其特征在于,所述基于所述第一长度和所述大语言模型对应的第一预设序列长度确定第一批次数,将所述输入序列分割成有序的第一批次数个子序列,包括:

4.根据权利要求3所述的序列处理方法,其特征在于,所述将所述输入序列中每第一预设序列长度个输入词元依次划分为一个子序列,包括:

5.根据权利要求1所述的序列处理方法,其特征在于,所述基于所述输入词元在对应的所述子序列中的位置进行位置编码,得到各个所述输入词元对应的第二位置编码,包括:

6.根据权利要求1所述的序列处理方法,其特征在于,所述基于各个所述输入词元对应的所述第二查询向量、所述第二键向量和所述值向量进行注意力处理,包括:

7.根据权利要求1所述的序列处理方法,其特征在于,所述大语言模型通过以下方式训练:

8.根据权利要求7所述的序列处理方法,其特征在于,所述确定各个所述样本词元对应的样本子序列序号,包括:

9.根据权利要求8所述的序列处理方法,其特征在于,所述基于所述样本词元在对应的样本子序列中的位置对各个所述样本词元进行旋转位置编码,得到各个所述样本词元对应的样本第二位置编码,包括:

10.根据权利要求8所述的序列处理方法,其特征在于,所述基于多个所述样本词元对应的所述样本第二查询向量、所述样本第二键向量和所述样本值向量进行注意力处理,包括:

11.一种电子设备,其特征在于,所述电子设备包括存储器、处理器、存储在所述存储器上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,所述程序被所述处理器运行时实现如权利要求1至10中任一项所述的序列处理方法。

12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器运行,以实现如权利要求1至10中任一项所述的序列处理方法。


技术总结
本公开提出一种序列处理方法、电子设备和存储介质,序列处理方法包括:将输入序列分割成有序的第一批次数个子序列,并确定各个子序列对应的子序列序号;基于子序列序号确定子序列中的各个输入词元对应的第一位置编码;基于输入词元在对应的子序列中的位置序号确定各个输入词元对应的第二位置编码,并基于第一位置编码和第二位置编码确定对应的目标位置编码;针对各个输入词元,基于对应的目标位置编码调整对应的第一查询向量和第一键向量,得到对应的第二查询向量和第二键向量;基于各个输入词元对应的各个第二查询向量、各个第二键向量和各个值向量进行注意力处理,得到与输入数据对应的输出序列。本公开能提高大语言模型在推理过程中的外推性。

技术研发人员:米良,阮春阳
受保护的技术使用者:苏州亿铸智能科技有限公司
技术研发日:
技术公布日:2024/11/26
文档序号 : 【 40127057 】

技术研发人员:米良,阮春阳
技术所有人:苏州亿铸智能科技有限公司

备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
米良阮春阳苏州亿铸智能科技有限公司
一种固体废物处理设备的制作方法 一种多维数据分析的智慧农村监测系统的制作方法
相关内容