一种文本处理方法、装置、设备及介质与流程
技术特征:
1.一种文本处理方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述将原始文本分别输入所述多个语言模型,得到所述多个语言模型中每个语言模型输出的所述原始文本中的每个语句的语句类型,包括:
3.如权利要求1所述的方法,其特征在于,所述基于所述每个语句对应的语句类型,对所述原始文本中包含的多个语句进行分类提取,包括:
4.如权利要求3所述的方法,其特征在于,所述第二组已训练的多个语言模型中包含的语言模型的类型,与所述第一组已训练的多个语言模型中包含的语言模型的类型相同。
5.如权利要求3-4任一项所述的方法,其特征在于,所述基于所述每个语句对应的语句类型和所述目标语句判断结果,对所述原始文本中包含的多个语句进行分类提取,包括:
6.如权利要求1所述的方法,其特征在于,所述获取第一组已训练的多个语言模型,包括:
7.如权利要求1所述的方法,其特征在于,所述基于所述每个语句对应的语句类型,对所述原始文本中包含的多个语句进行分类提取,包括:
8.如权利要求1所述的方法,其特征在于,所述基于所述每个语句对应的语句类型,对所述原始文本中包含的多个语句进行分类提取之后,所述方法还包括:
9.如权利要求1所述的方法,其特征在于,所述根据所述每个语句的语句类型确定所述原始文本的文本类型,包括:
10.如权利要求1所述的方法,其特征在于,所述基于所述分类提取文本的语义信息对所述分类提取文本进行概括,得到目标文本,包括:
11.一种文本处理装置,其特征在于,包括:
12.一种电子设备,其特征在于,包括:
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被计算机执行时,使所述计算机执行如权利要求1-10中任一项所述的方法。
14.一种计算机程序产品,其特征在于,所述计算机程序产品包括:计算机程序代码,当所述计算机程序代码在计算机上运行时,使得计算机执行上述如权利要求1-10中任一项所述的方法。
技术总结
本申请涉及数据处理领域,具体涉及一种文本处理方法、装置、设备及介质,用于解决使用单个模型在对原始文本中的语句信息进行分类并提取时,容易导致某一类型对应的语句缺失的情况出现的问题。该方法可以获取第一组已训练的多个语言模型,每个语言模型用于判断一种语句类型,将原始文本分别输入多个语言模型,可以得到每个语言模型输出的原始文本中的每个语句的语句类型,并基于每个语句对应的语句类型,对原始文本中包含的多个语句进行分类提取。通过准备多个预训练语言模型,每个预训练语言模型只需要判断语句是否属于一种类型即可,避免了使用单个模型容易出现类型缺失的情况,并且,使用训练好的大语言模型,可以提高分类的正确率。
技术研发人员:戴菀庭,聂砂,罗奕康,丁苏苏,郑江
受保护的技术使用者:中国建设银行股份有限公司
技术研发日:
技术公布日:2024/11/18
技术研发人员:戴菀庭,聂砂,罗奕康,丁苏苏,郑江
技术所有人:中国建设银行股份有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
