一种图像生成方法及相关装置与流程
技术特征:
1.一种图像生成方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,基于所述第一文本特征,对所述第一初始特征进行特征提取,获得第一中间特征,包括:
3.如权利要求2所述的方法,其特征在于,所述基于前一次下采样得到的第二下采样特征和第一下采样特征,结合所述第二文本特征,获得当前次下采样的第二下采样特征,包括:
4.如权利要求3所述的方法,其特征在于,所述基于当前次下采样的输入数据,结合所述第二文本特征进行下采样处理,获得当前次下采样的第二下采样特征,包括:
5.如权利要求2-4中任一项所述的方法,其特征在于,基于所述第三文本特征,对所述第三初始特征进行特征提取,获得第三中间特征,包括:
6.如权利要求5所述的方法,其特征在于,第三下采样特征包括下采样过程中的第三语义特征、第三自注意力特征、第三交叉注意力特征;
7.如权利要求6所述的方法,其特征在于,所述基于当前次下采样得到的第二自注意力特征,结合当前次下采样的第三语义特征进行自注意力处理,获得当前次下采样的第三自注意力特征,包括:
8.如权利要求1-4中任一项所述的方法,其特征在于,所述基于所述第一中间特征和所述第二中间特征,对所述第三中间特征进行特征重构,获得目标图像特征,包括:
9.如权利要求8所述的方法,其特征在于,第三上采样特征包括上采样过程中的第三语义特征、第三自注意力特征、第三交叉注意力特征;
10.如权利要求9所述的方法,其特征在于,所述基于当前次上采样得到的第三语义特征,结合当前次上采样得到的第一上采样特征中的第一语义特征进行自注意力处理,获得当前次上采样的第三自注意力特征,包括:
11.如权利要求9所述的方法,其特征在于,所述基于当前次上采样得到的第三自注意力特征、当前次上采样得到的第二上采样特征中的第二自注意力特征,结合所述第三文本特征进行交叉注意力处理,获得当前次上采样的第三交叉注意力特征,包括:
12.如权利要求1-4中任一项所述的方法,其特征在于,所述基于所述第一文本特征、所述第二文本特征和所述第三文本特征,分别对所述第一初始特征、所述第二初始特征和所述第三初始特征进行特征提取,获得相应的第一中间特征、第二中间特征和第三中间特征,包括:
13.一种图像生成装置,其特征在于,包括:
14.一种电子设备,其特征在于,其包括处理器和存储器,其中,所述存储器存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1~12中任一所述方法的步骤。
15.一种计算机可读存储介质,其特征在于,其包括计算机程序,当所述计算机程序在电子设备上运行时,所述计算机程序用于使所述电子设备执行权利要求1~12中任一所述方法的步骤。
16.一种计算机程序产品,其特征在于,其包括计算机程序,所述计算机程序存储在计算机可读存储介质中,电子设备的处理器从所述计算机可读存储介质读取并执行所述计算机程序,使得所述电子设备执行权利要求1~12中任一所述方法的步骤。
技术总结
本申请涉及计算机技术领域,提供一种图像生成方法及相关装置,用以生成图像质量,其中,该方法包括:首先,基于图像描述文本,分别提取出三类图像属性各自对应的文本特征,并利用噪声图像,初始化生成三类图像属性各自对应的初始特征;其次,利用三类图像属性各自对应的文本特征,分别对三类图像属性各自对应的初始特征进行特征提取,获得三类图像属性各自对应的中间特征,通过特征提取,提取出与图像描述文本相关的特征,达到去噪的效果;最后,基于三类图像属性各自对应的中间特征进行特征重构,来生成目标图像,从而减少各类图像属性的信息损失,提高生成图像的准确率。
技术研发人员:冯鑫
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:
技术公布日:2024/11/28
技术研发人员:冯鑫
技术所有人:腾讯科技(深圳)有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
