模型训练方法、视频生成方法、电子设备与流程

2025-09-02 15:40:02 691次浏览

技术特征：

1.一种模型训练方法，其特征在于，所述模型包括多个编码器、扩散模型和解码器，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述扩散模型包括前向扩散网络和后向扩散网络；

3.根据权利要求2所述的方法，其特征在于，所述预测的噪声基于所述后向扩散网络中的引导条件得到；

4.根据权利要求1-3任一项所述的方法，其特征在于，所述对所述预测嵌入向量进行视频转换处理，得到对应的预测视频，包括：

5.根据权利要求1所述的方法，其特征在于，所述使用所述采样视频对多个编码器进行预训练，包括：

6.根据权利要求5所述的方法，其特征在于，所述模型中的编码器包括第一编码器、第二编码器和第三编码器；

7.根据权利要求6所述的方法，其特征在于，所述第一编码器的训练方法包括：

8.根据权利要求6所述的方法，其特征在于，所述第二编码器的训练方法包括：

9.根据权利要求6所述的方法，其特征在于，所述第三编码器的训练方法包括：

10.一种模型训练装置，其特征在于，所述模型包括多个编码器、扩散模型和解码器，所述装置包括：

11.一种视频生成方法，其特征在于，包括：

12.一种视频生成装置，其特征在于，包括：

13.一种电子设备，其特征在于，包括存储器和处理器；其中，

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如上述权利要求1-9或11任一项所述的方法。

15.一种计算机程序产品，其特征在于，所述计算机程序被处理器执行时实现如上述权利要求1-9或11任一项所述的方法。

技术总结
本申请实施例提供一种模型训练方法、视频生成方法、电子设备。该方法包括：获取采样视频，并使用采样视频对多个编码器进行预训练；其中，各编码器分别基于不同的预设任务，使用自监督学习方法训练；使用训练好的各编码器分别提取采样视频的各预设特征，并进行加权求和得到采样视频对应的第一潜空间向量；使用扩散模型对第一潜空间向量进行加噪和去噪处理，得到第二潜空间向量；使用解码器对第二潜空间向量进行解码和视频转换处理得到对应的预测视频；根据采样视频和预测视频，调整扩散模型和解码器的参数，直至得到训练好的扩散模型和解码器。该方法用以达到减少训练数据量，且能提高视频编码特征信息维度和提升生成视频质量的效果。

技术研发人员：王响,刘兆祥,王恺,廉士国
受保护的技术使用者：中国联合网络通信集团有限公司
技术研发日：
技术公布日：2024/11/18

文档序号 : 【 40048552 】

技术研发人员：王响,刘兆祥,王恺,廉士国
技术所有人：中国联合网络通信集团有限公司

备注：该技术已申请专利，仅供学习研究，如用于商业用途，请联系技术所有人。
声明 ：此信息收集于网络，如果你是此专利的发明人不想本网站收录此信息请联系我们，我们会在第一时间删除

王响丨刘兆祥丨王恺丨廉士国丨中国联合网络通信集团有限公司