视频/图像网络的训练方法、分割方法及相关装置与流程

2026-02-02 16:40:02 462次浏览

技术特征：

1.一种视频/图像分割网络的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，在所述从目标域视频的各第一样本视频帧中，选出目标对象的第一分割形状的质量满足预设要求的至少一个所述第一样本视频帧，作为第二样本视频帧之前，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述将所述目标域视频对应的目标对象的各第一分割形状与所述第一源域视频对应的目标对象的第二分割形状对齐，得到所述目标对象的各所述第一分割形状对应的对齐分割形状，包括：

4.根据权利要求3所述的方法，其特征在于，所述第一源域视频包括若干第三样本视频帧，至少一个所述第三样本视频帧上标注有目标对象的真实分割形状；所述降噪网络的训练步骤，包括：

5.根据权利要求4所述的方法，其特征在于，所述降噪网络包括依序连接的编码器和离散化层；所述至少基于所述目标对象的降噪分割形状与所述目标对象的第二分割形状之间的第一差异，调整所述降噪网络的网络参数，包括：

6.根据权利要求4所述的方法，其特征在于，所述目标对象的分割形状采用目标对象分割概率图表征，所述目标对象分割概率图表示样本视频帧中各个样本像素点属于目标对象解剖结构的置信度；所述对所述第三样本视频帧的目标对象的第二分割形状进行噪声处理，得到所述目标对象的第三分割形状，包括：

7.根据权利要求2所述的方法，其特征在于，所述预设要求包括所述目标对象的各所述第一分割形状的质量中的最大者；

8.根据权利要求1所述的方法，其特征在于，所述基于各所述第二样本视频帧的目标对象的第一分割形状，确定所述目标域视频的多个第一样本视频帧的伪标签，包括：

9.根据权利要求8所述的方法，其特征在于，所述利用各所述第二样本视频帧的伪标签，以及除所述第二样本视频帧以外的其他第一样本视频帧的目标对象的第一分割形状与至少一个所述第二样本视频帧的目标对象的第一分割形状之间的位移变化，确定所述其他第一样本视频帧的伪标签，包括：

10.根据权利要求9所述的方法，其特征在于，所述位移变化包括位移方向变化和位移大小变化中的至少一者。

11.根据权利要求10所述的方法，其特征在于，所述位移变化包括所述位移方向变化；所述获取所述其他第一样本视频帧中的目标对象的第一分割形状与所述第二样本视频帧的目标对象的第一分割形状之间的位移变化，包括：

12.根据权利要求10所述的方法，其特征在于，所述位移变化包括所述位移大小变化；所述获取所述其他第一样本视频帧中的目标对象的第一分割形状与所述第二样本视频帧的目标对象的第一分割形状之间的位移变化，包括：

13.根据权利要求1所述的方法，其特征在于，在所述从目标域视频的各第一样本视频帧中，选出目标对象的第一分割形状的质量满足预设要求的至少一个所述第一样本视频帧，作为第二样本视频帧之前，所述方法还包括：

14.根据权利要求13所述的方法，其特征在于，所述多个第一样本视频帧包括除所述第二样本视频帧以外的其他第一样本视频帧，所述其他第一样本视频帧的伪标签是基于其他第一样本视频帧的目标对象的第一分割形状与所述第二样本视频帧的目标对象的第一分割形状之间的位移变化确定的；在所述将各所述相邻视频帧与所述第一样本视频帧进行拼接，得到样本拼接视频帧之后，所述方法还包括：

15.根据权利要求1所述的方法，其特征在于，所述视频/图像分割网络还用于预测不同视频帧的目标对象的分割形状之间的位移变化；在所述基于各所述第二样本视频帧的目标对象的第一分割形状，确定所述目标域视频的多个第一样本视频帧的伪标签之后，所述方法还包括：

16.根据权利要求15所述的方法，其特征在于，所述利用所述第三差异、第四差异以及第五差异，对所述视频/图像分割网络进行参数调整，包括：

17.根据权利要求1所述的方法，其特征在于，所述目标对象的第一分割形状的质量与所述目标对象的第一分割形状对应的所述对齐程度正相关；

18.一种分割方法，其特征在于，所述方法包括：

19.一种视频/图像分割网络的训练装置，其特征在于，所述装置包括：

20.一种分割装置，其特征在于，所述装置包括：

21.一种电子设备，其特征在于，所述电子设备包括处理器和存储器，所述存储器存储有程序指令，所述处理器用于执行所述程序指令以实现如权利要求1-18任一项所述的方法。

22.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储程序，所述程序指令能够被执行以实现如权利要求1-18任一项所述的方法。

技术总结
本申请公开了一种视频/图像网络的训练方法、分割方法及相关装置，该方法包括：从目标域视频的各第一样本视频帧中，选出目标对象的第一分割形状的质量满足预设要求的至少一个第一样本视频帧，作为第二样本视频帧；基于各第二样本视频帧的目标对象的第一分割形状，确定目标域视频的多个第一样本视频帧的伪标签，多个第一样本视频帧的伪标签用于对视频/图像分割网络的训练。通过上述方式，本申请能够提高视频/图像分割网络的泛化性能。

技术研发人员：魏鸿荣,王娜,刘迎澳,申田
受保护的技术使用者：上海商汤善萃医疗科技有限公司
技术研发日：
技术公布日：2024/11/26

文档序号 : 【 40125389 】

技术研发人员：魏鸿荣,王娜,刘迎澳,申田
技术所有人：上海商汤善萃医疗科技有限公司

备注：该技术已申请专利，仅供学习研究，如用于商业用途，请联系技术所有人。
声明 ：此信息收集于网络，如果你是此专利的发明人不想本网站收录此信息请联系我们，我们会在第一时间删除

魏鸿荣丨王娜丨刘迎澳丨申田丨上海商汤善萃医疗科技有限公司