一种基于多标签学习的多源素材混合剪辑视频的方法及系统与流程

2026-06-24 13:40:06 467次浏览

技术特征：

1.一种基于多标签学习的多源素材混合剪辑视频的方法及系统，其特征在于：包括

2.根据权利要求1所述的一种基于多标签学习的多源素材混合剪辑视频的方法及系统，其特征在于：所述步骤二中分阶段视频token化算法具体如下：输入：token内距离阈值（）；最少样本数min_num；视频片段；聚类算法a；最大迭代次数t

技术总结
本发明公开了一种基于多标签学习的多源素材混合剪辑视频的方法及系统，包括步骤一：最大化近义模糊匹配学习；最大化近义模糊匹配学习旨在将多标签分类问题映射为模糊匹配任务；步骤二：分阶段视频token化；步骤三：视频片段排序策略。本发明提出的学习策略，可以解决多标签分类中一对多的模糊匹配问题，不需要训练多个二分类器即可完成对多标签分类任务的训练，避免了同时训练多个二分类器所产生的损失计算冲突，并且节省了计算资源，本发明提出的视频词元（token）化方法，基于最小类内距离，分阶段完成对视频的token化，生成的视频token词典可接入后续任何tokens‑to‑token的训练任务。

技术研发人员：张思睿,柴兆虎,林宇,赵宇迪,施侃
受保护的技术使用者：开域数科信息技术（北京）有限公司
技术研发日：
技术公布日：2024/12/2

文档序号 : 【 40199978 】

技术研发人员：张思睿,柴兆虎,林宇,赵宇迪,施侃
技术所有人：开域数科信息技术（北京）有限公司

备注：该技术已申请专利，仅供学习研究，如用于商业用途，请联系技术所有人。
声明 ：此信息收集于网络，如果你是此专利的发明人不想本网站收录此信息请联系我们，我们会在第一时间删除

张思睿丨柴兆虎丨林宇丨赵宇迪丨施侃丨开域数科信息技术（北京）有限公司