一种基于图文模态分区插值的行人重识别数据增强方法

2026-03-19 15:20:07 477次浏览

技术特征：

1.一种基于图文模态分区插值的行人重识别数据增强方法，其特征在于，步骤包括：

2.根据权利要求1所述基于图文模态分区插值的行人重识别数据增强方法，其特征在于，图文数据增强算法步骤包括：

3.根据权利要求1所述基于图文模态分区插值的行人重识别数据增强方法，其特征在于，视觉与文本特征提取中以源数据psr、目标数据ptg和增强数据pau作为数据输入。

4.根据权利要求1所述基于图文模态分区插值的行人重识别数据增强方法，其特征在于，视觉特征的提取步骤包括：

5.根据权利要求1所述基于图文模态分区插值的行人重识别数据增强方法，其特征在于，文本特征的提取步骤包括：

6.根据权利要求1所述基于图文模态分区插值的行人重识别数据增强方法，其特征在于，全局特征对齐步骤包括：

7.根据权利要求6所述基于图文模态分区插值的行人重识别数据增强方法，其特征在于，全局特征的相似度表示为：

8.根据权利要求1所述基于图文模态分区插值的行人重识别数据增强方法，其特征在于，局部特征对齐步骤包括：

9.根据权利要求8所述基于图文模态分区插值的行人重识别数据增强方法，其特征在于，局部特征的相似度表示为：

10.根据权利要求4所述基于图文模态分区插值的行人重识别数据增强方法，其特征在于，行人重识别模型的总损失表示为：

技术总结
本发明公开了一种基于图文模态分区插值的行人重识别数据增强方法，本发明利用语义字典将图像部分和属性词进行映射，然后在此关系下分别对图像部分和局部词汇进行局部线性插值和局部词汇替换，以生成增强的图像‑文本对，然后增强样本和原始样本一并参与模型的训练。本发明所述方法增强模型的泛化能力，对模型融合互补信息，有利于文本检索行人重识别任务精度的提升。本发明通过对图文两个模块分区插值这样输入级的数据增强方法，可以在不改变模型基础组件的前提下，实现特征的有效融合，解决了训练过程中依赖特定参数导致过拟合，限制了模型在未见数据上的泛化能力的问题。

技术研发人员：袁鑫攀,李家宝,匡俊桦,甘文光,金思铭
受保护的技术使用者：湖南工业大学
技术研发日：
技术公布日：2024/11/26

文档序号 : 【 40123648 】

技术研发人员：袁鑫攀,李家宝,匡俊桦,甘文光,金思铭
技术所有人：湖南工业大学

备注：该技术已申请专利，仅供学习研究，如用于商业用途，请联系技术所有人。
声明 ：此信息收集于网络，如果你是此专利的发明人不想本网站收录此信息请联系我们，我们会在第一时间删除

袁鑫攀丨李家宝丨匡俊桦丨甘文光丨金思铭丨湖南工业大学

非同心型挤压油膜阻尼器油膜力确定方法及装置与流程一种适用于混输原油凝点的概率密度预测方法