首页  专利技术  电子电路装置的制造及其应用技术

一种基于注意力机制的双分支编解码沙丘形态类型识别模型

2026-01-06 12:00:07 479次浏览

技术特征:

1.一种基于注意力机制的双分支编解码沙丘形态类型识别模型,其特征在于,所述的模型包括:过完备网络和欠完备网络,过完备网络位于上行支路,包括一个编码器1和一个解码器1;欠完备网络位于下行支路,包括一个编码器2和一个解码器2;特征图在每一个编解码器模块中都经历了四层的特征图尺度变化,其每经过一次尺度缩小或尺度扩大所得到的深层全局语义信息与浅层细节语义信息都需要进行交互,为后续网络提供一个特征信息更丰富的输入;

2.如权利要求1所述的沙丘形态类型识别模型,其特征在于,所述的编码器2和解码器1中应用多尺度混合注意力机制。

3.如权利要求2所述的沙丘形态类型识别模型,其特征在于,所述的多尺度混合注意力机制是将通道注意力机制和空间注意力机制叠加使用。

4.如权利要求1所述的沙丘形态类型识别模型,其特征在于,所述的通道注意力机制中输入特征图经过多次通道切分,其计算方式如公式(5)-(6)所示:

5.如权利要求1所述的沙丘形态类型识别模型,其特征在于,所述的空间注意力模块包括:(1)通过一个5×5的深度卷积将局部信息进行聚合,获得特征图的空间信息;(2)并行三路不同尺度的深度条形卷积,以多分支的形式捕获不同尺度的特征语义上下文信息;(3)通过一个1×1的卷积核,融合不同通道之间的空间注意力信息,得到最终的空间注意力权重,并与输入特征图进行加权,实现网络对特征图空间位置信息的关注,得到最终的输出结果。

6.如权利要求1所述的沙丘形态类型识别模型,其特征在于,所述的空间注意力模块的计算方式如公式(12)-(13)所示:

7.如权利要求1所述的沙丘形态类型识别模型,其特征在于,所述的编码融合模块f1、f2、f3和f4实的计算方式如公式(14)-(17)所示:

8.如权利要求1所述的沙丘形态类型识别模型,其特征在于,所述的特征上采样模块由上采样核预测模块和特征重组模块两部分组成,一个参数为h×w×c的输入特征图经过倍率为σ上采样后,得到一个参数为σh×σw×c的输出特征图。

9.如权利要求1所述的沙丘形态类型识别模型,其特征在于,所述的上采样核预测模块中,输入特征图经过一个1×1的卷积将其通道数压缩至cm,经过一个kup×kup的卷积预测上采样核,得到的输出通道数为为了使不同位置对应使用各自上采样核,将其通道在空间维度展开,得到参数为的上采样核;经过softmax操作进行归一化,使其权值位于0至1的区间,以便后续网络实现上采样。

10.如权利要求1所述的沙丘形态类型识别模型,其特征在于,所述的特征重组模块,以输出特征图映射回输入特征图部分为中心的kup×kup区域的该位置的各个通道与该点的上采样核进行点积操作,得到最终的上采样结果,如公式(18)所示:


技术总结
本发明涉及计算机视觉识别技术,具体涉及一种基于注意力机制的双分支编解码沙丘形态类型识别模型,包括:过完备网络和欠完备网络,过完备网络位于上行支路,包括一个编码器1和一个解码器1;欠完备网络位于下行支路,包括一个编码器2和一个解码器2;特征图在每一个编解码器模块中都经历了四层的特征图尺度变化,其每经过一次尺度缩小或尺度扩大所得到的深层全局语义信息与浅层细节语义信息都需要进行交互,为后续网络提供一个特征信息更丰富的输入;使得双分支的结构能够充分发挥大感受野与小感受野的优势,获取更为丰富的特征信息,并验证了在不同数据集上的泛化能力和在不同算法之间识别性能的优势。

技术研发人员:王兆滨,时玥
受保护的技术使用者:兰州大学
技术研发日:
技术公布日:2024/11/26
文档序号 : 【 40126306 】

技术研发人员:王兆滨,时玥
技术所有人:兰州大学

备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
王兆滨时玥兰州大学
一种高活性改性生物炭及其制备方法和土壤改良剂 一种用于飞灰资源化制备岩棉的熔融系统和方法与流程
相关内容