图像分类方法、装置、电子设备及存储介质

本申请属于人工智能,具体涉及一种图像分类方法、装置、电子设备及存储介质。
背景技术:
1、随着人们对环境保护的日益重视和自然保护意识的不断提高,保护物种多样性、促进人与自然和谐发展的重要性愈加突出。生物分类为我们理解和保护地球上的生物多样性提供了基础和方法,具有重要的现实意义和科学价值。
2、现有技术中通常使用机器模型对图像进行生物分类。然而现有的生物分类模型通常准确率低,并且无法同时应用于传统分类任务和细粒度分类任务。
技术实现思路
1、鉴于此,本申请的目的在于提供一种图像分类方法、装置、电子设备及存储介质,以同时适用于传统生物分类任务以及细粒度生物分类任务。
2、第一方面,本申请实施例提供了一种图像分类方法,所述方法包括:对图像进行特征提取,得到所述图像的特征表示;依据位置权重矩阵对所述特征表示进行编码得到全局特征,所述位置权重矩阵包括所述特征表示内所有元素的位置权重,所述位置权重依据所述特征表示中元素的坐标得到;去除所述特征表示中的冗余特征,得到局部特征;将所述全局特征和所述局部特征合并,得到分类特征;将所述分类特征输入预设的分类器中,得到预设的分类结果。
3、上述图像分类方法,结合全局特征和局部特征进行生物分类,不仅能够同时适用于传统生物分类任务以及细粒度生物分类任务,还能提升分类准确率。
4、在本申请一个可选实施例中,所述对图像进行特征提取,得到所述图像的特征表示,包括:依据第一布局将所述图像划分为多个第一子块;依据自注意力机制计算每一第一子块的表示,得到所述图像的第一表示;依据第二布局将所述第一表示划分为多个第二子块,所述第一布局、第二布局均包括多个窗口,所述第二布局中的窗口由所述第一布局中的窗口平移得到,所述窗口用于指示子块的划分方式;依据自注意力机制计算每一第二子块的表示,得到所述特征表示。
5、上述实施例中,通过两个窗口机制能够从输入数据中提取出多层次、多尺度的特征,能够从输入数据中提取全面且高质量的特征信息。
6、在本申请一个可选实施例中,所述方法还包括:使用预设的池化核分别沿着水平方向和竖直方向对所述特征表示进行编码,得到水平方向感知特征和竖直方向感知特征;将所述水平方向感知特征和所述竖直方向感知进行合并,得到合并特征;依据所述特征表示的长度和高度,将所述合并特征切分为水平张量和竖直张量;依据所述特征表示的通道数,对所述水平张量、竖直张量的通道进行降维,生成所述位置权重矩阵。
7、上述实施例通过捕捉特征图中的水平方向和竖直方向上的依赖关系生成位置权重矩阵,位置权重矩阵有效增强了特征的全局表示能力。
8、在本申请一个可选实施例中,所述去除所述特征表示中的冗余特征,得到局部特征,包括:将所述特征表示分为第一特征和第二特征,所述第一特征中的信息多于所述第二特征中的信息;将所述第一特征和所述第二特征进行交叉重建,得到细化特征;将所述细化特征中的深层特征和浅层特征合并,得到所述局部特征,所述浅层特征比所述深层特征包含更多像素点信息。
9、上述实施例中,进行特征重建,以优化特征的表达和重组并解决特征冗余问题,提升了特征的局部和全局信息整合能力。
10、在本申请一个可选实施例中,所述将所述特征表示分为第一特征和第二特征,包括:将所述特征表示分别与信息权重、非信息权重相乘,生成所述第一特征和所述第二特征,所述信息权重依据预设的第一超参数和权值分布得到,所述非信息权重依据预设的第二超参数和所述权值分布得到,所述权值分布为对所述特征表示进行特征评估得到。
11、上述实施例提供了一种提取信息丰富特征的方法,能够快速从特征表示中提取得到信息丰富特征表示和信息较少的特征表示。
12、在本申请一个可选实施例中,所述方法还包括:依据第三超参数,沿着通道方向将所述细化特征分割为上特征和下特征;使用预设的卷积核对所述上特征进行卷积,生成所述深层特征;对所述下特征进行特征融合,生成所述浅层特征。
13、上述实施例提供了一种提取深层特征的方法,能够快速、简便地从特征表示中提取得到深层特征和浅层特征。
14、在本申请一个可选实施例中,所述将所述全局特征和所述局部特征合并,得到分类特征,包括:将所述全局特征、所述局部特征及所述特征表示分别与可调系数相乘得到对应的调整特征;将所有可调特征合并得所述分类特征。
15、上述实施例中使用可调系数将全局特征、所述局部特征及所述特征表示进行合并,增强了输出特征的表示灵活性,可以更好地捕捉和表示不同层次的特征。
16、第二方面,本申请实施例提供了一种图像分类装置,所述装置包括:特征提取模块,用于对图像进行特征提取,得到所述图像的特征表示;全局特征生成模块,用于依据位置权重矩阵对所述特征表示进行编码得到全局特征,所述位置权重矩阵包括所述特征表示内所有元素的位置权重,所述位置权重依据所述特征表示中元素的坐标得到;局部特征生成模块,用于去除所述特征表示中的冗余特征,得到局部特征;合并模块,用于将所述全局特征和所述局部特征合并,得到分类特征;分类模块,用于将所述分类特征输入预设的分类器中,得到预设的分类结果。
17、第三方面,本申请实施例提供了一种电子设备,所述电子设备包括:存储器和处理器,所述处理器与所述存储器连接;所述存储器,用于存储程序;所述处理器,用于调用存储于所述存储器中的程序,以执行第一方面中任一项所述的方法。
18、第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时,执行第一方面中任一项所述的方法。
19、本申请的其他特征和优点将在随后的说明书阐述。本申请的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
技术特征:
1.一种图像分类方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对图像进行特征提取,得到所述图像的特征表示,包括:
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
4.根据权利要求1所述的方法,其特征在于,所述去除所述特征表示中的冗余特征,得到局部特征,包括:
5.根据权利要求4所述的方法,其特征在于,所述将所述特征表示分为第一特征和第二特征,包括:
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
7.根据权利要求1所述的方法,其特征在于,所述将所述全局特征和所述局部特征合并,得到分类特征,包括:
8.一种图像分类装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,包括:存储器和处理器,所述处理器与所述存储器连接;
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器运行时,执行如权利要求1-7中任一项所述的方法。
技术总结
本申请提供一种图像分类方法、装置、电子设备及存储介质,其中,所述方法包括:对图像进行特征提取,得到所述图像的特征表示;依据位置权重矩阵对所述特征表示进行编码得到全局特征,所述位置权重矩阵包括所述特征表示内所有元素的位置权重,所述位置权重依据所述特征表示中元素的坐标得到;去除所述特征表示中的冗余特征,得到局部特征;将所述全局特征和所述局部特征合并,得到分类特征;将所述分类特征输入预设的分类器中,得到预设的分类结果,结合全局特征和局部特征进行生物分类,不仅能够同时适用于传统生物分类任务以及细粒度生物分类任务,还能提升分类准确率。
技术研发人员:张永祥,李硕,郭帅格,薛方杰,施智平,邵珠宏,苏佳
受保护的技术使用者:首都师范大学
技术研发日:
技术公布日:2024/11/28
技术研发人员:张永祥,李硕,郭帅格,薛方杰,施智平,邵珠宏,苏佳
技术所有人:首都师范大学
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
