一种面向公共资源交易数据的自动分类方法及系统与流程
技术特征:
1.一种面向公共资源交易数据的自动分类方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述预处理后的结构化数据包括预处理后的数值类型结构化数据和预处理后的非数值类型结构化数据;所述对多个所述第一结构化数据进行预处理,得到多个预处理后的结构化数据,具体包括:
3.根据权利要求1所述的方法,其特征在于,所述第一非结构化数据包括文本类型数据、图像类型数据、文档类型数据、音频类型数据以及视频类型数据;所述预处理后的非结构化数据包括预处理后的文本数据和预处理后的图像数据;所述对多个所述第一非结构化数据进行预处理,得到多个预处理后的非结构化数据,具体包括:
4.根据权利要求1所述的方法,其特征在于,所述从多个所述第一特征和多个所述第二特征中提取关联特征,具体包括:
5.根据权利要求4所述的方法,其特征在于,所述第一特征包括数值类型特征和非数值类型特征;所述第二特征包括文档类型特征以及图片类型特征;所述第一特征向量包括数值特征向量和非数值特征向量;所述第二特征向量包括文本特征向量和图像特征向量;所述对多个所述第一特征进行向量化处理,得到多个第一特征向量,并对多个所述第二特征进行向量化处理,得到多个第二特征向量,具体包括:
6.根据权利要求4所述的方法,其特征在于,所述基于所述特征相关性矩阵和所述特征互信息矩阵对所述第二综合特征向量进行筛选,得到多个关联特征,具体包括:
7.根据权利要求1所述的方法,其特征在于,所述分类结果包括第一分类集合、第二分类集合以及第三分类集合;所述对多个所述第三特征、多个所述第四特征以及多个所述关联特征进行分类,得到多个分类结果,具体包括:
8.一种面向公共资源交易数据的自动分类系统,其特征在于,所述系统包括:数据采集模块和处理模块;
9.一种电子设备,其特征在于,包括处理器(401)、存储器(405)、用户接口(403)及网络接口(404),所述存储器(405)用于存储指令,所述用户接口(403)和网络接口(404)用于给其它设备通信,所述处理器(401)用于执行所述存储器(405)中存储的指令,以使所述电子设备(400)执行如权利要求1-7任意一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有指令,当所述指令被执行时,执行如权利要求1-7任意一项所述的方法。
技术总结
本发明公开了一种面向公共资源交易数据的自动分类方法及系统,涉及数据处理技术领域。在该方法中,采集公共资源交易数据包括第一结构化数据和第一非结构化数据;对多个第一结构化数据和第一非结构化数据进行预处理,得到多个预处理后的结构化数据和多个预处理后的非结构化数据;从每个预处理后的结构化数据中提取第一特征,并从每个预处理后的非结构化数据中提取第二特征;从多个第一特征和多个第二特征中提取关联特征;从多个第一特征和多个第二特征去除关联特征,得到多个第三特征和多个第四特征;对多个第三特征、多个第四特征以及多个关联特征进行分类,得到多个分类结果。实施本申请的技术方案,可以提升数据分类的准确性。
技术研发人员:韩永琦,樊旭琦,童禹臻
受保护的技术使用者:山西金蝉电子商务有限公司
技术研发日:
技术公布日:2024/11/28
技术研发人员:韩永琦,樊旭琦,童禹臻
技术所有人:山西金蝉电子商务有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
