首页  专利技术  电子电路装置的制造及其应用技术

一种基于知识图谱的结构化数据分类方法及装置与流程

2025-05-26 11:00:06 463次浏览

技术特征:

1.一种基于知识图谱的结构化数据分类方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述主题词类别包括单主题、多主题和无主题。

3.根据权利要求2所述的方法,其特征在于,所述根据所述主题词类别确定分类模型包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述主题词类别确定分类模型之前,所述方法还包括:

5.根据权利要求3所述的方法,其特征在于,所述将所述知识图谱和lda模型对所述第一数据集进行数据扩充,得到第三数据集包括:

6.根据权利要求2至5中任一项所述的方法,其特征在于,若所述主题词类别表征为多主题,所述将所述第一分词结果输入所述分类模型,得到分类结果包括:

7.根据权利要求6所述的方法,其特征在于,所述利用随机切片哈希分类器对所述融合向量处理,得到第一分类结果包括:

8.一种基于知识图谱的结构化数据分类装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,所述计算机可读存储介质上保存有程序,所述程序在计算机上执行时,使得所述计算机执行如权利要求1至7中任一项所述的方法。


技术总结
本申请实施例公开了一种基于知识图谱的结构化数据分类方法及装置,可以提高对公共领域构化库表数据的分类准确性。本申请实施例方法包括:获取公共领域核心词汇库;利用分词模型对所述公共领域核心词汇库进行实体信息抽取,得到多个实体和所述多个实体之间的关系信息;根据所述多个实体和所述关系信息构建知识图谱;将待分类数据输入所述分词模型,得到第一分词结果,所述待分类数据为结构化数据库表中的数据;将所述第一分词结果输入所述知识图谱,得到主题词类别;根据所述主题词类别确定分类模型;将所述第一分词结果输入所述分类模型,得到分类结果。

技术研发人员:邹佳,丁洪鑫,朱文天,王胜漪,曹扬,李芳,邵勇波
受保护的技术使用者:中电科大数据研究院有限公司
技术研发日:
技术公布日:2024/11/18
文档序号 : 【 40051942 】

技术研发人员:邹佳,丁洪鑫,朱文天,王胜漪,曹扬,李芳,邵勇波
技术所有人:中电科大数据研究院有限公司

备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
邹佳丁洪鑫朱文天王胜漪曹扬李芳邵勇波中电科大数据研究院有限公司
多面工作灯及其磁阀控制系统和控制方法与流程 内容页面与原生控制器的交互方法、装置、设备及介质与流程
相关内容