首页  专利技术  电子电路装置的制造及其应用技术

电子元件几何尺寸数据提取方法、装置、设备及存储介质

2026-05-05 15:40:07 491次浏览
本技术涉及电子设计自动化、模式识别和计算机辅助设计的交叉,尤其涉及一种电子元件几何尺寸数据提取方法、装置、设备及存储介质。
背景技术
::1、电子元件数据手册通常以pdf(portable document format)格式存储,pdf格式文档是adobe公司创建的一种主要用于电子出版物的非结构化文件格式。由于pdf文档具有良好的显示效果、跨平台特性、文档独立性、安全性,所以现代电子元器件的数据手册都是以pdf格式来存储和传播的。pdf格式的数据手册中,呈现的文字信息,并不一定都是文字格式的,也有可能是图片格式的,还有很多数据手册本身带有水印保护,因此从pdf文档中提取文本数据本身就是一个比较棘手的问题。2、从电子元件pdf格式数据手册中提取元件几何尺寸数据的方法,其难度主要由以下几个方面:3、第一,格式多样性:不同厂商的pdf数据手册格式各异,排版和数据表示方式没有统一标准,这使得自动化提取变得复杂。4、第二,数据嵌入方式:有些几何尺寸数据以图片、表格或文本形式嵌入pdf,且这些形式之间的转换和解析各有难度。5、第三,图像处理难度:如果几何尺寸数据以图像形式存在,需要进行光学字符识别(ocr)或图像分析,这对图像质量和解析算法提出了很高的要求。6、第四,文本解析复杂性:即使是文本形式的几何尺寸数据,也可能因为格式不统一、单位混杂、排版不规则等原因,增加了解析难度。7、第五,复杂排版:pdf格式的复杂排版和多样的字体、符号、单位等,增加了解析和提取的复杂性。8、第六,信息混杂:数据手册中包含大量与几何尺寸无关的信息,自动化工具需要能够准确识别和过滤无关内容,提取所需尺寸数据。9、上述因素使得从电子元件pdf数据手册中提取几何尺寸数据成为一个复杂而具有挑战性的任务。10、已有技术是从pdf文档中提取文本或表格数据。例如:11、发明专利cn101782896a:结合ocr技术的pdf文字提取方法,有效提高了pdf文字提取的准确性,解决了部分pdf文件字符内容无法提取的问题。12、发明专利cn108038093b:提供了pdf文字提取的正确率,并且不需要将所有pdf文件进行ocr识别,节约了pdf文字提取的时间。13、发明专利cn109635268b:公开了一种pdf文件中表格信息的提取方法,能够提取跨页表格,实现了更精确、还原率更好的完整表格提取。14、已有技术存在的缺陷或问题如下:15、无法区分尺寸信息:已有技术无法区分尺寸信息和其他文本信息,这意味着需要手动识别和提取尺寸信息,非常耗时和效率低下。有些电子元件数据手册中的尺寸信息可能采用特殊格式,如带符号的尺寸和表格,这些尺寸信息对于已有技术来难以正确解析。16、无法关联描述尺寸文本和图形:已有技术主要关注文本或表格数据的文本提取,但对于电子元件数据手册中描述封装或几何外形的图形及其关联尺寸信息无能为力。技术实现思路1、本技术提供一种电子元件几何尺寸数据提取方法、装置、设备及存储介质,用以解决在电子元件几何尺寸数据提取中无法自动区分尺寸信息和其他文本信息的问题。2、第一方面,本技术提供一种电子元件几何尺寸数据提取方法,包括:3、获取电子元件的pdf格式数据手册;4、基于从所述pdf格式数据手册中提取的尺寸特征对所述电子元件的尺寸视图进行定位;5、基于尺寸视图的定位数据,从所述pdf格式数据手册中提取出尺寸视图页面数据,根据所述尺寸视图页面数据获取矢量图形,根据尺寸特征中的尺寸数据对所述矢量图形进行缩放处理,得到全比例的尺寸图形数据,基于所述全比例的尺寸图形数据,识别出特征元素,所述特征元素包括主体部分图形、引脚部分图形和标记中的至少一种,基于所述主体部分图形,提取主体的尺寸数据和图形图像;基于所述引脚部分图形,提取引脚的数量,以每个引脚和主体部分图像相连的中心点的分布矩阵作为引脚分布矩阵,利用所述引脚分布矩阵确定引脚的尺寸数据和图形数据,根据主体和引脚的尺寸数据及图形数据,计算出边界框的尺寸数据,基于所述标记,确定标记的图像数据和坐标/尺寸;6、将所述主体的尺寸数据及图形数据、引脚的尺寸数据和图形数据、标记的图像数据和坐标/尺寸以及边界框的尺寸数据存储于设定数据结构中,得到结构化数据。7、在一种可能的设计中,获取电子元件的pdf格式数据手册,包括:8、响应于输入的数据:9、在所述数据的格式为pdf格式文档的情况下,提取文本并通过关键词搜索的方式获取电子元件的元信息,以输入的数据作为电子元件的pdf格式数据手册;10、在所述数据的格式是字符串的情况下,根据所述字符串确定链接地址,基于所述链接地址获取链接页面,从所述链接页面获取电子元件的pdf格式数据手册及元信息,在所述链接页面存在电子元件的预览图像的情况下,获取所述电子元件的预览图像;11、根据所述字符串确定链接地址,包括:12、基于正则表达式匹配判断所述字符串是否为链接地址,在所述字符串不为链接地址的情况下,在所述字符串上增加设定关键词得到搜索语义特征,基于所述搜索语义特征,通过搜素引擎查找,以确定电子元件的链接地址。13、在一种可能的设计中,所述设定数据结构由多个第一元素组成,所述第一元素包括主体、引脚、边界框、标记和元信息,所提取的主体的尺寸数据及图形数据、引脚的尺寸数据和图形数据、标记的图像数据和坐标/尺寸、边界框的尺寸数据以及电子元件的厂家型号、封装或链接信息分别作为主体、引脚、边界框、标记和元信息的二级元素存储于所述设定数据结构中,以得到结构化数据。14、在一种可能的设计中,基于从所述pdf格式数据手册中提取的尺寸特征对所述电子元件的尺寸视图进行定位,包括:15、在获取到至少三个尺寸特征的情况下,根据所述至少三个尺寸特征以确定尺寸视图的定位数据;16、在获取到的尺寸特征小于三个的情况下,从所述pdf格式数据手册中提取文本数据,基于所述文本数据,通过搜索关键字的方式确定尺寸视图的定位数据;17、在未确定尺寸视图的定位数据的情况下,基于电子元件的元信息,提取电子元件类型和封装特征,根据所述电子元件类型和封装特征从内置数据库中提取结果数据。18、在一种可能的设计中,在基于从所述pdf格式数据手册中提取的尺寸特征对所述电子元件的尺寸视图进行定位之后,所述方法还包括;19、在所述尺寸特征的尺寸数据包含字母和/或图表的情况下,将所述尺寸特征对应的尺寸视图标记为第一样式;20、在所述尺寸特征的尺寸数据不包含字母和/或图表的情况下,将所述尺寸特征对应的尺寸视图标记为第二样式;21、基于标记为第一样式的尺寸视图,所确定的主体的尺寸数据及图形数据、引脚的尺寸数据和图形数据、标记的图像数据和坐标/尺寸以及边界框的尺寸数据与图表字符尺寸匹配后存储于设定数据结构中;22、基于标记为第二样式的尺寸视图,所确定的主体的尺寸数据及图形数据、引脚的尺寸数据和图形数据、标记的图像数据和坐标/尺寸以及边界框的尺寸数据直接存储于设定数据结构中。23、在一种可能的设计中,所述引脚分布矩阵表示为;24、25、其中xi,yi,zi,θi分别指第i个引脚以元器件主体中心为坐标原点时,引脚与主体相接触的截面中心点坐标和引脚的旋转角度,其中i∈[1,n]为正整数,n表示引脚的个数。26、第二方面,本技术提供一种电子元件几何尺寸数据提取装置,包括:27、数据获取模块,被配置为获取电子元件的pdf格式数据手册;28、视图定位模块,被配置为基于从所述pdf格式数据手册中提取的尺寸特征对所述电子元件的尺寸视图进行定位;29、数据提取模块,被配置为基于尺寸视图的定位数据,从所述pdf格式数据手册中提取出尺寸视图页面数据,根据所述尺寸视图页面数据获取矢量图形,根据尺寸特征中的尺寸数据对所述矢量图形进行缩放处理,得到全比例的尺寸图形数据,基于所述全比例的尺寸图形数据,识别出特征元素,所述特征元素包括主体部分图形、引脚部分图形和标记中的至少一种,基于所述主体部分图形,提取主体的尺寸数据和图形图像;基于所述引脚部分图形,提取引脚的数量,以每个引脚和主体部分图像相连的中心点的分布矩阵作为引脚分布矩阵,利用所述引脚分布矩阵确定引脚的尺寸数据和图形数据,根据主体和引脚的尺寸数据及图形数据,计算出边界框的尺寸数据,基于所述标记,确定标记的图像数据和坐标/尺寸;30、数据存储模块,被配置为将所述主体的尺寸数据及图形数据、引脚的尺寸数据和图形数据、标记的图像数据和坐标/尺寸以及边界框的尺寸数据存储于设定数据结构中,得到结构化数据。31、第三方面,本技术实施例提供一种电子设备,包括:至少一个处理器和存储器;所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的设计所述的电子元件几何尺寸数据提取方法。32、第四方面,本技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的电子元件几何尺寸数据提取方法。33、第五方面,本技术实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时,实现如上第一方面以及第一方面各种可能的设计所述的电子元件几何尺寸数据提取方法。34、本技术提供的电子元件几何尺寸数据提取方法、装置、设备及存储介质,针对电子设计领域,专门从电子元件pdf格式数据手册中自动提取尺寸数据信息,为电子元件的三维模型自动化创建、计算机辅助的电子设计自动化或虚拟现实技术等应用领域提供了有益的技术支撑。本技术只针对性地解析处理pdf格式数据手册中尺寸数据相关内容,通过快速定位和局部解析,处理速度更快、更高效,同时根据电子元件的电子特性,提出了一种用于存储电子元件尺寸数据的数据结构,用于关联尺寸数据和矢量图形,包含主体(body)、引脚(pins)、边界框(bounding box)、标记(marking)、元信息(meta information)等一级元素。所提取的尺寸数据作为二级元素储存在主体、引脚和边界框中,这种结构化数据有利于后续的程序进行自动化操作。当前第1页12当前第1页12
文档序号 : 【 40164247 】

技术研发人员:伍俊,魏兴战,史浩飞
技术所有人:中国科学院重庆绿色智能技术研究院

备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
伍俊魏兴战史浩飞中国科学院重庆绿色智能技术研究院
滩涂光伏电站参光互补运维管理方法、装置、设备及介质与流程 一种基于大数据的计算机图像检测方法
相关内容