一种船舶数据采样方法与流程

本发明涉及数据处理,尤其涉及一种船舶数据采样方法。
背景技术:
1、在船舶生产设计过程中往往需要大量的船舶相关特征数据来训练模型以预测船舶的稳性,包括船长、船宽、吃水、初始纵倾、初稳性高、水线长、横摇周期、重心高度、方形系数、舭龙骨面积、进水角、风压力矩、测投影面积、测投影面心高度和排水量等。
2、但是在船舶实际生产设计中,由于船型特征数据获取渠道少,获取难度大,因此需要根据已有的船舶特征数据进行补充采集。
3、现有的补充采集方法往往采用演化采样算法(es算法),但是目前的演化采样算法难以应对复杂的多维度概率密度函数和变量范围差异问题带来的采样精度要求,具体如下:
4、(1)随着概率密度函数的复杂性增加,不仅涉及多维变量,还往往包含非线性、多峰等特性,这使得采样过程变得异常困难。同时,随着船舶采样领域对样本质量要求的不断提高,尤其是在机器学习、统计推断等应用中,对于样本的代表性、多样性的要求愈发严格,现有演化采样算法的采样精度已经难以满足要求;
5、(2)船舶数据不同变量的采样范围存在较大差异,例如对于某一艘具体的船型,可能只需要采样某一小范围内的型深,而对于吃水则需要采集一个较大范围的数据,但现有的演化采样算法对所有分量统一使用相同的转移密度函数进行样本的补充采集,难以应对变量分布范围不等的情况,因此也会导致采样精度下降。
6、该算法的上述缺陷使得在实际中能够获得的有效的船型特征数据仍然是十分局限的,从而进一步导致船舶稳性预测不够精确。
7、综上,如何提供一种船舶数据采样方法能够高效扩充用于预测船舶稳性的有效样本的数量成为本领域技术人员亟待解决的技术问题。
技术实现思路
1、本发明提供了一种船舶数据采样方法,解决相关技术中存在的难以获得大量有效船型特征数据,使得船舶稳性预测精度不高等问题。
2、作为本发明的第一个方面,提供一种船舶数据采样方法,包括:
3、获取用于预测船舶稳性的船舶数据父样本,船舶数据父样本包括若干父样本特征分量,每一父样本特征分量对应一船舶稳性特征;
4、对每一父样本特征分量进行数据扩增处理,获得与每一父样本特征分量对应的至少一个候选样本特征分量;
5、根据每一父样本特征分量对应的至少一个候选样本特征分量获得船舶数据父样本的至少一个候选样本;
6、对每一候选样本进行拒绝采样操作,获得船舶数据父样本的至少一个待选结果样本,船舶数据父样本的待选结果样本的数量、船舶数据父样本的候选样本的数量和每一父样本特征分量对应的候选样本特征分量的数量均相等;
7、若待选结果样本的数量为1,确定待选结果样本为船舶数据父样本的子样本;
8、若待选结果样本的数量至少为2,根据每一待选结果样本的离散程度在至少两个待选结果样本中确定一个为船舶数据父样本的子样本;
9、根据子样本更新船舶数据父样本,重复执行上述步骤直至满足预设迭代次数,获得最终样本。
10、进一步地,对每一父样本特征分量进行数据扩增处理,获得与每一父样本特征分量对应的至少一个候选样本特征分量,包括:
11、根据至少两个不同的提议分布生成与每一父样本特征分量对应的至少两个待选特征分量;
12、根据至少一个权重函数和每一父样本特征分量对应的至少两个待选特征分量,获得与每一父样本特征分量对应的至少一个候选样本特征分量;
13、其中,每一父样本特征分量对应的候选样本特征分量的数量等于权重函数的数量。
14、进一步地,根据至少一个权重函数和每一父样本特征分量对应的至少两个待选特征分量,获得与每一父样本特征分量对应的至少一个候选样本特征分量,包括:
15、根据至少两个不同的权重函数依次在每一父样本特征分量对应的至少两个待选特征分量中进行选择,获得与每一父样本特征分量对应的至少两个临时特征分量,其中,每一父样本特征分量对应的临时特征分量的数量等于权重函数的数量;
16、分别对每一临时特征分量进行拒绝采样操作,获得与每一父样本特征分量对应的至少两个候选样本特征分量。
17、进一步地,根据至少两个不同的权重函数依次在每一父样本特征分量对应的至少两个待选特征分量中进行选择,获得与每一父样本特征分量对应的至少两个临时特征分量,包括:
18、根据权重函数的权重参数调节结果,获得至少两个不同的权重函数,权重参数表示控制权重函数的偏重;
19、分别计算每一父样本特征分量对应的各待选特征分量在每一权重函数下的权重值;
20、对于每一父样本特征分量,选取同一权重函数计算出的对应的待选特征分量为一组,根据每组权重值的比例通过随机选择方法从对应的待选特征分量中选出该父样本特征分量的一个临时特征分量;
21、遍历每一父样本特征分量对应的每一待选特征分量后,获得与每一父样本特征分量对应的至少两个临时特征分量。
22、进一步地,至少两个不同的权重函数包括:权重参数为0的权重函数和权重参数为2.5的权重函数。
23、进一步地,分别对每一临时特征分量进行拒绝采样操作,获得与每一父样本特征分量对应的至少两个候选样本特征分量,包括:
24、分别计算每一临时特征分量的接受率;
25、依次生成随机数,若生成的随机数小于对应的临时特征分量的接受率,则接受该临时特征分量为对应的父样本特征分量的候选样本特征分量;
26、若生成的随机数大于或等于对应的临时特征分量的接受率,则拒绝接受临时特征分量为对应的父样本特征分量的候选样本特征分量,确定该父样本特征分量为候选样本特征分量;
27、遍历每一父样本特征分量对应的每一临时特征分量后,获得与每一父样本特征分量对应的至少两个候选样本特征分量。
28、进一步地,根据每一父样本特征分量对应的至少一个候选样本特征分量获得船舶数据父样本的至少一个候选样本,包括:
29、根据每一父样本特征分量的基于同一权重函数选择出的候选样本特征分量形成船舶数据父样本的候选样本;
30、遍历每一父样本特征分量对应的每一候选样本特征分量后获得船舶数据父样本的至少两个候选样本。
31、进一步地,对每一候选样本进行拒绝采样操作,获得船舶数据父样本的至少一个待选结果样本,包括:
32、分别计算每个候选样本的接受率;
33、依次生成随机数,若生成的随机数小于对应的候选样本的接受率,则接受该候选样本为船舶数据父样本的待选结果样本;
34、若生成的随机数大于或等于对应的候选样本的接受率,则拒绝接受该候选样本为船舶数据父样本的待选结果样本,确定该船舶数据父样本为待选结果样本;
35、遍历船舶数据父样本的每一候选样本后,获得船舶数据父样本的至少一个待选结果样本。
36、进一步地,分别计算每个候选样本的接受率,包括:
37、根据amise最小化带宽计算方法和kendall相关系数计算多元核密度估计函数的目标带宽矩阵;
38、根据目标带宽矩阵计算每个候选样本的接受率。
39、进一步地,若待选结果样本的数量至少为2,根据每一待选结果样本的离散程度在至少两个待选结果样本中确定一个为船舶数据父样本的子样本,包括:
40、若待选结果样本的数量至少为2,分别计算每组待选结果样本的标准偏差值;
41、确定标准偏差值最小的待选结果样本为船舶数据父样本的子样本。
42、本发明通过对船舶数据父样本的每一父样本特征分量进行独立更新,相比于对整个样本整体进行更新,不仅能够增加样本的多样性,还能有效应对船舶数据不同分量的采样范围存在较大差异导致的采样精度下降的问题,获得的最终样本有效扩增了可靠的船舶数据量用于船舶稳性预测,进而提高船舶稳性预测的精度。
技术研发人员:孙俊,汤敏,李丽玮,李超
技术所有人:匀熵智能科技(无锡)有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
