一种服务器内存故障的检测方法、装置、设备和介质与流程
技术特征:
1.一种服务器内存故障的检测方法,其特征在于,包括:
2.根据权利要求1所述的服务器内存故障的检测方法,其特征在于,周期性巡检存在硬故障的目标内存单元包括:
3.根据权利要求2所述的服务器内存故障的检测方法,其特征在于,按照设定的第二时间间隔对所述第二存储空间中记录的地址所对应的第二内存单元进行故障检测,将存在故障的第二内存单元判定为硬故障包括:
4.根据权利要求3所述的服务器内存故障的检测方法,其特征在于,还包括:
5.根据权利要求2所述的服务器内存故障的检测方法,其特征在于,在与所述目标内存单元相邻的内存单元存在硬故障的情况下,对硬故障单元所在的内存页进行脱机处理包括:
6.根据权利要求5所述的服务器内存故障的检测方法,其特征在于,在所述目标内存单元以及所述硬故障单元所在的行列区域中出现硬故障单元的个数大于或等于设定阈值的情况下,对所述行列区域对应的内存页进行脱机处理包括:
7.根据权利要求2至6任意一项所述的服务器内存故障的检测方法,其特征在于,还包括:
8.根据权利要求7所述的服务器内存故障的检测方法,其特征在于,基于所有存在硬故障的内存单元的分布情况,确定出各待测试区域包括:
9.根据权利要求8所述的服务器内存故障的检测方法,其特征在于,基于所述k阶距离、目标待测试点的k阶邻域中包含的各待测试点与所述目标待测试点之间的距离,确定出所述目标待测试点的离群值包括:
10.根据权利要求7所述的服务器内存故障的检测方法,其特征在于,依据各待测试区域对应的内存单元的个数以及存在硬故障的内存单元的个数,确定出各待测试区域各自对应的故障密度包括:
11.根据权利要求7所述的服务器内存故障的检测方法,其特征在于,对所述目标待测试区域对应的内存页进行故障处理包括:
12.根据权利要求7所述的服务器内存故障的检测方法,其特征在于,对所述目标待测试区域对应的内存页进行故障处理包括:
13.一种服务器内存故障的检测装置,其特征在于,包括巡检单元、第一脱机单元、第二脱机单元和第三脱机单元;
14.一种服务器内存故障的检测设备,其特征在于,包括:
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至12任意一项所述服务器内存故障的检测方法的步骤。
技术总结
本发明涉及计算机技术领域,公开了一种服务器内存故障的检测方法、装置、设备和介质,周期性巡检存在硬故障的目标内存单元,并对目标内存单元所在的内存页进行脱机处理。在与目标内存单元相邻的内存单元存在硬故障时,对硬故障单元所在的内存页进行脱机处理。在目标内存单元以及硬故障单元所在的行列区域中出现硬故障单元的个数大于或等于设定阈值时,对行列区域对应的内存页进行脱机处理。通过检测目标内存单元周边的内存单元,能够更早地识别出现硬故障的内存单元,显著减少了从故障发生到被检测到的延迟。通过对风险高的行列区域对应的内存页进行脱机处理,有助于防止错误扩散,并降低数据损坏的风险,提升了整体系统的稳定性和可靠性。
技术研发人员:李盛新,李道童,张炳会,贾帅帅,孙秀强,于佳明,陈衍东
受保护的技术使用者:苏州元脑智能科技有限公司
技术研发日:
技术公布日:2024/11/26
技术研发人员:李盛新,李道童,张炳会,贾帅帅,孙秀强,于佳明,陈衍东
技术所有人:苏州元脑智能科技有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
