一种用于区域健康大数据的分水岭聚类方法
技术特征:
1.一种用于区域健康大数据的分水岭聚类方法,其特征在于,包括:
2.根据权利要求1所述的用于区域健康大数据的分水岭聚类方法,其特征在于,构建混合k近邻图的过程包括:
3.根据权利要求2所述的用于区域健康大数据的分水岭聚类方法,其特征在于,数据点的海拔计算公式为:
4.根据权利要求3所述的用于区域健康大数据的分水岭聚类方法,其特征在于,数据点的粗糙化因子计算公式为:
5.根据权利要求4所述的用于区域健康大数据的分水岭聚类方法,其特征在于,数据点的边界因子计算公式为:
6.根据权利要求5所述的用于区域健康大数据的分水岭聚类方法,其特征在于,数据点的角度因子计算公式为:
7.根据权利要求2所述的用于区域健康大数据的分水岭聚类方法,其特征在于,发现集水盆集和集水盆连接集的过程包括:
8.根据权利要求7所述的用于区域健康大数据的分水岭聚类方法,其特征在于,利用集水盆级相似性合并集水盆的过程包括:
9.根据权利要求8所述的用于区域健康大数据的分水岭聚类方法,其特征在于,所述稳定因子的计算公式为:
10.根据权利要求8所述的用于区域健康大数据的分水岭聚类方法,其特征在于,利用近邻信息和边界点聚合未被聚类的数据点到集水盆的过程包括:
技术总结
本发明公开了一种用于区域健康大数据的分水岭聚类方法,属于大数据处理与模式识别领域,该方法包括以下步骤:基于输入的数据集构建混合k近邻图,混合k近邻图包括边权重集和顶点属性集,基于顶点属性集的粗糙因子和边界因子分别识别核心点和边界点;基于核心点与核心点的近邻成员的海拔和近邻信息发现集水盆集和集水盆连接集;基于稳定因子从集水盆连接集中识别有效集水盆连接,利用集水盆级相似性合并集水盆得到合并后的集水盆;利用近邻信息和边界点聚合未被聚类的数据点到集水盆,得到最终的数据聚类。本发明克服了现有分水岭聚类方法和传统密度聚类方法未能处理多种复杂结构的局限性,提高了聚类的性能和质量。
技术研发人员:夏建华,石元泉,屈太国,张乐冰,邓小武
受保护的技术使用者:怀化学院
技术研发日:
技术公布日:2024/11/14
文档序号 :
【 39999421 】
技术研发人员:夏建华,石元泉,屈太国,张乐冰,邓小武
技术所有人:怀化学院
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
技术研发人员:夏建华,石元泉,屈太国,张乐冰,邓小武
技术所有人:怀化学院
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除