首页  专利技术  电子电路装置的制造及其应用技术

一种基于无监督机器学习的城区和郊区范围自动识别方法

2025-06-29 14:00:07 677次浏览
一种基于无监督机器学习的城区和郊区范围自动识别方法

本发明涉及一种基于无监督机器学习的城区和郊区范围自动识别技术。


背景技术:

1、城市化梯度(urbanization gradient)理论认为随着城市化强度的变化,环境会显现空间差异,比如从自然景观过渡到高强度的城市化区域。建筑物是城市形态基本要素中最基础和最精细的构成要素,建筑物的形态属性比如密度、面积、形状和朝向等可以较好的反映土地利用和经济活动特征,因而通过识别建筑空间形态特征变化可以识别城市化强度,从而获取不同城市化程度地区的空间范围和对应边界。

2、2021年自然资源部颁布的《城区范围确定规程》(td/t1064-2021)规定了以全国国土调查数据和高精度遥感数据作为基础数据,综合考虑公共服务设施覆盖范围和居村委行政范围的城区范围划定技术标准,为后续研究奠定了良好的方法技术基础。在此基础上,尚需进一步探究能减少人工干预,能简化工作流程的自动识别不同城市化梯度空间范围的方法,尤其是城区和郊区范围。


技术实现思路

1、本发明针对现有技术的不足,提出一种采用无监督机器学习算法自动识别城区和郊区范围线的技术方法。该方法强调通过构建基于建筑形态指标体系框架和机器学习算法,自动识别大尺度空间范围的城区和郊区范围,较少人工干预,有利于快速高效形成国土空间规划及相关城市研究分析底图,为数智化空间治理提供技术支持。

2、本发明技术方案如下:

3、一种基于无监督机器学习的城区和郊区范围自动识别方法,其特征在于,包括以下步骤:

4、步骤(1):获得研究区域范围内建筑轮廓数据,总计j个空间单元,计算包括以每个空间单元j的中心为中心点,k米为半径的圆内相交的建筑面积总和建筑周长平均值建筑朝向角度熵值建筑形状指数平均值建筑紧凑度指数平均值和建筑数量6个建筑形态特征构成多维矩阵xj;

5、步骤(2):对步骤(1)得到的所有空间单元的建筑形态特征多维矩阵xj进行高斯混合模型(gmm)聚类分析;

6、步骤(3):根据步骤(2)计算得到的混合系数均值向量和协方差矩阵∑mcluster,计算对应的贝叶斯信息准则

7、步骤(4):根据步骤(3)计算得到的聚类数量mcluster对应的通过比较得到最小bic值对应的聚类数量作为最优聚类数量mopt;

8、步骤(5):根据步骤(4)得到的最优聚类数量mopt,得到高斯混合模型的概率密度函数p(xj);

9、步骤(6):根据步骤(5)计算的聚类概率p(xj),将每个空间单元j分类为概率最高的类型mopt*;

10、步骤(7):根据步骤(6)得到的每个空间单元j的聚类结果汇总统计所有空间单元的建筑面积总和以及类型中的的平均值进行由大到小排序,得到顺序i,计算排序后相邻数据和的变化率△di;

11、步骤(8):根据步骤(7)得到的变化率△di,对△di进行从小到大的排序,得到最大的2个△di对应的聚类类型,分别作为城区和郊区的范围。

12、一种基于无监督机器学习的城区和郊区范围自动识别方法,包括以下步骤:

13、步骤(1):获得研究区域范围内建筑轮廓数据,总计j个空间单元,计算包括以每个空间单元j的中心为中心点,k米为半径的圆内相交的建筑面积总和建筑周长平均值建筑朝向角度熵值建筑形状指数平均值建筑紧凑度指数平均值和建筑数量6个建筑形态特征构成多维矩阵xj,具体公式如下:

14、

15、公式1中为空间单元j的建筑面积总和,为圆内第jbuilding栋建筑的面积。

16、

17、公式2中为空间单元j的建筑周长平均值,为圆内第jbuilding栋建筑的周长。

18、

19、公式3中为空间单元j的建筑朝向角度熵值,pk为建筑朝向角度k的概率分布。

20、

21、公式4中为空间单元j的建筑形状指数平均值,为包含建筑jbuilding轮廓多边形的最小外接圆面积。

22、

23、公式5中为年空间单元j的建筑紧凑度指数平均值,为建筑jbuilding轮廓多边形的最小外接圆内建筑jbuilding的周长。

24、

25、公式6中xj为每个空间单元j的包含6个建筑形态特征多维矩阵。

26、步骤(2):对步骤(1)得到的所有空间单元的建筑形态特征多维矩阵xj进行高斯混合模型(gmm)聚类分析,聚类数量mcluster取值为1,2,……,m,获得不同聚类数量取值对应的混合系数均值向量和协方差矩阵∑mcluster,公式如下:

27、

28、公式7中为空间单元j属于mcluster类的后验概率,是以为均值,∑mcluster为协方差矩阵的多变量正态分布。

29、

30、公式8中是第mcluster个聚类的混合系数,满足且为指示变量,如果空间单元j属于mcluster类则为1,否则为0。

31、

32、公式9中为均值向量。

33、

34、公式10中∑mcluster为每个聚类的协方差矩阵,为向量和其转置的乘积得到的协方巧矩阵。

35、步骤(3):根据步骤(2)计算得到的混合系数均值向量和协方差矩阵∑mcluster,计算对应的贝叶斯信息准则公式如下:

36、

37、公式11中为聚类数为mcluster时对应的最大似然值。

38、

39、公式12中,为聚类数为mcluster时对应的贝叶斯信息准则(bic)。

40、步骤(4):根据步骤(3)计算得到的聚类数量mcluster对应的通过比较得到最小bic值对应的聚类数量作为最优聚类数量mopt,公式如下:

41、

42、公式13中,mopt为最优聚类数量,为获取最小值算法。

43、步骤(5):根据步骤(4)得到的最优聚类数量mopt,分别计算mopt=1,2,3,……,mopt对应的高斯混合模型的聚类概率密度函数,得到高斯混合模型的概率密度函数p(xj),公式如下:

44、

45、公式14中p(xj)为聚类数为mopt时高斯混合模型的概率密度函数。

46、步骤(6):根据步骤(5)计算的聚类概率p(xj),将每个空间单元j分类为概率最高的类型mopt*。公式如下:

47、

48、

49、公式15中p(mopt|xj)为mopt=1,2,3,……,mopt对应的概率密度,是以为均值,∑mopt,mopt为协方差矩阵的多变量正态分布。

50、步骤(7):根据步骤(6)得到的每个空间单元j的聚类结果分别汇总统计不同mopt*=1,2,3,……,mopt类型中所有空间单元的建筑面积总和得到分别对1,2,3,……,mopt类型中的的平均值进行由大到小排序,得到顺序i,计算排序后相邻数据和的变化率△di。公式如下:

51、

52、步骤(8):根据步骤(7)得到的变化率△di,对△di进行从小到大的排序,得到最大的2个△di对应的聚类类型,分别作为城区和郊区的范围。公式如下:

53、imax1=max{argmaxi(△di)}#公式18

54、

55、公式18中imax1为△di最大值对应的i值,即城区范围。公式19中imax2为为△di第二大值对应的i值,即郊区区范围。

56、本发明结合了高精度遥感数据和无监督机器学习技术,通过自动计算建筑物的形态空间特征,精细化识别不同城市化程度的地区范围,为城市规划和管理提供了有力的工具。具体的有益效果是:

57、(1)通过采用无监督机器学习算法,减少人工干预,简化工作流程,实现城区和郊区范围自动识别;

58、(2)通过聚类分析算法,可以精细化识别不同城市化梯度地区的空间范围,包括但不限于中心城区、老城区、近郊区、远郊区和乡村等,技术方法可拓展性强。

59、(3)本发明方法具有高度的可重复性和高效率,能够快速处理大规模数据,实现高效的城区和郊区范围识别。为国土空间规划背景下构建“国土空间规划一张图”提供底图参考和技术支持。

文档序号 : 【 40050814 】

技术研发人员:肖扬,苗丝雨
技术所有人:同济大学

备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
肖扬苗丝雨同济大学
一种液驱氢气压缩机的运行监测系统及方法与流程 一种钼掺杂氧化镍固溶体晶体与非晶体共存材料的制备方法及应用
相关内容