Exploring the relationship between density and completeness of urban building data in OpenStreetMap for quality estimation
OpenStreetMap城市建筑数据密度与完整性的关系探讨及质量估计
成果信息
Zhou, Q., 2018, Exploring the relationship between density and completeness of urban building data in OpenStreetMap for quality estimation, International Journal of Geographical Information Science, 32(2), 257–281.
该研究由国家自然科学基金面上项目(41771428)、中央高校基本科研业务费专项资金项目(G1323541711)和城市空间信息工程北京市重点实验室经费资助项目(2017213)联合资助。
作者简介
周琪,博士,中国地质大学(武汉)我院副教授。本科、硕士毕业于武汉大学;博士毕业于香港理工大学。曾在《International Journal of Geographical Information Science》,《Transactions in GIS》,《Cartography and Geographic Information Science》和《The Cartographic Journal》等多个国际学术期刊发表论文;主持国家自然科学基金2项。主要从事地图多尺度表达、众源地理数据质量分析及应用相关的理论研究。
个人学术主页:https://www.researchgate.net/profile/ZHOU_QI
联系方式:sevenlaand@hotmail.com
研究背景
OpenStreetMap(OSM)是一种由公众自发地提供诸如道路、铁路、居民地、河流和土地利用等众源地理数据的平台。凭借数据更新快、获取免费和数覆盖全球等优势,OSM数据在诸如地图导航、土地利用调查、人口普查、城市扩张监测、城市三维建模和应急救灾等社会科学领域展现出良好的发展前景,是近年来地理信息科学领域新的研究热点。
然而,OSM数据一般由缺乏足够地理信息知识和专业训练的非专业人员提供,存在数据质量问题。通过对比参考数据评价OSM数据质量是现有研究的主流方法。但是,参考数据存在费用较高、使用限制和比例尺不合适等因素,可能无法获取或无法使用。因此,当参考数据未知时,如何定量地估计OSM数据质量仍是当前的研究难点。
研究方法
提出一种定量估计OSM建筑数据完整性的代理指标——建筑密度,并定量地探讨了城市地区OSM建筑数据密度与完整性的关系。步骤如下:
(1) 利用1×1公里的规则格网将城市地区划分成不同的地理单元;
(2) 分别计算各个地理单元内OSM建筑数据的密度和完整性(公式详见原文);
(3) 基于地理单元分析OSM建筑数据的密度与完整性之间的关系;
(4) 利用上述关系计算各个地理单位的残差,并评估该指标(建筑密度)的有效性。
实验结果与结论
(1) OSM建筑数据密度与完整性之间近似线性相关(图1),斜率介于3.4-4之间;
图 1 OSM建筑数据密度与完整性的线性关系
(2) 约70-80%的残差绝对值小于10%;约80%-90%的残差绝对值小于20%,说明OSM建筑数据完整性的估计值与实际值相似(图2和图3);
图 2 残差统计分布
图 3 残差空间分布(实验区域:San Jose City)
(3)实验不同大小的地理单元(如0.5×0.5和2×2平方公里)后发现:地理单位不易设置过小(如小于0.3或0.4平方公里),否则,估计结果的残差可能变大(图4)。
图 4 不同格网大小的残差统计
上述实验结果表明:建筑密度是定量估计OSM城市建筑数据完整性的潜在代理指标。但是,它仍需要辅助其它指标来定量估计农村地区OSM建筑数据的完整性。