我院海外学子叶翔谈可变面元问题的影响与敏感性
2019年1月20日下午,应学院邀请,我院2012届地理信息系统专业毕业生,现纽约州立大学布法罗分校(UB)地理系叶翔博士在320会议室为师生做了主题为“试论可变面元问题的影响与敏感性”的空间统计方向的学术报告。报告由地信系主任任福教授主持。
叶博士的报告内容分为五个部分。首先以美国选举为例,阐述了可变面元问题的本质。在地理学领域中,在对社会、经济、健康等类型的数据进行空间分析时,常常需要根据实际情况将数据聚合为特定的面积单元,当将基于点测量的空间现象的点数据聚合(扩散)为区域数据时,就会出现MAUP问题(Modifiable Areal Unit Problem),即统计值的结果受空间分区的影响。分区的面积单元是可变的或可修改的,这种因聚合的空间单元的变化所导致的统计结果的差异即MAUP。由MAUP造成的统计结果和空间分析结果的偏差常以尺度效应(Scale effect)和分区效应(Zoning effect)来描述。
其次,叶博士深入浅出的解释了引起MAUP问题的具体原因,即从小单元到大尺度的空间聚合过程中,数据属性值的聚合以及空间划分的不同共同导致了信息缺失现象,从而引起MAUP问题。叶博士表示,分区效应描述了同一尺度下由于数据组合不同所造成的相关统计结果的差异性,即区划方案所导致的结果偏差。因此,MAUP是造成假设检验结果出现统计偏差的原因之一,但究竟其对模型中各统计特征值有何影响,一直是一个尚待定量化描述的问题。
第三,叶博士以多类线性回归模型为例,说明了聚合值的敏感性变化效应。具体来说,在一元线性回归中,显著性检验及方差非常稳定,聚合值基本不受MAUP效应的影响。二元线性回归中,随机变量与双自变量的相关系数、皮尔逊系数及方差等统计量明显受到数据聚合程度的影响而呈波动态势。在多元线性回归中,用广义最小二乘法估计模型参数,模型参数的统计检验结果表明聚合值表现出显著的敏感性和不稳定性。
对于如何解决MAUP问题,叶博士提出了三种可行途径:第一,如果在个体水平的点数据包含所有属性信息的情况下,我们可以避免MAUP问题。其次,通过优化,即调整分区方案来解决MAUP问题,第三,以建模的方式来解决该问题是有效且科学的途径。如从本体论的角度,从边界、拓扑关系等入手,用数学规则来表达不同的分区方案;或者从认识论的角度,根据某一尺度上的信息(要素、结构、特征等),按照一定的规律或方法,从尺度转换的视角以推绎的方式进行尺度扩展或尺度收缩,从而实现系统要素和结果尺度变化的重新组合或显现;抑或从方法论的角度,进行一对分区方案的比较。
最后,对地理现象在MAUP问题中的敏感性这一内容,叶博士从概念框架(Conceptual framework)、定义(definition)、拓展(Extensions)及显著性(Significance)等四个方面进行了梳理。认为MAUP的敏感性的定义涉及了研究区(Study area)、空间划分(Area zoning)、兴趣变量(Interest variable)及总结函数(Summary function)四个组成部分,尤为重要的是,为了表达聚合数据的全部信息损失,叶博士创造性的将敏感性以一种概率分布的形式进行表征,并且提出了合并敏感性、Lebesgue测度敏感性、层次敏感性以及噪声敏感性等四类总结函数,并且实证研究表明其均可在地理空间分析中进行拓展。同时,叶博士认为,MAUP问题研究的意义,不仅为地理现象的表达提供了信息来源和描述工具,更重要的是,为不确定性地理问题的分析提供了一套完整的诊断和比较工具。
整个讲座过程中,现场氛围融洽,共鸣热烈,与会师生与叶博士以问题的形式进行了交流,大家纷纷表示受益匪浅。叶博士幽默风趣的谈吐和清晰的思路,给师生留下了深刻的印象。