本文接上篇:ArcGIS空间统计—Moran’s莫兰指数(上)
概述:
根据要素位置和属性值使用 Global Moran’s I 统计量测量空间自相关性。提出者为澳大利亚统计学家帕特里克·阿尔弗雷德·皮尔斯·莫兰(Patrick Alfred Pierce Moran)。
Moran PAP. The interpretation of statistical maps[J]. Journal of the Royal Statistical Society B , 1948,(37):243-251.
详细概述:
空间自相关 (Global Moran’s I)工具同时根据要素位置和要素值来度量空间自相关。在给定一组要素及相关属性的情况下,该工具评估所表达的模式是聚类模式、离散模式还是随机模式。该工具通过计算 Moran’s I指数值、z得分和p值来对该指数的显著性进行评估。p值是根据已知分布的曲线得出的面积近似值(受检验统计量限制)。
公式:
上次我们将了莫兰指数的参数该如何选择,以及每一个指数的含义解释,想必大家都已经知道了莫兰指数选择的参数其实最重要的就一个,也就是空间关系的概念化,那么这次我们来讲莫兰指数的结果如何进行解释。
上图是莫兰指数返回给我们的这张图表,其实也就是全部的莫兰指数结果,首先在左上角是最重要的三个指数,莫兰指数、z得分以及p值。
首先我们要看的其实是z得分以及p值,莫兰指数放在最后看:
p值,p-value,,probability,表示概率。对于模式分析工具来说,p值表示所观测到的空间模式是由某一随机过程创建而成的概率。当p很小时,意味着所观测到的空间模式不太可能产生于随机过程(小概率事件),因此您可以拒绝零假设。您可能会问这样的问题:要小到什么程度才算足够小?这是一个非常好的问题。
z得分,z-score,表示标准差的倍数。例如,如果工具返回的z得分为+2.5,我们就会说,结果是2.5倍标准差。如下所示,z得分和p值都与标准正态分布相关联。
观察上图,其实也就是说,上图曲线下方是随机分布的正态分布概率图,如果P值小于0.01,可以发现也就是随机分布的可能性落在了最左边蓝色或者最右边红色的区域内,但是这个可能性是0.01,即1%,也就是说,我们观察的空间模式是随机分布的可能性为1%,也就是有99%的可能性为不是随机分布,有可能是聚类或者离散模式,但是这另说。在统计意义上来讲,也就是说在99%的置信度上拒绝原假设,即有99%的把握认为原假设(随机分布)是不可能的。若0.05,也就是说在95%的置信度上拒绝原假设,即有95%的把握认为原假设(随机分布)是不可能的。
1、Z值与P值有何用?
大多数统计检验在开始时都首先确定一个零假设。模式分析工具的零假设是完全空间随机性 (CSR),它或者是要素本身的完全空间随机性,或者是与这些要素关联的值的完全空间随机性。
模式分析工具所返回的 z 得分和 p 值可帮助您判断是否可以拒绝零假设。通常,您将运行其中一种模式分析工具,并希望 z 得分和 p 值表明可以拒绝零假设,这就意味着:您的要素(或与要素关联的值)表现出统计意义上的显著性聚类或离散模式,而不是随机模式。
如果您在景观分布(或空间数据)中发现了空间结构(如聚类),就证明某些基础空间过程在发挥作用,而这方面通常正是地理学者或 GIS 分析人员所最为关注的。
2、置信度
z 得分(标准差)
p 值(概率)
置信度
< -1.65 或 > +1.65
< 0.10
90%
< -1.96 或 > +1.96
< 0.05
95%
< -2.58 或 > +2.58
< 0.01
99%
置信度为 95% 时,z 得分的临界值为 -1.96 和 +1.96 倍标准差。如果此时,与其关联的未经校正的 p 值为 0.05,但z 值在 -1.96 和 +1.96 之间,则未经校正的 p 值将大于 0.05,因而不能拒绝零假设,因为所表现出的模式很可能是随机空间过程产生的结果。如果 z 得分在该范围之外(例如,-2.5 或 +5.4 倍标准差),则所观测到的空间模式可能过于罕见,不可能是随机过程产生的结果,而且 p 值很小也可以反映出这一点。在这种情况下,可以拒绝零假设,并着手找出是什么可能导致您的数据出现具有统计显著性的空间结构。
这里的一个关键概念是,正态分布中间位置的值(例如,类似 0.19 或 -1.2 的 z 得分)代表了预期的结果。但在 z 得分的绝对值很大而概率很小时(即出现在正态分布的两端),您就会查看其中存在的不寻常现象并且这也非常有趣。例如,对于热点分析工具,不寻常意味着出现了具有统计显著性的热点或冷点。
(z 得分越高(或越低),聚类程度就越高。如果 z 得分接近零,则表示研究区域内不存在明显的聚类。z 得分为正表示高值的聚类。z 得分为负表示低值的聚类。)
因此,其实上面这张图下面的那句话其实就是给我们的解释,“随机产生此聚类模式的可能性小于1%”,也就是说,我们的数据是聚类的,因为随机的可能性是1%,也就是99%的把握认为我们的数据是聚类的,也就是湖南省122个县的GDP在空间上是有关联的,并且是聚类分布的。
其实莫兰指数也就只能告诉我们这么多了,它并不会返回一张红蓝相间的图给我们,那是其他的工具如局部莫兰指数或者热点分析会返回的图,因此全局莫兰指数是作为一个检验数据的空间相关性的工具出现的,但是也是必不可少的,当然了,虽然不能出图,但是在我们的论文里,是可以将这个结果作为结论出现的!!
本文链接:https://tuyuangis.com/blog/382.html
本文标签:ArcGIS