本文为《地理信息分析》 David O’Sullivan, Dave Unwin 的读书笔记

第二版序言

本书基本框架依托于在地理信息科学中具有悠久历史的两个关键思想——制图学思想和统计学思想。

其第一个关键思想是在长度维的框架下,把地理对象描述为点、线、面和连续性表面(场);第二个关键思想是把图示分布看作是某种空间随机过程的实现。

第1章 地理信息分析与空间数据

本章目标

1.1 引言

空间分析至少有四个可以识别的宽泛领域:

  • 空间数据操作,一般应用于地理信息系统(geographic information system, GIS),通常称为“空间分析”,在GIS公司的宣传材料中更是如此。GIS手册将让你明确这些技术的范围,如Tomlin(1990)和Mitchell(1999)。
  • 空间数据分析,具有描述性和探索性。这是所有空间分析中重要的第一步,并往往可应用于非常庞大和复杂的数据集。地理学家,如Unwin(1982)、Bailey和Gatrell(1995)、Fotheringham等(1999)的书遵循这一传统。
  • 空间统计分析,应用统计方法研究空间数据,以确定数据是否可以用一个统计模型来表示。上述提及的地理教科书涉及这些问题,并有少数统计学家对空间数据分析感兴趣,特别是Ripley(1981,1988)、Diggle(1983)和Cressie(1991)。
  • 空间建模,需要构建模型预测空间结果。在人文地理学中,模型用于预测物流和人流,或者进行设施位置的优化(Wilson,2000),而在环境科学中,可利用模型尝试模拟自然过程的动力学(Ford,1999)。建模技术是空间分析的一个自然扩展,但超出了本书的研究范围。

1.2 空间数据的类型

当用地图思考世界时,你如何看待它呢?在早期的GIS文献中,通常区分两种系统,它们以如何数字化表达理实体为特征:

(1)矢量系统,它纪录构成地图的特征位置坐标(x, y)。在矢量观点下,我们列出特征,并把每个特征表示为一个点、线或面对象。矢量GIS起源于基于数字化数据用计算机绘制地图,并受到特别重视,因为当时计算机存储器是一种昂贵的商品。虽然匹配不精确,但矢量模型最接近现实世界由对象组成的观点,它认为空间是一种空的容器,由不同类型的对象填充其中。

(2)栅格系统。它不是从地面上的对象开始,而是定义一个地标上称为“像素”的小单位网格。对于每个像素,记录下它的值,或者说是感兴趣的事物存在或不存在。如此,我们把地图划分为相同的离散单元,并列出每个单元的内容。因为空间中的每个位置都有一个值(即使是零或空),所以栅格方法通常比矢量方法占用更多的存储空间。栅格GIS主要起源于图像处理,其中多数数据来源于遥感。

在本节中,我们希望能够说服你,在更高的抽象层次上矢量/栅格的区分不是非常有效,并且它模糊了一个更为重要的界限,即我们所说的对象观点和场观点之间的界限。

对象观点

在对象观点中,我们把世界看作是位于空间中的一系列实体。实体(通常)是实际存在的,你可以触摸它们,站在它们当中,甚至移动它们。一个对象是一个实体的全部或部分的数字化表示。

对象可以划分为不同的类型,如点对象、线对象和面对象,在具体应用中,这些类型由特定的对象进行实例化。例如,在一个环境GIS中,森林和农田可能是面对象的实例。在对象观点中,空间能被任何数量的对象占据。

因为对象观点也可能与对象的行为联系在一起,当具有良好定义的对象随时间发生变化时,对象观点具有其优势。

场观点

在场观点中,世界由空间上连续变化的属性组成。一个例子是地球本身的表面,其中,场变量是海拔高度。

这里的关键思想是空间连续性和自定义。在一个场中,每个位置都有一个值(包括没有值或值为零),一系列值放在一起就定义了场。这与对象观点截然不同,为了完全描述一个地理对象,还需要给对象附加一个属性——一个长方形在给它附加描述性的属性值以前,它不表示具体的地理实体。

栅格数据模型是记录场的一种方法。在该模型中,场的地理变化用完全相同的、形状规则的像元表示。地表通常被记录为高程值的规格格网(一个数字高程矩阵)。另一种方法是应用不重叠的三角网形式的面对象(称为”不规则三角网“或TIN)表示同样的场变量。在TIN中,每个三角形的顶点被赋予该位置上场的值。在早期的GIS中,特别是制图应用中,通常用地形图中熟悉的等高线,数字化地记录地面高程的场值。这是一个用重叠的面对象表示的场,封闭在各个等高线内的面积是景观的一部分。重要的一点是,场可以用栅格或矢量数字化地进行编码。

最后,另一种类型的场由类别变量(categorical variable)值的连续覆盖组成。每个位置都有一个值,但”值“是现象的名称。如土壤类型地图,每个位置都有一种土壤类型,因此具有空间连续性,也有涉及土壤类型的自定义,因而这是一种场的观点。

选择所用的表达方式

一个实体必须是:

(1)可识别的。如果不能看到它,那么就不能记录它。

(2)有意义的。它必须是感兴趣的。

(3)可描述的。它必须具有可以记录的属性或特征。

对象观点和场观点之间的关系源远流长,可以追溯到古希腊对现实世界本质的哲学论辩:空间是现象的一个连续变化场,还是充满不同对象的空容器?从目前的情况来看,你现在应该明白,关键问题不是哪种观点是正确的,而是为手头的任务选择采用哪种观点。

不但明确区分实体及其在GIS数据库中的表示,同时区分这两者和同一实体在地图上的显示方式,这也是一个好主意。地图中表达的内容与现实世界是不一样的。地图设计的目标是视觉上的,即显示给地图用户关于现实世界的一些东西,而数据库的目标是关注管理、测度、分析和建模。当选择如何用数字化形式表达现实世界时,值得我们清楚地区分这些目标。

空间对象的类型

一个被多次改进的通常方法是基于所关注对象的空间维度。想想你能画出多少种对象类型。点L0,线L1,面L2,体L3……

1.3 一些困难

对象并不总是如它们所呈现的那样

学生们通常会混淆各种不同的传统制图表示方式和对象与场的根本性质。例如,地图上的一条线可能用于标记一个面的边界,但实体仍是一个面对象;真正的线对象表示线实体,如铁路、公路和河流。在地形学上,通常用等高线表示海拔这一连续性场变量;然而,正如我们所讨论的那样,可以用许多不同的方式在地图上表示场。

对象通常是多维的

空间对象常常具有比定义它们的单一维度更多的维度变化。例如,我们可以在二维空间中通过(x, y)坐标定位一个点对象,但在许多应用中,把它记录在三维空间(x, y, z)中会更好,其中把深度或高度作为第三维度。地质学家研究的岩体存在于一个位置的某深度内,但也具有如孔隙度或颜色等属性。

对象不移动或不变化

很多应用中,我们的主要兴趣是事务如何随时间变化。标准的GISs不容易做到既处理空间维度又处理时间维度。稍许思考就会发现纳入对象的时间因素可能产生的问题,我们称随时间变化的现象为”过程“。它对大多数科学研究非常重要,然而却不容易在任何对象的描述中都纳入它,要在数字化环境中对其进行处理,将永远是困难的。

对象没有简单的几何结构

我们想要刻画的地理现象的某些方面,不能很好地用栅格/矢量或对象/场观点进行描述。最明显的例子是交通网络或河流网络。一个网络通常模拟为一个线对象集合(路线)和一个点对象集合(交通结点),但该数据结构在许多应用中使用非常不方便,并且要刻画得好也很困难(想想单行道、限制转弯、车道等)。另一个变得越来越重要的例子是图像数据。GIS中的图像可能是用作背景的扫描地图,或者是用标准格式编码的一张照片。

对象依赖于分析的尺度

不同的对象类型可以在不同尺度上表示相同的现实世界现象。例如一个车站,在一种尺度上,可以用一个点表示。但放大一些,车站变成了一个面对象,由一个多边形表示。

对象可能具有分形维数

一个更复杂的情况是,一些实体是分形的,不管我们如何缩放,它们具有同样的或相似的细节。除非我们接受描述仅仅是一个特定精度上的快照,否则数字化地描述分形是困难的。

对象可能是模糊的和/或具有不确定性的边界

典型的例子是土壤类型。

1.4 属性描述的尺度

重要的是要明确什么是测度。当收集信息后,测度是根据某些集合规则,为观测到的现象赋予一个等级或数值的过程。该定义并没有明确限定我们的赋值是否包含数字。

如果这个过程要产生出有用的测量尺度,那么有必要坚持使用一个可定义的过程进行量测,给出尽可能有效的和具有可重复性的结果。第一个要求意味着量测者知道自己在量测什么,并能进行必要的操作;第二个要求意味着尺度是真实和准确的。第三个要求意味着重复该过程会产生同样的结果,并且当应用不同数据时得到类似结果。

名义量

次序量

间隔量和比率量

量纲和单位

1.5 GIS与空间数据操作

在本节中,我们展开针对它们的两种空间分析观点。第一,我们阐述一种思想,即这些几何操作设计空间数据类型之间的某种形式上的转换。第二,我们关注应用于各种结果的(x, y)坐标编码误差的影响。

1.6 前面的路

本章回顾

参考文献

第2章 空间数据的陷阱和潜力

本章目标

2.1 引言

2.2 坏消息:空间数据的陷阱

2.3 好消息:空间数据的潜力

本章回顾

参考文献

第3章 基础——把它图示出来

本章目标

3.1 引言:制图学传统

3.2 地理可视化与分析

3.3 雅克·博汀的图形变量

3.4 新的图形变量

3.5 地理可视化中的问题

3.6 制图和探索点数据

3.7 制图和探索面数据

3.8 制图和探索场数据

3.9 非空间数据的空间化

3.10 总结

本章回顾

参考文献

第4章 基础——把地图作为过程的结果

本章目标

4.1 引言:地图和过程

4.2 过程及其所产生的模式

4.3 预测由过程产生的模式

4.4 更多定义

4.5 线、面和场的随机过程

4.6 总结

本章回顾

参考文献

第5章 点模式分析

本章目标

5.1 引言

5.2 描述一个点模式

5.3 统计地评估点模式

5.4 蒙特卡洛检验

5.5 总结

本章回顾

参考文献

第6章 实用点模式分析

本章目标

6.1 引言:空间统计分析的问题

6.2 常规统计推断的替代方法

6.3 IRP/CSR的替代模型

6.4 现实世界中的点模式分析

6.5 处理非齐次性

6.6 焦点检验

6.7 聚集探测:扫描统计量

6.8 应用密度和距离:邻近多边形

6.9 距离矩阵和点模式分析的一个注记

本章回顾

参考文献

第7章 面对象与空间自相关

本章目标

7.1 引言:面对象复习

7.2 面对象的类型

7.3 面的几何特性

7.4 测度空间自相关

7.5 一个例子:2001~2006年奥克兰的肺结核

7.6 其他方法

本章回顾

参考文献

第8章 局部统计量

本章目标

8.1 引言:地理地思考,局部地测度

8.2 局部性定义:再次提到空间结构

8.3 一个例子:Getis-Ord Gi和Gi*统计量

8.4 局部统计量推断

8.5 其他局部统计量

8.6 总结:局部地看世界

本章回顾

参考文献

第9章 场数据描述与分析

本章目标

9.1 引言:标量和向量场回顾

9.2 模拟与存储场数据

9.3 空间插值

9.4 表面的衍生测度

9.5 地理代数

9.6 总结

本章回顾

参考文献

第10章 认识未知——场统计学

本章目标

10.1 引言

10.2 空间坐标回归:趋势面分析

10.3 平方根差云图和(半)变异函数

10.4 空间插值方法:克里金

10.5 总结

本章回顾

参考文献

第11章 把地图放在一起——地图叠置

本章目标

11.1 引言

11.2 布尔叠置与筛选叠图

11.3 替代布尔叠置的一般模型

11.4 指数叠置与加权线性组合

11.5 证据权重

11.6 应用回归的模型驱动叠置

11.7 总结

本章回顾

参考文献

第12章 空间分析新方法

本章目标

12.1 不断变化的技术环境

12.2 不断变化的科学环境

12.3 地理计算

12.4 空间模型

12.5 网格和云:超级计算简介

12.6 总结:新地理信息分析?

本章回顾

参考文献