第二章GIS空间分析的数据模型

发布时间:2021-06-06

空间数据分析

主讲:石云 主讲:

第二章 GIS空间分析的数据模型 空间分析的数据模型导读:本章描述的是整个 导读:本章描述的是整个GIS理论中最为核心的内 容。为了能够 理论中最为核心的内 利用信息系统工具来描述现实世界,并解决其中的问题, 利用信息系统工具来描述现实世界,并解决其中的问题,必 须对现实世界进行建模。对于 而言, 须对现实世界进行建模。对于GIS而言,其结果就是空间数 而言 据模型。 据模型。 空间数据模型可以分为三种: 空间数据模型可以分为三种: 场模型:用于描述空间中连续分布的现象; 场模型:用于描述空间中连续分布的现象; 要素模型:用于描述各种空间地物(离散); 要素模型:用于描述各种空间地物(离散); 网络模型:可以模拟现实世界中的各种网络。 网络模型:可以模拟现实世界中的各种网络。 值得注意的是: 值得注意的是:本章谈到的场模型和要素模型类同于后面提及 的栅格数据和矢量数据,但是前者是概念模型, 的栅格数据和矢量数据,但是前者是概念模型,后面是指其在信息 系统中的实现。 系统中的实现。

2.1 地学模型概述2.1.1 地学模型的概念模型:所谓模型,就是将系统的各个要素,通过适当的筛选, 模型:所谓模型,就是将系统的各个要素, 通过适当的筛选 ,用一 定的表现规则所描写出来的简明映象。 定的表现规则所描写出来的简明映象。 模型通常表达了某个系统的发展过程或发展结果。 模型通常表达了某个系统的发展过程或发展结果。 地学模型:是用来描述地理信息系统各地学要素之间的相互关系和 地学模型 : 客观规律,其表达式可采用语言的、数学的或其它方式, 客观规律 ,其表达式可采用语言的、 数学的或其它方式 ,通常反映 了地学过程及其发展趋势或结果。 了地学过程及其发展趋势或结果。 地学模型也称为专题分析模型。对于GIS来说,专题分析模型是 来说, 地学模型也称为专题分析模型。对于 来说 根据关于目标的知识将系统数据重新组织,得出与目标有关的更为有序 根据关于目标的知识将系统数据重新组织,得出与目标有关的更为有序 重新组织 的新的数据集合的有关规则和公式,这是应用 的新的数据集合的有关规则和公式,这是应用GIS 进行生产和科研的重 要手段。 要手段。

2.1.2 地理分析模型的建立 模型化是将主观性 的思考以模型的形式反映出来, 模型化 是将主观性的思考以模型的形式反映出来, 不同的理论 是将 主观性的思考以模型的形式反映出来 观点, 观点,不同的体系可以产生不同的结果 。 地理分析模型

的建立过程(地理信息系统的模型化)可表示为: 地理分析模型的建立过程( 地理信息系统的模型化 ) 可表示为 : YOX = M Y — 某个系统,可以看作是地理系统中被主观选择的一个局部。 某个系统,可以看作是地理系统中被主观选择的一个局部。

X— 表示某种介体,具体讲就是某种模型化方法。 表示某种介体,具体讲就是某种模型化方法。 O — Y对X产生的作用。 对 产生的作用 产生的作用。 M — 系统 通过介体Y产生的作用 所建立的模型。 系统X通过介体 产生的作用 所建立的模型。 通过介体 产生的作用O所建立的模型

2.1.3

地学分析模型的分类

1 概念模型 又称为逻辑模型,主要指通过观察、总结、 又称为逻辑模型,主要指通过观察、总结、提炼而成的文 字描述或逻辑表达式,常由此构成专家系统的知识库。 字描述或逻辑表达式,常由此构成专家系统的知识库。 2 数学模型 又称为理论模型,是应用数学分析方法建立的数学表达式, 又称为理论模型,是应用数学分析方法建立的数学表达式, 反映地理过程本质的物理规律,如区位模型( 反映地理过程本质的物理规律,如区位模型(location models) ) 就是解决地理空间问题的很有价值的理论模型。 就是解决地理空间问题的很有价值的理论模型。 3 统计模型 包括经验模型, 包括经验模型,是通过数理统计方法和大量观察实验得到 的定量模型,具有简单实用的优点。 的定量模型,具有简单实用的优点。

4

三类模型对比 概念模型 比较灵活,可以引入较多模糊的概念,适用范围很广, 比较灵活,可以引入较多模糊的概念,适用范围很广,

易为大多数人接受;但难以进行精确定量分析。 易为大多数人接受;但难以进行精确定量分析。 数学模型 因果关系清楚, 因果关系清楚,可以精确地反映系统内各要素之间的定

量关系,易于用来对自然过程施加控制;但通常难于包括太多要素, 量关系,易于用来对自然过程施加控制;但通常难于包括太多要素, 而常常是大大简化的理想情形,削弱了模型的客观性。 而常常是大大简化的理想情形,削弱了模型的客观性。 统计模型 可以通过大量实践建立,具有简单、使用、 可以通过大量实践建立,具有简单、使用、可以处理

大量相关因素的特点,缺点是过程不清,一般采用“黑箱” 灰箱” 大量相关因素的特点,缺点是过程不清,一般采用“黑箱”或“灰箱” 方法建立的。 方法建立的。

2.1.4 建立地理分析模型的一般规律 首先在实践中不断观察总结, 首先在实践中不断观察总结 , 形成越来越丰富的 概念模型, 再积累经验的基础上, 概

念模型 , 再积累经验的基础上 , 采用数理统计的方 法摸索统计规律, 最后上升 到 理论模型, 再采用综合 法摸索统计规律 , 最后 上升到 理论模型 , 再采用 综合 上升 方法建立实用的分析模型。 方法建立实用的分析模型。 分析模型

2.1.5 建立 建立GIS分析模型的步骤 分析模型的步骤1 系统描述与数据分析 对模型所要分析的系统,选择可以描述系统的状态、与外部联系、 对模型所要分析的系统,选择可以描述系统的状态、与外部联系、 随时间变化等方面的数据,构选该系统的数据体系。 随时间变化等方面的数据,构选该系统的数据体系。 2 理论推导 根据地理规律和系统的特点,进行理论推导, 根据地理规律和系统的特点,进行理论推导, 确定上面的数据体系 中多因子之间的量纲关系,作为分析模型的基本框架。 中多因子之间的量纲关系,作为分析模型的基本框架。 3 简化表达 根据理论分析和具体应用要求, 根据理论分析和具体应用要求, 筛选去除相对影响较小和不重要的 因素,或采用主成分分析法等数学方法简化表达形式,使模型接近实用。 因素,或采用主成分分析法等数学方法简化表达形式,使模型接近实用。 4 参数确定 模型参数的确定可采用参数实验的方法,或采用层次分析法 (AHP)、专家打分法、确定模糊隶属度等方法。 ) 专家打分法、确定模糊隶属度等方法。 形式和参数确定后,分析模型可在应用中完善。 形式和参数确定后,分析模型可在应用中完善。

2.2 空间数据及其表示 空间分析的目的是提取空间信息,而空间分析的对象就是空间数据。 空间分析的目的是提取空间信息 ,而空间分析的对象就是空间数据 。 2.2.1 空间数据的概念 地理数据也可以称为空间数据(spatital data):是描述地球表面 地理数据也可以称为空间数据( ) 是描述地球表面 也可以称为空间数据 有一定厚度)一定范围的地理事物极其关系的数据, (有一定厚度)一定范围的地理事物极其关系的数据,可以以不同方 式和来源获得,如地图、各种专题图、图像、统计数据等。 式和来源获得,如地图、各种专题图、图像、统计数据等。 这些数据都具有能够确定空间位置的特点。 这些数据都具有能够确定空间位置的特点。 空间数据模型是关于现实世界中空间实体及其相互联系的概念, 空间数据模型是关于现实世界中空间实体及其相互联系的概念, 它为描述空间数据的组织和设计空间数据库模式提供了基本方法。 它为描述空间数据的组织和设计空间数据库模式提供了基本方法。用户 数据 模型 设计者 空间数据的概念模型 计算机

2.2.

2 空间数据的表示 前一章里已经阐明, 前一章里已经阐明 , 空间分析是基于地理对象的位置和形态 特征的空间数据分析技术。 特征的空间数据分析技术。 因此,空间分析方法必然要受空间数据表示形态的制约和影响, 因此,空间分析方法必然要受空间数据表示形态的制约和影响, 在研究空间分析时,就不能不考虑空间数据的表示方法与数据模型。 在研究空间分析时,就不能不考虑空间数据的表示方法与数据模型。 空间数据有两种基本的表示模型:栅格模型和矢量模型. 空间数据有两种基本的表示模型:栅格模型和矢量模型.

1 栅格数据模型 (1)栅格数据模型中,地理空间被划分为规则的像元、空间位置由像 )栅格数据模型中,地理空间被划分为规则的像元、 元的行、列号表示。像元的大小反映了数据的分辨率即精度, 元的行、列号表示。像元的大小反映了数据的分辨率即精度,空间物体 由若干像元隐含描述。 由若干像元隐含描述。 (2)栅格模型中最常用也是最简单的是正方形格网: 栅格模型中最常用也是最简单的是正方形格网: 方向性(格网具有相同的方向) 方向性(格网具有相同的方向) 可再分(无限再分) 可再分(无限再分) 坐标记录、 坐标记录、计算最为容易 大多数栅格地图、 大多数栅格地图、数字图像都采用了这种栅格模型 (3)栅格模型的缺点: 栅格模型的缺点: 难以表示不同要素占据相同位置的情况, ① 难以表示不同要素占据相同位置的情况,这是因为一个栅格被赋 予一个特定的值,因而一幅栅格地图仅适宜表示一个主题( 予一个特定的值,因而一幅栅格地图仅适宜表示一个主题(如地 貌、土地利用等) 土地利用等) 很多栅格具有相同的值,数据冗余非常大。 数据压缩) ② 很多栅格具有相同的值,数据冗余非常大。(数据压缩)

2 矢量数据模型 (1)矢量数据将地理空间看成一个空间区域,地理要素存在其间。矢 )矢量数据将地理空间看成一个空间区域,地理要素存在其间。 量数据模型以坐标点对来描述点、 量数据模型以坐标点对来描述点、线、面三类地理实体。 面三类地理实体。 (2)描述地理实体的矢量方法有很多: 描述地理实体的矢量方法有很多: 路径拓扑:将二维要素的边界作为独立的一维要素来单独处理, 路径拓扑:将二维要素的边界作为独立的一维要素来单独处理, 而不考虑要素之间的相互关系。 而不考虑要素之间的相互关系。 网络拓扑:在一个关于边界的关系网络模型中考察二维要素。 网络拓扑:在一个关于边界的关系网络模型中考察二维要素。 矢量

、 3 矢量、栅格数据优缺点 矢量方法:面向实体的表示方法, 矢量方法:面向实体的表示方法,以具体的空间物体为独立描述 对象,因此物体愈复杂,描述愈困难,数据量也随之增大, 对象,因此物体愈复杂,描述愈困难,数据量也随之增大,如线 状要素愈弯曲,抽样点必须愈密。 状要素愈弯曲,抽样点必须愈密。 栅格方法:面向空间的表示方法,将地理空间作为整体进行描述, 栅格方法:面向空间的表示方法,将地理空间作为整体进行描述, 具体空间物体的复杂程度不影响数据量的大小, 具体空间物体的复杂程度不影响数据量的大小,也不增加描述上 的困难。 直接量化。 的困难。——直接量化。 直接量化

2. 2 . 3 建立GIS分析模型的步骤 建立 分析模型的步骤 中与空间信息有关的信息模型有三个: 在GIS中与空间信息有关的信息模型有三个: 中与空间信息有关的信息模型有三个 1 场模型。二三维空间中, 场模型 。 二三维空间中 , 空间实体的属性信息被看作是连续 变化的数据。 变化的数据。 2 3 基于对象(要素)(FEATURE)的模型。强调离散对象。 基于对象(要素) )的模型。强调离散对象。 网络(NETWORK)模型 。特殊对象之间的交互,水、交通 特殊对象之间的交互, 网络( ) 等网络。 等网络。 很多类型的数据, 有时被看作场, 有时被看作对象—— 很多类型的数据 , 有时被看作场 , 有时被看作对象 主要考虑数据的测量方法。 主要考虑数据的测量方法。 分类空间分为粗略的子类——场变成要素。 场变成要素。 分类空间分为粗略的子类 场变成要素

2.3 场模型 对于模拟具有一定空间内连续分布特点的现象来说, 对于模拟具有一定空间内连续分布特点的现象来说,基于场的 观点是合适的:地表温度、湿度、空气流动速度、方向等。 观点是合适的:地表温度、湿度、空气流动速度、方向等。 2.3.1 场模型的表示 Z :S Z(S) ( )

Z——可度量的函数 可度量的函数 S——空间中的位置 空间中的位置 此式表示了从空间域(甚至包括时间坐标)到某个值域的映射。 此式表示了从空间域(甚至包括时间坐标)到某个值域的映射。

2. 3. 2 场的特征 场常被视为一系列等值线组成, 场常被视为一系列等值线组成,一个等值线就是地面上所 有具有相同属性值的点的有序集合: 有具有相同属性值的点的有序集合: 1 空间结构特征和属性域空间——可以进行长度和角度测量的欧几里德空间(二维) 可以进行长度和角度测量的欧几里德空间(二维) 空间 可以进行长度和角度测量的欧几里德空间 空间结构可以是规则的或不规则

的,但空间结构的位置误差和 空间结构可以是规则的或不规则的 , 分辨率则十分重要, 分辨率则十分重要,他们应与空间结构设计所支持的数据类型和 分析相适应。 分析相适应。 属性域的数值可以包含以下几种类型; 名称、序数、 属性域的数值可以包含以下几种类型 ; 名称 、 序数 、 间隔和比 率。 ——可以支持空值,如果值是未知或不确定则赋予空值。 可以支持空值,如果值是未知或不确定则赋予空值。 可以支持空值

连续的、 2 连续的、可微的 如果空间域函数连续的话,空间域也就是连续的, 如果空间域函数连续的话,空间域也就是连续的,即随着空间位置 的微小变化,其属性值也发生微小变化。 的微小变化,其属性值也发生微小变化。 ——只有在空间结构和属性域中恰当地定义了 “ 微小变化 ” , 只有在空间结构和属性域中恰当地定义了“ 微小变化” 只有在空间结构和属性域中恰当地定义了 “连续”的意义才确定。 连续”的意义才确定。

3 与方向无关和与方向有关(各向同性,各向异性) 与方向无关和与方向有关(各向同性,各向异性) 空间场内部的各种性质是否随着方向的变化而发生变化, 空间场内部的各种性质是否随着方向的变化而发生变化,是空间场的一 个重要特征。 个重要特征。 各向同性场。一个场的所有性质都与方向无关。 各向同性场。一个场的所有性质都与方向无关。 以旅行时间为例,如果从某一点出发, 以旅行时间为例,如果从某一点出发,到另一点的所耗费的 时间只与两点之间的欧氏距离成正比,则从一固定点出发, 时间只与两点之间的欧氏距离成正比,则从一固定点出发,旅行 特定时间后所能达到的点必然组成一个等时圆。 特定时间后所能达到的点必然组成一个等时圆。 等时圆 各向异性场。 各向异性场。场中的性质与方向有关 现实生活中,旅行所耗费的时间不只与欧氏距离成正比, 现实生活中 , 旅行所耗费的时间不只与欧氏距离成正比 , 还与路况、运输工具性能等有关,从固定点出发, 还与路况、运输工具性能等有关,从固定点出发,旅行特定时间 后所能到达的点则在各个方向上是不同距离的,形成各向异性距 后所能到达的点则在各个方向上是不同距离的,形成各向异性距 离表面。 离表面。

4 空间自相关 (1)定义:空间自相关是空间场中的数值聚集程度的一种量度 。也是 )定义: 空间上远近事件之间的关系测量。 空间上远近事件之间的关系测量。——距离近的事物之间的联系性强于 距离近的事物之间的联系性强于 距离远的事物之间的联系性。 距离远的事

物之间的联系性。 在空间域, ① 在空间域,是位置 i与近邻位置 j 数值之间相关; 与近邻位置 数值之间相关; 时间自相关是时间序列上,连续事件关系的表达。在时间域上, ② 时间自相关是时间序列上,连续事件关系的表达。在时间域上, 数值之间的相关。 是 t 时刻与时刻 t + △t 数值之间的相关。 正空间自相关: 正空间自相关:是在相邻的区域上具有相似的数值 ——类似的数值有聚集的倾向。 类似的数值有聚集的倾向。 类似的数值有聚集的倾向

负空间自相关:指邻域之间数值差别大。 负空间自相关:指邻域之间数值差别大。 ——类似的数值有聚集的倾向。 类似的数值有聚集的倾向。 类似的数值有聚集的倾向

(2)空间自相关的测量:即比较位置相似和属性(数值)相似之间的 )空间自相关的测量:即比较位置相似和属性(数值) 匹配。 匹配。 位置相似,采用空间近邻测量矩阵。 位置相似,采用空间近邻测量矩阵。 数值相似,采用向量乘和,差平方 和绝对值差|x 数值相似,采用向量乘和,差平方(xi – yj)2和绝对值差 i – yj|等测 等测 量。

2.4 要素模型 2.4.1欧氏(Euclidean)空间和欧氏空间中的三类地物要素 欧氏( 欧氏 ) 许多地理现象模型建立的基础就是嵌入( 许多地理现象模型建立的基础就是嵌入(Embed)在一个坐 ) 标空间中,在这种坐标空间中, 标空间中,在这种坐标空间中,根据常用的公式就可以测量点之间 的距离及方向,这个带坐标的空间模型叫做欧氏空间 欧氏空间, 的距离及方向,这个带坐标的空间模型叫做欧氏空间,它把空间特 性转换成实数的元组(Tuples)特性,两维的模型叫做欧氏平面。 性转换成实数的元组(Tuples)特性,两维的模型叫做欧氏平面。 欧氏空间中, 欧氏空间中,最经常使用的参照系统是笛卡尔坐标系 ),或极坐标系 (Cartesian Coordinates),或极坐标系(Polar Coordinates)。 ),或极坐标系( )。 将地理要素嵌入到欧氏空间中,形成了三类地物要素对象, 将地理要素嵌入到欧氏空间中,形成了三类地物要素对象, 即点对象、线对象和多边形对象。 即点对象、线对象和多边形对象。

1 点对象 点是有特定的位置,维数为零的物体,包括: 点是有特定的位置,维数为零的物体,包括: 点实体( ):用来代表一个实体 点实体(Point Entity):用来代表一个实体; ):用来代表一个实体; 注记点:用于定位注记; 注记点:用于定位注记; 内点( ):用于记录多边形的属性 内点(Label Point):用于记录多边形的属性,存在于多边形内; ):用于记录多边形的属性,存在于多边形内

; 结点(节点)(Node):表示线的终点和起点; ):表示线的终点和起点 结点(节点)( )( ):表示线的终点和起点; 角点( ):表示线段和弧段的内部点 角点(Vertex):表示线段和弧段的内部点。 ):表示线段和弧段的内部点。

第二章GIS空间分析的数据模型.doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:7 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:29元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219