GIS空间分析原理与方法个人总结复习资料
时间:2025-04-19
时间:2025-04-19
GIS空间分析原理与方法
第一章 地理空间数据分析与GIS
1.地理空间数据处理与建模
地理空间数据分析是:(地理学和地理信息科学领域),它通过研究地理空间数据及其相应分析理论、方法和技术,探索、证明地理要素之间的关系,揭示地理特征和过程的内在规律和机理,实现对地理空间信息的认知、解释、预测和调控。
2.1地理空间数据挖掘概述
可以分为序列模式发现、依赖关系发现、异常值分析和趋势发现等。 地理空间数据挖掘系统包括三大支柱模块:地理空间数据立方体、联机分析处理(OLAP)模块和空间数据挖掘模块.
2.2地理空间数据挖掘典型方法:
⑴地理空间统计方法:分析地理空间数据的统计方法,主要是基于空间中邻近的要素通常比相离较远的要素具有较高的相似性这一原理。
ⅰ.与传统分析有两大差异:①空间数据间并非独立,而是在多维空间中具有某种空间相关性,且在不同的空间分辨率下呈现不同的相关程度;②大多数空间问题仅有一组(不规则分布空间中)观测值,而无重复观测的资料。
ⅱ.地理空间统计模型大致可分为三类:①地统计;是以区域化变量理论为基础,以变差函数为主要工具,研究空间分布上既具有随机性又具有结构性的自然现象的科学。 根据离散数据生成连续表面,通过空间自相关进行空间预测。②格网空间模型:用以描述分布于有限(或无穷离散)空间点(或区域)上数据的空间关系。③空间点分布形态:在自然科学研究中,许多资料是由点(或小区域)所构成的集合。由于形成机制不同,空间点分布形态具有随机、丛聚或规则等不同类型。
⑵地理空间聚类方法:地理空间数据聚类是按照某种距离度量准则,在大型、多维数据集中标识出聚类或稠密分布的区域,从而发现数据集的整体空间分布模式。该方法把空间数据库中的对象分为有意义的子类,使同一子类内部的成员有尽可能多的相同属性,而不同的子类之间差异较大。
⑶地理空间关联分析:地理空间关联分析利用空间关联规则提取算法发现空间数据库中空间目标间的关联程度.GIS数据库是典型的空间数据库,从GIS数据库中挖掘空间关联规则是理解GIS模型和将GIS数据转化成知识的一种有效方法。 关联的规则包括:相邻,相连, 共生,包含.表示空间对象之间的拓扑关系、空间方位、排列次序以及距离信息. ⑷地理空间分类与预测分析:根据已知的分类模型把数据库中的数据映射到给定类别中,进行数据趋势预测分析的方法。预测是利用历史数据记录自动推导出对给定数据的推广描述,实现对未来数据的趋势分析。
ⅰ.分类和聚类算法的差别在于:①聚类算法是根据一定要求将对象聚为一个集合,最后得到的分布模式是聚类之前未确知的;②分类算法则是根据已知分布模式的属性要求,将数据库对象归入相应的分类中。
ⅱ.分类和回归都可用于预测,空间回归规则与空间分类规则相似,也是一种分类器,其差别在于空间分类规则的预测值是离散的,空间回归规则的预测值是连续的。
⑸异常值分析:若一个数据库包含的数据目标与通常的行为或数据模型不一致,则这些数据目标被称为异常值。绝大多数数据挖掘方法把异常值作为噪音或例外数据,然而,在很多情况下这将会导致重要隐含信息的丢失。 基于计算机的异常值分析方法主要有三种:基于统计的异常值分析;基于距离的异常值探测;基于偏差的异常值探测。
3.1空间分析:是集空间数据分析和空间模拟于一体的技术方法,通过地理计算和空间表
GIS空间分析原理与方法
达挖掘潜在空间信息,以解决实际问题。
ⅰ.空间分析的本质特征包括:探测模式;研究关系并建立模型;提高适合于所有观察模式
处理过程的理解;改进预测和控制能力。空间分析的研究对象:空间分析主要通过对空间数
据和空间模型的联合分析来挖掘空间目标的潜在信息。空间分析研究的主要目标有:认知。
解释.预报.调控.
ⅱ.GIS环境下空间分析框架:一类是基于点、线、面基本地理要素的空间分析,通过空
间信息查询与量测、缓冲区分析、叠置分析、网络分析、地统计分析等空间分析方法挖掘出
新的信息;另一类是地理问题模拟,解决应用领域对空间数据处理与输出的特殊要求,地理
实体和空间关系通过专业模型得到简化和抽象,而系统则通过模型进行深入分析操作。
ⅲ.GIS环境下空间分析方法分为如下六个方面:
①确定性空间分析:分析处理确定性空间数据或解决确定性空间问题的方法,它是高级空间
分析的基础。算法基本上是基于经典数学方法建模的
②探索性空间数据分析:(Exploratory Spatial Data Analysis,ESDA)是利用统计学原理
和图形图表相结合对空间数据的性质进行分析、鉴别,用以引导确定性模型的结构和解法的
一种技术,本质上是一种“数据驱动”的分析方法。研究数据的空间相关性与空间异质性,
在知识发现中用于选取感兴趣的数据子集,以发现隐含在数据中的某些特征和规律。
相对于传统的统计分析而言,ESDA技术不是预设数据具有某种分布或某种规律,而是一步步