GIS基础讲稿第7章新由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“gis基础讲稿第2章”。
第七章
地理信息系统的应用
第七章
地理信息系统的应用
7.1地理信息应用模型的基本概念
7.1.1地理信息应用模型
把模型理解为一定对象的状态、结构及其属性的简化表示。模型是一种抽象、简化、反映对象本质的模拟。模型是对客观世界的抽象和概括。
地理信息模型应具备的功能:①简化地理系统的结构,描述和认识地理系统的构造,把所关心的问题问题抽取出来;②汇集数据,综合系统的大量的具体数据,发现内在规律,如回归模型、相关分析模型;③模拟系统过程,预测系统未来变化,如系统预测模型、系统动态学模型等;④解释事物变化结果的必然性;⑤验证假说和理论,形成新的理论,如空间相互作用模型;优化系统结构,涉及新的方案,如各类优化模型。
7.1.2地理信息应用模型分类
⑴根据分类标志的不同有不同的分类:
根据考虑时间因素与否分类:可将模型分为静态模型与动态模型。在模型中不加入时间因素是静态模型如运输模型、投入产出模型;在模型中加入时间因素是动态模型如经济计划模型、时间序列模型等。
⑵根据考虑随机项因素与否分类:可将模型分为确定性模型与随机模型。确定性因素不考虑随机项,不考虑随机因素的影响,认为影响因素是确定的;由于随机因素的存在,不考虑随机因素的影响对地理系统来说是不可能的,因此随机模型应用及其广泛。
⑶根据模型的用途分类:可将模型分为理论模型、预测模型、模拟模型、最优化决策模型等。理论模型用来进行理论推导,阐明各种地学理论;预测模型主要用来预测未来状态与发展方向;模拟模型用于模拟在同环境条件下系统的运动轨迹,以分析其动态特征并进行多方案比较,也带有预测性质;最优化决策模型用于优化决策,一般有目标函数和约束条件组成,通过计算机按照一定的最优化算法搜索迭代求出使系统目标最优的最优解,提供各种决策方案。
⑷根据模型表达的关系分类:可将模型分为三类,一类是基于物理和化学原理的理论模型,如地表径流模型、海洋和大气环流模型等;一类是基于变量之间的统计关系或启发式关系的经验模型;一类是广泛用于地学领域的基于原理与经验的混合模型。
7.2 地理信息应用模型的建立
把模型理解为一定对象的状态、结构及其属性的简化表示。模型的构造必须经过抽象分析的过程,即经过对现实原型摒弃次要过程的过程。不同的模型的创建不尽相同,但总的看来可分为以下
76869
第七章
地理信息系统的应用
能一次成功,总要反复的修改、调试和改进,直至达到研究目的。
7.4.4细胞自动机模型(CA模型)
它是一个离散的时空动态模型,非常适合对空间复杂系统的动态模拟。它是由系统构成单元的相互作用来模拟复杂系统的整体行为。在林火蔓延、土地利用变化模拟等方面有很好的效果。(复杂系统指系统的整体性质不等于部分性质之和。)
7.4.5投入产出模型
是基于数学上的矩阵理论来表达系统部门之间的投入产出关系,通过矩阵的转换操作,实现对系统投入产出结构的一系列分析。
7.5 规划与决策模型
规划与决策是城市与环境研究的重要问题。
7.5.1 最优规划模型
任何规划问题都有两个基本问题,规划目标和约束条件。规划目标是规划方案优劣的准则。解决该类问题的方法就是最优规划问题。
线性规划问题:目标函数和约束条件都是线性的。
多目标规划问题:多目标如经济效益、社会效益、生态效益等都考虑都满足的模型。
7.5.2 最优区位模型
找出最优位置的模型。
单点选址模型:如建一水泥厂为10个城市服务,优化目标是总运费最省,这是最优厂址问题。多点选址模型:选择一个以上点的位置,使目标达到最优。
7.5.3 预测模型
用以预测系统或某一因子未来的发展趋势和状态。
分时间序列预测模型:线性趋势预测:xt=a+bt;二次多项式趋势预测:xt=a+bt+ct2;指数趋势预测:xt=aebt。其中,为系统要素,为时间。
马尔可夫预测模型:是预测事件发生概率的方法,根据目前状况预测其将来各个时期变动状况的一种方法。该预测模型建立在大量的统计数据的基础上。
7.5.4战略决策模型(层次分析法)
是一种将决策者队复杂系统的决策思维过程模型化、数量户的过程。运用该方法,决策者通过将复杂分解为若干层次和若干因素,在各因素之间进行简单的比较和计算,便可得出不同方案重要性程度的权值,为最佳方案的选择提供依据。具体方法步骤:
建立层次结构;构造判断矩阵;层次但排列;判断矩阵的一致性检验;层次总排序;层次总排序的一致性检验。
地理信息系统基础
7.5.5决策支持模型(任何对决策的制定有所贡献的信息系统)
7.6 数据挖掘与知识发现
7.6.1 数据挖掘问题的提出
计算机信息处理的发展过程经历了三次浪潮:第一次浪潮发生于60-70年代,代表技术是数据采集和数据库的产生;第二次浪潮发生于70-80年代,代表技术是数据组织、数据库中的信息检索和事务处理,标志是关系数据库管理系统的成熟和广泛应用。随着计算机辅助设计等新的应用领域的出现,要求模拟结构、模拟行为等高级操作,同时需要存储和处理大容量的数据,这是传统数据库技术难以适应的,从而产生了面向对象的数据模型,从而发生了第三次浪潮;第三次浪潮发生于80-90年代,代表技术是数据分布、多样性与共享等,产生了面向对象数据库、面向应用的数据库系统如空间数据库、多媒体数据库、知识库等。
数据库技术是计算机信息处理中最重要、应用最广泛的技术之一,已经深入到各个领域,有人统计全球信息以每20个月翻一番的速度增长,但现今的数据库大多数仍停留在对数据的查询检索阶段,数据库中隐藏的丰富的知识远远没有得到发掘和利用。“人们被数据淹没,但却饥饿于知识”。
如何迅速准确地获取其中有用的信息和知识,以预测模式和发展趋势、产生形象化的表示等,成了人们关注的问题。另一方面,在信息爆炸的时代,信息过量几乎成为人人需要面对的问题,如何才能不被信息的汪洋大海所淹没,从中发现有用的东西,提高信息的利用率呢?数据挖掘技术应运而生,数据挖掘这个提法最早出现在1989年8月的一次国际人工智能学术会议上,认为它是人工智能、知识工程、数据库技术、数理统计、可视化技术、并行计算技术相互结合的产物。数据库界已经开始反思,数据库应用仅仅是查询检索吗?数据库中隐藏的丰富的知识远远没有得到充分的挖掘和利用,数据库是否应该作为知识的来源?当然回答是肯定的。
7.6.2 数据挖掘技术的基本概念
数据挖掘,从统计学角度看,是指从搜索数据中进行分析。从数据库角度看,是指从数据中抽象模式或模型的过程。
数据挖掘是在计算机技术、互联网技术飞速发展,数据资源极大丰富,人们对分析处理如此海量数据日渐力不从心的情况下提出的,他综合了数据库技术、人工智能、专家系统、统计分析、模糊逻辑、模式识别、机器学习、人工神经网络、可视化等有关新技术与新理论,是多个学科交叉融合的产物,其目的是知识的提取。被认为是“从数据库中发现隐含的、先前不知道的、现在有用的信息,或者提取用户感兴趣的空间模式和特征、空间、非空间数据之间的普遍关系以及其他隐含在数据库中的数据特征。” 具体来说数据挖掘是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。数据挖掘是发现新知识和规律。数据挖掘又称数据库中的知识发现。
数据挖掘目的是把大量的原始数据转换成有价值的东西,用于描述过去的状况和预测未来的趋势。美国权威专家认为:“从数据中辨别有效的、新颖的、潜在有用的、最终可理解的模式的过程,包括数据选择(定义对象及其属性)、数据预处理、数据变换(指通过数学变换和降维技术进行特征提取)、数据发掘、模式评价等步骤”。
第七章
地理信息系统的应用
7.6.3 数据挖掘的研究内容与知识种类
⑴ 研究内容。因数据挖掘技术是交叉学科,其研究内容非常广泛。研究内容有理论基础、高效算法、不确定情况下的数据挖掘、数据仓库、可视化技术,定性定量互换模型、知识表示方法、知识的再利用、网络上的数据挖掘与知识发现、人机交互技术与地理信息系统集成等。
⑵ 知识类型。数据挖掘的所能发现的知识有以下几种:
广义性知识,根据数据的微观特性发现其表征的、带有普遍性的、较高层次概念的、中观和宏观的知识,既反映同类事物共同性质的知识;
分类性知识,反映同类事物共同性质的特征性知识和不同事物之间差异性特征知识; 关联性知识,反映事物之间依赖或关联的知识,可用于数据库中的归一化与查询优化; 预测性知识,根据历史和当前的数据推测未来数据。
偏离性知识,揭示事物偏离常规的异常现象,是对差异和极端特例的描述,如标准类外的特例、实际观测值和系统预测之间的显著差别等。
7.6.4 数据挖掘方法
数据挖掘的方法很多,主要有:
(1)统计分析方法:利用概率论与数理统计的原理对关系中各属性进行统计分析,从而找出它们之间的关系与规律。常用的统计方法有判别分析、因子分析、相关分析、主成分分析等,统计分析难以处理字符型数据。
(2)归纳演绎方法:归纳是从个别到一般,从部分到整体的推理过程。归纳学习是重要的数据挖掘与知识发现,它旨在对数据进行概括与综合,挖掘出以往不知道的规则和规律,归纳出高层次的模式或特征。即从大量的经验数据中归纳抽取一般的规则和模式。但归纳时,多数情况不可能考察全部有关的事例,因而不能保证归纳结果的完全正确性。因而归纳推理不具备保真性,是一种偶然性推理,或说是一种主观的不充分置信的推理。
演绎推理是从一般到个别的推理,他根据一般规则和已知事实提出结论,只要规则正确,前提为真,结论一定为真。演绎推理具有保真性,是一种必然性推理。
(3)聚类与分类分析方法:聚类分析是统计学的一个分支,他在数据库中能直接发现一些有意义的聚类结构,根据事物的特征对其进行聚类或分类,即所谓物以类聚,以其从中发现规律和典型模式。除传统的基于多元统计分析的聚类方法外,近年来模糊聚类和神经网络聚类方法有了长足的发展。
分类分析,就是通过分析数据库中的数据,为每个类别做出准确地描述或建立分析模型或挖掘出分类规则,然后用这个分类规则对其他数据库中的记录进行分类。如线性回归模型、决策书模型、神经网络模型等分类分析模型已在应用。
(4)遗传算法:仿效生物的进化与遗传,根据生存竞争、优胜劣汰的原则,借助复制、交换、突变等操作,使所要解决的问题从初始解一步步地逼近最优解,这是一种优化技术。
(5)决策树方法:根据信息论原理对数据库中存在的大量数据进行信息量分析,在计算数据特征的互信息的基础上提取出反映类别的重要特征。
(6)模糊数学方法:用隶属函数确定的隶属度描述不确定的属性数据,重在处理不精确的概率。是继经典数学、统计数学之后,在数学上的新发展。模糊性是客观存在的,当数据量越大而且复杂性越大时,对他进行精确描述的能力越低,就是说模糊性越强。在数据挖掘领域中主要是进行模糊综合判别、模糊聚类分析等。模糊方法对于同时含有模糊性与随机性的不确定性空间数据挖掘,只
374-
第二章空间数据的采集与质量第二章空间数据的采集与质量空间数据采集是构建GIS首要且重要的工作,是数据的管理、分析与输出的基础。地理信息系统应用的第一步就是集成不同来......
地理信息系统专业 2007级 《GIS原理与应用》 课堂实验报告长沙市数据采集、处理与制图目录1 概述 ...........................................................................
练习(一)一、判断题1、数据是客观对象的表示,而信息则是数据内涵的意义,是数据的内容和解释。2、信息具有主观性、适用性、可传输性和共享性等特征。3、从计算机技术在信息科......
尊敬的各位老师, 大家好:今天,我给大家讲的内容是护理基础学的第二十一章:给药中的“给药原则”这一部分。首先呢,我们一起回忆一下上一节课我们学过的有关给药的前一部分内容:(PP......
第一节 绪论第一单元基础心理学的研究对象及内容一心理学概述 1.心理学的定义研究心理现象发生、发展和活动规律的科学。心理学的研究领域基础理论:普通心理学、实验心理学、......