电子商务教案7(18)
发布时间:2021-06-06
发布时间:2021-06-06
7.3.2 数据仓库
1. 数据仓库的概念
目前,数据仓库一词尚没有一个统一的定义。“数据仓库之父”William.H.Inmon在1993年时任Prism Solutions公司副总裁在其著作《Building the Data Warehouse》(《构建数据库》)一书中给与如下描述:“数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。”
斯坦福大学数据仓库研究小组给数据仓库下的定义是:“数据仓库是集成信息的存储中心,这些信息可用于查询或分析。”、“数据仓库是作为DSS服务基础的分析型数据库,用来存放大容量的只读数据,为制定决策提供所需的信息。”、 “数据仓库是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的、面向主题及不可更新的数据集合。”1995年2月,由A·Silberschatz、M·Stonebraker和J·Ullman等著名专家发表的一份权威性报告《数据库研究:面向21世纪的机遇与成就》,重点讨论了数据仓库和数据挖掘问题,把数据仓库定义为:“来自一个或多个数据库的数据的拷贝”,指出了数据仓库最根本的特点,即物理地存放数据,而且这些数据并非最新、专有的,而是来源于其他数据库。
虽然对数据仓库的定义至今尚存在分歧,但业内比较认同的W.H. Inmon关于数据仓库定义,它可以从两个层次予以理解:首先数据仓库用于支持决策,面向分析型数据处理,不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,且存放在数据仓库中的数据一般不修改。
2 数据仓库的主要特点
数据仓库最根本的特点是物理地存放数据,而且这些数据并不是最新的、专有的,而是来源于其他数据库的。数据仓库的建立并不是要取代数据库,它要建立在一个较全面和完善的信息应用的基础上,用于支持高层决策分析,而事务处理数据库在企业的信息环境中承担的是日常操作性的任务。W.H. Inmon的数据仓库定义涵盖了几个基本要素:即主题性、集成性、稳定性及时间相关性。以这些基本要素为核心,构成了数据仓库的四个主要特点:
(1) 数据仓库是面向主题的。
操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关,主题域在数据仓库中表现为一系列相关联的表,共同的关键值将同一主题域内所有数据联系在一起。比如银行中的机构、客户、账号、汇率等即为相应的一批主题域。
(2) 数据仓库是集成的。
操作型数据库定义的数据难免会出现不同程度的不一致,如编码、命名、属性、键值等。而数据仓库在录入数据时,不论数据来源于何处,都必须按照统一的结构和编码
上一篇:特色学校古诗文诵读