Chapter4-厦门大学-林子雨-大数据技术原理与应用-第四章-分布式数据库HBase
时间:2026-01-14
时间:2026-01-14
首先介绍了HBase的由来及其与关系数据库的区别,然后,介绍了HBase访问接口、数据模型、实现原理和运行机制,并在最后介绍了HBase编程实践方面的一些知识
《大数据技术原理与应用》http://www.77cn.com.cn/post/bigdata温馨提示:编辑幻灯片母版,可以修改每页PPT的厦大校徽和底部文字
第四章 分布式数据库HBase(PPT版本号:2015年6月第1.0版)林子雨 厦门大学计算机科学系 E-mail: ziyulin@http://www.77cn.com.cn 主页:http://www.77cn.com.cn/linziyu
《大数据技术原理与应用》 厦门大学计算机科学系
厦门大学计算机科学系
林子雨
2015年版 ziyulin@http://www.77cn.com.cn
首先介绍了HBase的由来及其与关系数据库的区别,然后,介绍了HBase访问接口、数据模型、实现原理和运行机制,并在最后介绍了HBase编程实践方面的一些知识
提纲
4.1 4.2 4.3 4.4 4.5 4.6
概述 HBase访问接口 HBase数据模型 HBase的实现原理 HBase运行机制 HBase编程实践
本PPT是如下教材的配套讲义: 21世纪高等教育计算机规划教材 《大数据技术原理与应用 ——概念、存储、处理、分析与应用》 (2015年6月第1版) 厦门大学 林子雨 编著,人民邮电出版社 ISBN:978-7-115-39287-9 欢迎访问《大数据技术原理与应用》教材官方网站: http://www.77cn.com.cn/post/bigdata《大数据技术原理与应用》 厦门大学计算机科学系 林子雨 ziyulin@http://www.77cn.com.cn
首先介绍了HBase的由来及其与关系数据库的区别,然后,介绍了HBase访问接口、数据模型、实现原理和运行机制,并在最后介绍了HBase编程实践方面的一些知识
4.1 概述 4.1.1 4.1.2 4.1.3 从BigTable说起 HBase简介 HBase与传统关系数据库的对比分析
《大数据技术原理与应用》
厦门大学计算机科学系
林子雨
ziyulin@http://www.77cn.com.cn
首先介绍了HBase的由来及其与关系数据库的区别,然后,介绍了HBase访问接口、数据模型、实现原理和运行机制,并在最后介绍了HBase编程实践方面的一些知识
4.1.1从BigTable说起 BigTable是一个分布式存储系统 利用谷歌提出的MapReduce分布式并行计算模型来处理海量数据 使用谷歌分布式文件系统GFS作为底层数据存储 采用Chubby提供协同服务管理 可以扩展到PB级别的数据和上千台机器,具备广泛应用性、可扩展性、 高性能和高可用性等特点 谷歌的许多项目都存储在BigTable中,包括搜索、地图、财经、打印、 社交网站Orkut、视频共享网站YouTube和博客网站Blogger等
《大数据技术原理与应用》
厦门大学计算机科学系
林子雨
ziyulin@http://www.77cn.com.cn
首先介绍了HBase的由来及其与关系数据库的区别,然后,介绍了HBase访问接口、数据模型、实现原理和运行机制,并在最后介绍了HBase编程实践方面的一些知识
4.1.2HBase简介HBase是一个高可靠、高性能、面向列、可伸缩的分布式数据库,是谷歌BigTable的 开源实现,主要用来存储非结构化和半结构化的松散数据。HBase的目标是处理非常 庞大的表,可以通过水平扩展的方式,利用廉价计算机集群处理由超过10亿行数据和 数百万列元素组成的数据表Hadoop生态系统 ETL工具 PigZookeeper
BI报表 Hive MapReduce
RDBMS Sqoop
HBase HDFS (Hadoop Distributed File System)
图4-1 Hadoop生态系统中HBase与其他部分的关系《大数据技术原理与应用》 厦门大学计算机科学系 林子雨 ziyulin@http://www.77cn.com.cn
Avro
首先介绍了HBase的由来及其与关系数据库的区别,然后,介绍了HBase访问接口、数据模型、实现原理和运行机制,并在最后介绍了HBase编程实践方面的一些知识
4.1.2HBase简介
表4-1 HBase和BigTable的底层技术对应关系 HBase
BigTable文件存储系统 海量数据处理 协同服务管理 GFS MapReduce Chubby HDFS Hadoop MapReduce Zookeeper
《大数据技术原理与应用》
厦门大学计算机科学系
林子雨
ziyulin@http://www.77cn.com.cn
首先介绍了HBase的由来及其与关系数据库的区别,然后,介绍了HBase访问接口、数据模型、实现原理和运行机制,并在最后介绍了HBase编程实践方面的一些知识
4.1.3HBase与传统关系数据库
的对比分析 HBase与传统的关系数据库的区别主要体现在以下几个方面: (1)数据类型:关系数据库采用关系模型,具有丰富的数据类型和 存储方式,HBase则采用了更加简单的数据模型,它把数据存储为未 经解释的字符串 (2)数据操作:关系数据库中包含了丰富的操作,其中会涉及复杂 的多表连接。HBase操作则不存在复杂的表与表之间的关系,只有简 单的插入、查询、删除、清空等,因为HBase在设计上就避免了复杂 的表和表之间的关系 (3)存储模式:关系数据库是基于行模式存储的。HBase是基于列 存储的,每个列族都由几个文件保存,不同列族的文件是分离的
《大数据技术原理与应用》
厦门大学计算机科学系
林子雨
ziyulin@http://www.77cn.com.cn
首先介绍了HBase的由来及其与关系数据库的区别,然后,介绍了HBase访问接口、数据模型、实现原理和运行机制,并在最后介绍了HBase编程实践方面的一些知识
4.1.3HBase与传统关系数据库的对比分析 HBase与传统的关系数据库的区别主要体现在以下几个方面: (4)数据索引:关系数据库通常可以针对不同列构 …… 此处隐藏:3899字,全部文档内容请下载后查看。喜欢就下载吧 ……