Chapter4-厦门大学-林子雨-大数据技术原理与应用-第四章-分布式数据库HBase

时间:2026-01-14

首先介绍了HBase的由来及其与关系数据库的区别,然后,介绍了HBase访问接口、数据模型、实现原理和运行机制,并在最后介绍了HBase编程实践方面的一些知识

《大数据技术原理与应用》http://www.77cn.com.cn/post/bigdata温馨提示:编辑幻灯片母版,可以修改每页PPT的厦大校徽和底部文字

第四章 分布式数据库HBase(PPT版本号:2015年6月第1.0版)林子雨 厦门大学计算机科学系 E-mail: ziyulin@http://www.77cn.com.cn 主页:http://www.77cn.com.cn/linziyu

《大数据技术原理与应用》 厦门大学计算机科学系

厦门大学计算机科学系

林子雨

2015年版 ziyulin@http://www.77cn.com.cn

首先介绍了HBase的由来及其与关系数据库的区别,然后,介绍了HBase访问接口、数据模型、实现原理和运行机制,并在最后介绍了HBase编程实践方面的一些知识

提纲

4.1 4.2 4.3 4.4 4.5 4.6

概述 HBase访问接口 HBase数据模型 HBase的实现原理 HBase运行机制 HBase编程实践

本PPT是如下教材的配套讲义: 21世纪高等教育计算机规划教材 《大数据技术原理与应用 ——概念、存储、处理、分析与应用》 (2015年6月第1版) 厦门大学 林子雨 编著,人民邮电出版社 ISBN:978-7-115-39287-9 欢迎访问《大数据技术原理与应用》教材官方网站: http://www.77cn.com.cn/post/bigdata《大数据技术原理与应用》 厦门大学计算机科学系 林子雨 ziyulin@http://www.77cn.com.cn

首先介绍了HBase的由来及其与关系数据库的区别,然后,介绍了HBase访问接口、数据模型、实现原理和运行机制,并在最后介绍了HBase编程实践方面的一些知识

4.1 概述 4.1.1 4.1.2 4.1.3 从BigTable说起 HBase简介 HBase与传统关系数据库的对比分析

《大数据技术原理与应用》

厦门大学计算机科学系

林子雨

ziyulin@http://www.77cn.com.cn

首先介绍了HBase的由来及其与关系数据库的区别,然后,介绍了HBase访问接口、数据模型、实现原理和运行机制,并在最后介绍了HBase编程实践方面的一些知识

4.1.1从BigTable说起 BigTable是一个分布式存储系统 利用谷歌提出的MapReduce分布式并行计算模型来处理海量数据 使用谷歌分布式文件系统GFS作为底层数据存储 采用Chubby提供协同服务管理 可以扩展到PB级别的数据和上千台机器,具备广泛应用性、可扩展性、 高性能和高可用性等特点 谷歌的许多项目都存储在BigTable中,包括搜索、地图、财经、打印、 社交网站Orkut、视频共享网站YouTube和博客网站Blogger等

《大数据技术原理与应用》

厦门大学计算机科学系

林子雨

ziyulin@http://www.77cn.com.cn

首先介绍了HBase的由来及其与关系数据库的区别,然后,介绍了HBase访问接口、数据模型、实现原理和运行机制,并在最后介绍了HBase编程实践方面的一些知识

4.1.2HBase简介HBase是一个高可靠、高性能、面向列、可伸缩的分布式数据库,是谷歌BigTable的 开源实现,主要用来存储非结构化和半结构化的松散数据。HBase的目标是处理非常 庞大的表,可以通过水平扩展的方式,利用廉价计算机集群处理由超过10亿行数据和 数百万列元素组成的数据表Hadoop生态系统 ETL工具 PigZookeeper

BI报表 Hive MapReduce

RDBMS Sqoop

HBase HDFS (Hadoop Distributed File System)

图4-1 Hadoop生态系统中HBase与其他部分的关系《大数据技术原理与应用》 厦门大学计算机科学系 林子雨 ziyulin@http://www.77cn.com.cn

Avro

首先介绍了HBase的由来及其与关系数据库的区别,然后,介绍了HBase访问接口、数据模型、实现原理和运行机制,并在最后介绍了HBase编程实践方面的一些知识

4.1.2HBase简介

表4-1 HBase和BigTable的底层技术对应关系 HBase

BigTable文件存储系统 海量数据处理 协同服务管理 GFS MapReduce Chubby HDFS Hadoop MapReduce Zookeeper

《大数据技术原理与应用》

厦门大学计算机科学系

林子雨

ziyulin@http://www.77cn.com.cn

首先介绍了HBase的由来及其与关系数据库的区别,然后,介绍了HBase访问接口、数据模型、实现原理和运行机制,并在最后介绍了HBase编程实践方面的一些知识

4.1.3HBase与传统关系数据库

的对比分析 HBase与传统的关系数据库的区别主要体现在以下几个方面: (1)数据类型:关系数据库采用关系模型,具有丰富的数据类型和 存储方式,HBase则采用了更加简单的数据模型,它把数据存储为未 经解释的字符串 (2)数据操作:关系数据库中包含了丰富的操作,其中会涉及复杂 的多表连接。HBase操作则不存在复杂的表与表之间的关系,只有简 单的插入、查询、删除、清空等,因为HBase在设计上就避免了复杂 的表和表之间的关系 (3)存储模式:关系数据库是基于行模式存储的。HBase是基于列 存储的,每个列族都由几个文件保存,不同列族的文件是分离的

《大数据技术原理与应用》

厦门大学计算机科学系

林子雨

ziyulin@http://www.77cn.com.cn

首先介绍了HBase的由来及其与关系数据库的区别,然后,介绍了HBase访问接口、数据模型、实现原理和运行机制,并在最后介绍了HBase编程实践方面的一些知识

4.1.3HBase与传统关系数据库的对比分析 HBase与传统的关系数据库的区别主要体现在以下几个方面: (4)数据索引:关系数据库通常可以针对不同列构 …… 此处隐藏:3899字,全部文档内容请下载后查看。喜欢就下载吧 ……

Chapter4-厦门大学-林子雨-大数据技术原理与应用-第四章-分布式数据库HBase.doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:4.9 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:19元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219