HBase
课程目标
1、Hbase的应用场景及特点(为什么要学习这门技术,在业务场景中能够解决什么问题、提供什么样的服务)
2、habse架构体系与设计模型(架构体系:包含哪些进程、进程与进程之间的关系、Hbase服务于其他大数据服务之间的关系和依赖)(设计模型:hbase表结构的模型、表数据的模型)
HBase的应用场景及特点
场景:交通,金融,电商,移动
1.海量数据存储(容量大);存储上百亿行*上百亿列
2.准实时查询
3.面向列(每一个列进行动态增加)
4.多版本:HBase每一个列的书库存储有多个Version
5.稀疏性:为空的列并不占存储空间
6.扩展性:底层依赖于HDFS
7.高可靠性:基于HDFS数据存储
8.高性能:底层的LSM数据结构和Rowkey有序排列等架构上的独特设计,使得Hbase具有非常高的写入性能
Hbase的概念与定位
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。
[1] Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。
Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。

Hbase架构体系与设计模型:表数据;表结构

表结构:指定标的列簇(动态增加)

HBase的安装部署

HBase shell使用