容量大:百万列行
面向列:列式存储,面向列权限控制,独立检索。实时动态增加列
多版本:每一列数据存储有多个版本
稀疏性:空的列不占用存储空间,表可以设计的很稀疏
扩展性:底层依赖HDFS。动态增加datanode,不需要迁移
高可靠性:WAL机制保证数据写入不会因为集群异常导致丢失。HDFS本身也有备份
高性能:底层LSM数据结构和Rowkey有序排列架构设计。写入性能高。以树节点相互合并由下往上。region切分,索引和缓存机制使hbase具备随机读取性能
Hbase的特点
HBase的高性能
Hbase 的高扩展性,底层依赖HDFS当存储空间不足时可以动态增加DataNode节点。
高可用 底层依赖HDFS 自动备份
高性能 写入性能:底层LSM数据结构和RowKey有序排列在架构上的独特设计。
region切分、主键索引和缓存机制使得Hbase在海量数据下具备一定随机读取性能,该性能针对TRowKey的查询能达到毫秒级别
Hbase 是面向列的存储,支持独立检索。列式存储其数据在表中是按照列存储的可以动态增加列
HBase 高可靠性
HBase 容量大
hbase的特点
容量大:hbase单表可以有百亿行、百万列,数据矩阵横向和纵向两个纬度所支持的数据量级都非常具有弹性
面向列:hbase是面向列的存储和权限控制,并支持独立检索。列式存储,其数据在表中是按照某列存储的,这样在查询只需要少数几个字段的时候,能大大减少读取的数据量
多版本:hbase每一个列的数据存储有多个version
稀疏性:为空的列并不占用存储空间,表可以设计的非常稀疏
扩展性:底层依赖于hdfs
高可靠性:WAL机制保证了数据写入时不会因集群异常而导致写入数据丢失:Replication机制保证了在集群出现严重的问题时,数据不会发生丢失或损坏。而且hbase底层使用hdfs,hdfs本身也有备份
高性能:底层的LSM数据结构和Rowkey有序排序等架构上的独特设计,使得hbase具有非常高的写入性能。region切分、主键索引和缓存机制使得hbase在海量数据下具备一定的随机读取性能,该性能针对Rowkey的查询能够到达毫秒级别
HBase的特点
1、容量大2、面向列3、多版本4、稀疏性5、扩展性6、高可靠性
7、高性能
底层的LSM数据结构和Rowkey有序排列等结构上的独特设计,使得HBase具有非常高的写入性能。region切分、主键索引和缓存机制使得HBase在海量数据下具备一定的随机读取性能。
HBase采用列式存储,支持独立检索。HBase每一列都存储有多个版本。空的列并不占用存储空间。基于HDFS,高扩展性,高可靠性(多个副本)。高性能(写入&读取)。
HBase的特点
1、容量大
HBase单表可以有百亿行、百万列,数据矩阵横向和纵向两个纬度所支持的数据量级都非常具有弹性
2、面向列
HBase是面向列的存储和权限控制,并支持独立检索。列式存储,其数据在表中是按照某列存储的,这样在查询只需要少数几个字段的时候,能大大减少读取的数据量。
3、多版本
HBase每一个列的数据存储有多个Version
4、稀疏性
为空的列并不占用存储空间,表可以设计的非常稀疏
5、扩展性
底层依赖于HDFS
6、高可靠性
WAL机制保证了数据写入时不会因集群异常而导致写入数据丢失:Replication机制保证了在集群出现严重的问题时,数据不会发生丢失或损坏。而且HBase底层使用HDFS HDFS本身也有备份。
7、高性能
底层的LSM数据结构和Rowkey有序排列等结构上的独特设计,使得HBase具有非常高的写入性能。region切分、主键索引和缓存机制使得HBase在海量数据下具备一定的随机读取性能,该性能针对Rowkey的查询能够达到毫秒级别
HBase的特点
1、容量大
HBase单表可以有百亿行、百万列,数据矩阵横向和纵向两个纬度所支持的数据量级都非常具有弹性
2、面向列
HBase是面向列的存储和权限控制,并支持独立检索。列式存储,其数据在表中是按照某列存储的,这样在查询只需要少数几个字段的时候,能大大减少读取的数据量。
3、多版本
HBase每一个列的数据存储有多个Version
4、稀疏性
为空的列并不占用存储空间,表可以设计的非常稀疏
5、扩展性
底层依赖于HDFS
6、高可靠性
WAL机制保证了数据写入时不会因集群异常而导致写入数据丢失:Replication机制保证了在集群出现严重的问题时,数据不会发生丢失或损坏。而且HBase底层使用HDFS HDFS本身也有备份。
7、高性能
底层的LSM数据结构和Rowkey有序排列等结构上的独特设计,使得HBase具有非常高的写入性能。region切分、主键索引和缓存机制使得HBase在海量数据下具备一定的随机读取性能,该性能针对Rowkey的查询能够达到毫秒级别
Hbase的特点
1、容量大:Hbase单表可以有百亿行、百万列,数据矩阵横向和纵向两个维度所支持的数量级都非常有弹性
2、面向列:Hbase是面向列的存储和权限控制、并支持独立检索。列式存储,其数据在表中是按照某列存储的,这样在查询只需要少数几个字段的时候,能够大大减少读取的数据量(关系型数据库是,先将列定义好,然后写数据,hbase的列是可以动态增加的)
3、多版本:Hbase每一个列的数据存储有多个version
4、稀疏性:为空的列不占用存储空间、表可以设计的非常稀疏
5、扩展性:底层依赖于HDFS(分布式文件系统)
6、高可靠性: WAL机制保证了数据写入时不会因集群异常而导致写入数据丢失:Replication机制保证了在集群出现严重的问题时,数据不会发生丢失或损坏.而且HBase底层使用HDFS HDFS本身也有备份.
7、高性能:底层的LSM数据结构和Rowkey有序排列等架构上的独特设计,使得HBase具有非常高的写入性能.region切分、主键索引和缓存机制使得HBase在海量数据下具备一定的随机读取性能,改性能针对Rowkey的查询能够达到毫秒级别.
we usually have a table of fewer than 3 million rows and fewer than 30 fields in a relational database system
hbase高性能
habase高可靠性
hbase的特点
1、容量大:hbase单表可以有百亿行、百万列,数据矩阵横向和纵向两个维度所支持的数量级都非常有弹性
2、面向列:hbase是面向列的存储和权限控制、并支持独立检索。列式存储,其数据在表中是按照某列存储的,这样在查询只需要少数几个字段的时候,能够大大减少读取的数据量(关系型数据库是,先将列定义好,然后写数据,hbase的列是可以动态增加的)
3、多版本:hbase每一个列的数据存储有多个version
4、稀疏性:为空的列不占用存储空间、表可以设计的非常稀疏
5、扩展性:底层依赖于HDFS(分布式文件系统)
容量大
面向列
多版本
稀疏性,为空的列不占用存储空间
扩展性(底层依赖HDFS)
高可靠行(Replication以及底层的HDFS也有备份)
高性能(写:LSM数据结构;读:rowKey有序排列,region切分、主键索引和缓存机制)。
列动态增加
底层的LSM数据结构和Rowkey有序排序等设计,保证了高写入性能。
region切分、主键索引和缓存机制保证了hbase的随即读取性能。
扩展性:依赖hdfs ,可以动态增加DataNode节点
针对hbase数据库的稀疏性,非常好的对比描述
为空的列不占用存储空间