HBase Hive
用途: 弥补Hadoop的实时操作 减少并行计算编写工作的批处理系统
检索方式:适用于检索访问 适用于全表扫描
存储: 物理表 纯逻辑表
功能: HBase只负责组织文件 Hive既要储存文件又需要计算框架
执行效率:HBase执行效率高 Hive执行效率低
首先我们还是要明确概念, HDFS是什么,HDFS是分布式文件存储系统。 从他的定义里面我们抽出两个词, 分布式、文件存储系统。所以HDFS的核心功能就是为用户提供更加稳定合理的文件存储方式。
而HBase是什么呢,HBase是一个分布式列式数据库。从它的定义里面我们可以得出 分布式、列式、数据库几个关键词。 它首先是作为一个依托于HDFS存在的NoSql数据库,既然是一个数据库那里面存什么东西就是我们所决定的了。 HBase本身对于非结构化数据支持良好,我们同样可以将小文件直接存储到HBase,也可以存储其他数据 这两者并不违和。