这两个模块是可以互相替换的 还是啥?
首先我们还是要明确概念, HDFS是什么,HDFS是分布式文件存储系统。 从他的定义里面我们抽出两个词, 分布式、文件存储系统。所以HDFS的核心功能就是为用户提供更加稳定合理的文件存储方式。
而HBase是什么呢,HBase是一个分布式列式数据库。从它的定义里面我们可以得出 分布式、列式、数据库几个关键词。 它首先是作为一个依托于HDFS存在的NoSql数据库,既然是一个数据库那里面存什么东西就是我们所决定的了。 HBase本身对于非结构化数据支持良好,我们同样可以将小文件直接存储到HBase,也可以存储其他数据 这两者并不违和。
Hbase基于HDFS实现
hbase可以存小文件,结构,非结构数据,hdfs 适合储存大文件