hadoop分布式集群配置hbase数据库@慕课网原创_慕课网

注意：

之前的章节配置好了完全分布式hadoop集群，共有三台机器，master， slave01, slave02，下面开始配置hbase

首先说明一点，hbase是依赖于zookeeper的进行运行的，所以在部署hbase之前需要先进行部署zookeeper，但是，hbase中自带了默认的zookeeper，如果不需要自己手动部署zookeeper 的话，可以选择hbase自带默认的，主要原因方便，简单。

接下来开始部署。（亲测可用，我部署完了之后为了不忘记，就整理了一下）

一、下载hbase安装包

下载链接：http://archive.apache.org/dist/hbase/

找个版本下载下来然后解压。我选择的是 2.0.0-alpha-3版本。解压到服务器，和我之前的hadoop放在同一个目录了。

二、配置hbase的环境变量：HBASE_HOME、hbase-env.sh

1.编辑vi /etc/profile文件加入hbase的环境变量

2.进入hbase的配置文件目录conf： cd opt/modules/hbase/conf/, 打开hbase-env.sh文件

将java jdk的路径加入进去：export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_161

顺便在此文件中，去掉注释 #export HBASE_MANAGES_ZK=true, 使用hbase自带的zookeeper。

三、配置hbase-site.xml文件

此文件还是在hbase的conf配置文件夹下，配置信息如下：

<configuration>
    <property>
        <name>hbase.rootdir</name>
        <value>hdfs://master:9000/hbase</value>
    </property>
    
    <property>
        <name>hbase.cluster.distributed</name>
        <value>true</value>
    </property>
    
    <property>
        <name>hbase.master</name>
        <value>master:60000</value>
    </property>
    <property>
        <name>hbase.tmp.dir</name>
        <value>/opt/modules/hbase/tmp</value>
    </property>

    
    
    <property>
        <name>hbase.client.write.buffer</name>
        <value>5242880</value>
    </property>
    
    <property>
        <name>hbase.regionserver.handler.count</name>
        <value>20</value>
    </property>
    
    <property>
        <name>hbase.hregion.max.filesize</name>
        <value>134217728</value>
    </property>
    
    <property>
        <name>hbase.hregion.majorcompaction</name>
        <value>0</value>
    </property>
    
    <property>
        <name>dfs.replication</name>
        <value>2</value>
    </property>
    
    <property>
        <name>hbase.regionserver.region.split.policy</name>
        <value>org.apache.hadoop.hbase.regionserver.ConstantSizeRegionSplitPolicy</value>
    </property>
    
    <property>
        <name>hbase.regionserver.optionalcacheflushinterval</name>
        <value>7200000</value>
    </property>
    
    <property>
        <name>hfile.block.cache.size</name>
        <value>0.3</value>
    </property>
    
    <property>
        <name>hbase.hregion.memstore.flush.size</name>
        <value>52428800</value>
    </property>
    
    <property>
        <name>hbase.regionserver.global.memstore.size</name>
        <value>0.5</value>
    </property>
    
    <property>
        <name>hbase.regionserver.global.memstore.size.lower.limit</name>
        <value>0.5</value>
    </property>
    
    <property>
        <name>dfs.client.socket-timeout</name>
        <value>600000</value>
    </property>

    
    <property>
        <name>hbase.table.sanity.checks</name>
        <value>false</value>
    </property>
    
    <property>
    
        <name>zookeeper.session.timeout</name>
        <value>30000</value>
    </property>
    
    <property>
        <name>hbase.zookeeper.quorum</name>
        <value>master:2181,slave01:2181,slave02:2181</value>
    </property>
    <property>
        <name>hbase.zookeeper.property.dataDir</name>
        <value>/opt/modules/zookeeper/data</value>
    </property>
</configuration>

----------------------------------------------配置信息结束------------------------

四、配置regionservers

1.编辑vi /opt/modules/hbase/conf/regionservers文件，去掉默认的localhost, 不能注释掉，不认注释，删掉就行

加入master， slave01， slave02保存退出。

2.然后通过把在master上配置好的hbase，通过远程复制命令scp到slave01和slave02机器上

scp -r /opt/modules/hbase slave01:/opt/modules/

scp -r /opt/modules/hbase slave02:/opt/modules/

五、启动与停止hbase

1.在hadoop已经正常启动的基础上，进入hbase/bin目录，执行start-hbase.sh文件启动hase

输入jps查看是否已经启动成功, hadoop-script.sh jps 脚本命令是我自己写的脚本，可以同时查看三台机器的jps命令

停止命令是stop-hbase.sh.

我自己的hadoop-script.sh的脚本

你们改改就可以用了

    #!/bin/bash

    params=$@

    echo ==========master $params=============
    ssh master "$params"
    echo ==========slave01 $params=============
    ssh slave01 "$params"
    echo ==========slave02 $params=============

ssh slave02 "$params"

----------------------完成----------------------

原文出处