本章介绍如何安装和初始配置HBase。 Java和Hadoop是需要Hbase的前提,因此,必须先下载并安装java和Hadoop。
1.安装Hadoop 及 Hbase 注意事项
HBase依赖于Hadoop,它在其lib目录下放了一个Hadoop JAR 文件。 需要注意的是,集群中使用的Hadoop版本与HBase使用的版本相匹配。 使用集群上运行的hadoop-xyz.jar替换HBase lib目录中的Hadoop JAR,以避免版本不匹配问题。 确保在集群中运行HBase的所有节点上替换JAR文件。
2. 安装HBase
可以在以下三种模式中的任何一种中安装HBase:Standalone mode, Pseudo Distributed mode 和 Fully Distributed mode。
在Standalone mode下安装HBase
使用“wget”命令从http://mirror.bit.edu.cn/apache/hbase/2.0.1/hbase-2.0.1-bin.tar.gz 下载最新稳定版本的HBase,并使用tar“zxvf”命令将其解压缩。 请参阅以下命令:
$ cd usr / local / $ wget http://mirror.bit.edu.cn/apache/hbase/2.0.1/hbase-2.0.1-bin.tar.gz $ tar -zxvf hbase-0.98.8-hadoop2-bin.tar.gz
切换到super user,将HBase文件夹移动到/ usr / local,如下所示。
mv hbase-2.0.1 / * Hbase /
在使用HBase之前,编辑以下文件并配置Hbase;
hbase-env.sh
设置JAVA Home ,打开hbase-env.sh文件。 编辑JAVA_HOME, 如下所示:
cd / usr / local / Hbase / conf
vi hbase-env.sh
设置 JAVA_HOME,
export JAVA_HOME = / usr / lib / jvm / java-1.7.0
HBase-site.xml
Hbase-site.xml是HBase的配置文件。切换到/ usr / local / Hbase目录,在conf文件夹中,打开hbase-site.xml文件,如下所示:
#cd / usr / local / HBase / #cd conf #vi hbase-site.xml
在hbase-site.xml文件中,找到<configuration>和</ configuration>标记。设置“hbase.rootdir”的路径:
<configuration> //Here you have to set the path where you want HBase to store its files. <property> <name>hbase.rootdir</name> <value>file:/home/hadoop/HBase/HFiles</value> </property> //Here you have to set the path where you want HBase to store its built in zookeeper files. <property> <name>hbase.zookeeper.property.dataDir</name> <value>/home/hadoop/zookeeper</value> </property> </configuration>
到此,HBase安装和配置部分就顺利完成。可以使用HBase的bin文件夹中提供的start-hbase.sh脚本启动HBase。如下所示:
$ cd / usr / local / HBase / bin $/ start-hbase.sh
如果安装顺利,当运行HBase启动脚本时,会有如下提示:
starting master, logging to /usr/local/HBase/bin/../logs/hbase-tpmaster-localhost.localdomain.out
3. 在Pseudo Distributed mode 下安装HBase
下面将介绍如何在伪分布式模式下安装Hbase,在使用HBase之前,在本地系统或远程系统上配置Hadoop和HDFS,并确保它们正在运行。
Hbase-site.xml
编辑hbase-site.xml文件以添加以下属性:
<property> <name>hbase.cluster.distributed</name> <value>true</value> </property>
设置hbase.rootdir属性,使用hdfs://// URI语法, 即HDFS 文件系统地址:
<property> <name>hbase.rootdir</name> <value>hdfs://localhost:8030/hbase</value> </property>
启动HBase
配置结束后,使用以下命令启动Hbase:
$ cd / usr / local / HBase $./ start-hbase.sh
注意:在启动HBase之前,请确保Hadoop正在运行。
检查HDFS中的HBase目录
HBase在HDFS中创建其目录。 要查看创建的目录,使用以下命令:
$ ./bin/hadoop fs -ls / hbase drwxr-xr-x - hbase users 0 2014-06-25 18:58 /hbase/.tmp drwxr-xr-x - hbase users 0 2014-06-25 21:49 /hbase/WALs drwxr-xr-x - hbase users 0 2014-06-25 18:48 /hbase/corrupt drwxr-xr-x - hbase users 0 2014-06-25 18:58 /hbase/data -rw-r--r-- 3 hbase users 42 2014-06-25 18:41 /hbase/hbase.id -rw-r--r-- 3 hbase users 7 2014-06-25 18:41 /hbase/hbase.version drwxr-xr-x - hbase users 0 2014-06-25 21:49 /hbase/oldWALs
启动和停止Master
使用“local-master-backup.sh”,最多可以启动10台服务器。 打开HBase的主文件夹,执行以下命令启动:
$ ./bin/local-master-backup.sh 2 4
要终止backup master,需要其进程ID,该ID存储在名为“/tmp/hbase-USER-X-master.pid”的文件中,可以使用以下命令终止 backup master:
$ cat /tmp/hbase-user-1-master.pid | xargs kill -9
启动和停止RegionServers
可以使用以下命令运行多个Region Server:
$ .bin / local-regionservers.sh start 2 3
要停止Region Server,使用以下命令:
$ .bin / local-regionservers.sh stop 3
启动HBase Shell
使用以下命令启动HBase shell:
$ cd bin $./ hbase shell 2014-12-09 14:24:27,526 INFO [main] Configuration.deprecation: hadoop.native.lib is deprecated. Instead, use io.native.lib.available HBase Shell; enter 'help<RETURN>' for list of supported commands. Type "exit<RETURN>" to leave the HBase Shell Version 0.98.8-hadoop2, r6cfc8d064754251365e070a10a82eb169956d5fe, Fri Nov 14 18:26:29 PST 2014 hbase(main):001:0>
HBase Web界面
要访问HBase的Web界面,请在浏览器中键入以下URL:
http://localhost:60010
在该Hbase Web界面上,可以查看当前运行的Region Server,backup Master和Hbase table。
HBase Region Server和Backup Masters如下图所示:
Hbase Table如下图所示: