一、安装JDK
1、访问Oracle网站下载JDK rpm包:https://www.oracle.com/java/technologies/javase-jdk8-downloads.html
2、使用命令安装JDK:
sudo rpm -ivh jdk-8u231-linux-x64.rpm
3、编辑.bash_profile文件:
export JAVA_HOME=/usr/java/jdk1.8.0_231-amd64
export CLASSPATH=.:${JAVA_HOME}/lib/dt.jar:${JAVA_HOME}/lib/tools.jar
export PATH=${JAVA_HOME}/bin:${PATH}
二、安装Hadoop
1、访问Apache官网:https://hadoop.apache.org/
2、下载Hadoop源码包,选择适合自己的版本:
wget https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-3.2.1/hadoop-3.2.1-src.tar.gz
3、解压并移动到目标目录:
tar –zxvf hadoop-3.2.1-src.tar.gz
sudo mv hadoop-3.2.1 /opt/hadoop
4、配置hadoop-env.sh文件:
sudo vi /opt/hadoop/etc/hadoop/hadoop-env.sh
添加以下内容:
export JAVA_HOME=/usr/java/jdk1.8.0_231-amd64
5、编辑core-site.xml文件:
sudo vi /opt/hadoop/etc/hadoop/core-site.xml
添加以下内容:
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/hadoop/hadoop.tmp</value>
</property>
</configuration>
6、编辑hdfs-site.xml文件:
sudo vi /opt/hadoop/etc/hadoop/hdfs-site.xml
添加以下内容:
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/opt/hadoop/namenode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/opt/hadoop/datanode</value>
</property>
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>localhost:9001</value>
</property>
</configuration>
7、格式化文件系统:
hdfs namenode -format
8、启动Hadoop:
start-all.sh
三、安装HBase
1、访问Apache官网:https://hbase.apache.org/
2、下载HBase二进制包,选择适合自己的版本:
wget https://mirrors.tuna.tsinghua.edu.cn/apache/hbase/2.4.6/hbase-2.4.6-bin.tar.gz
3、解压并移动到目标目录:
tar –zxvf hbase-2.4.6-bin.tar.gz
sudo mv hbase-2.4.6 /opt/hbase
4、配置hbase-env.sh文件:
sudo vi /opt/hbase/conf/hbase-env.sh
添加以下内容:
export JAVA_HOME=/usr/java/jdk1.8.0_231-amd64
export HBASE_MANAGES_ZK=true
5、编辑hbase-site.xml文件:
sudo cp /opt/hbase/conf/hbase-site.xml /opt/hbase/conf/hbase-site.xml.bak
sudo vi /opt/hbase/conf/hbase-site.xml
添加以下内容:
<configuration>
<property>
<name>hbase.rootdir</name>
<value>hdfs://localhost:9000/hbase</value>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>localhost:2181</value>
</property>
</configuration>
6、启动HBase:
/opt/hbase/bin/start-hbase.sh
四、管理HBase
1、HBase Shell基础命令:
hbase shell //进入HBase Shell
status //查看HBase状态
version //查看HBase版本
list //列出所有的表格名称
create ‘table_name’, ‘column family1’, ‘column family2’…
//创建表格
disable ‘table_name’ //禁用表格
enable ‘table_name’ //启用表格
alter ‘table_name’, NAME => ‘new_name’
//重命名表格
describe ‘table_name’//详细描述表格
put ‘table_name’, ‘rowkey_name’, ‘column family1:qualifier1’, ‘value1’, timestamp
//插入数据
get ‘table_name’, ‘rowkey_name’
//获取数据
delete ‘table_name’, ‘rowkey_name’, ‘column family1:qualifier1’, timestamp
//删除数据
deleteall ‘table_name’, ‘rowkey_name’, ‘column family1’
//删除行
drop ‘table_name’ //删除表格
exit //退出HBase Shell
2、Hadoop HDFS命令:
hdfs dfs -ls / //查看Hadoop文件系统的根目录
hdfs dfs –mkdir /hbase //创建HDFS目录
hadoop fs –chmod +w /hbase //更改HDFS目录的权限
hdfs dfs -rmr /hbase //删除HDFS目录
hadoop fs -du –h /hbase //查看HDFS目录下的文件大小