一、安装Java
在安装Hadoop前,需要先安装Java。可以通过以下命令检查本机是否已安装Java:
java -version
如果已安装,则输出Java的版本信息。如果未安装,则可以通过以下命令安装:
sudo apt-get update sudo apt-get install default-jdk
需要注意的是,Hadoop官方推荐使用Java 8或更高版本。
二、下载和安装Hadoop
可以从Hadoop官网下载最新版的Hadoop,下载完成后,需要解压和移动到合适的位置。以下是具体步骤:
- 下载Hadoop:https://hadoop.apache.org/releases.html
- 解压Hadoop:
tar -xzvf hadoop-x.y.z.tar.gz
- 移动Hadoop到合适的位置:
sudo mv hadoop-x.y.z /usr/local/hadoop
三、配置Hadoop
1. 配置环境变量
需要将Hadoop添加到系统的环境变量中,才能在任何位置运行Hadoop命令。以下是具体步骤:
- 打开bashrc文件:
nano ~/.bashrc
- 在文件底部添加以下代码,并保存:
export HADOOP_HOME=/usr/local/hadoop export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
- 使配置文件生效:
source ~/.bashrc
2. 修改配置文件
需要修改Hadoop的配置文件以使其在本机上运行。以下是具体步骤:
- 打开配置文件:
nano /usr/local/hadoop/etc/hadoop/hadoop-env.sh
- 找到以下代码行:
- 保存文件并关闭。
- 打开另一个配置文件:
nano /usr/local/hadoop/etc/hadoop/core-site.xml
- 在<configuration>标签段落中添加以下代码:
- 保存文件并关闭。
- 打开另一个配置文件:
nano /usr/local/hadoop/etc/hadoop/hdfs-site.xml
- 在<configuration>标签段落中添加以下代码:
- 保存文件并关闭。
# export JAVA_HOME=${JAVA_HOME}
将其修改为:
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
<property> <name>fs.default.name</name> <value>hdfs://localhost:9000</value> </property>
<property> <name>dfs.replication</name> <value>1</value> </property>
四、启动Hadoop
安装和配置完成后,就可以启动Hadoop。以下是具体步骤:
- 格式化Hadoop文件系统:
hdfs namenode -format
- 启动Hadoop:
start-all.sh
- 检查Hadoop是否运行成功,通过以下地址访问Hadoop管理面板:
http://localhost:50070/