Linux云服务器安装Hadoop全攻略

在大数据时代，Hadoop作为分布式计算框架的核心组件，成为企业处理海量数据的首选方案。本文将详细介绍如何在Linux云服务器上安装Hadoop，帮助您快速搭建大数据处理环境。

一、准备工作

在开始安装前，需要准备以下内容：

首先更新系统并安装必要软件：

sudo apt-get update
sudo apt-get install -y ssh pdsh

Hadoop依赖Java运行环境：

sudo apt-get install -y openjdk-8-jdk
java -version  # 验证安装

Hadoop集群节点间需要SSH免密通信：

ssh-keygen -t rsa
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 0600 ~/.ssh/authorized_keys

下载并解压Hadoop安装包：

wget https://archive.apache.org/dist/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz
tar -xzvf hadoop-3.3.1.tar.gz
mv hadoop-3.3.1 /usr/local/hadoop

编辑~/.bashrc文件添加以下内容：

export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

修改Hadoop核心配置文件：

hdfs namenode -format

start-dfs.sh
start-yarn.sh

通过以下命令验证Hadoop是否安装成功：

jps  # 查看Java进程
hdfs dfsadmin -report  # 查看HDFS状态

通过以上步骤，您已成功在Linux云服务器上安装Hadoop。后续可以根据实际需求配置多节点集群，或集成Hive、Spark等大数据组件，构建完整的大数据处理平台。