(資料圖片)
一、環(huán)境準(zhǔn)備
安裝Java:Hadoop是基于Java編寫的,需要先安裝Java。創(chuàng)建普通用戶:為了安全起見,我們不應(yīng)該直接使用root用戶來運(yùn)行Hadoop。下載Hadoop:從官網(wǎng)下載Hadoop的穩(wěn)定版本。二、安裝配置Hadoop
解壓Hadoop:將下載的Hadoop文件解壓到指定目錄下。配置Hadoop環(huán)境變量:編輯/etc/profile文件,將Hadoop的bin目錄添加到PATH環(huán)境變量中。配置Hadoop:修改Hadoop的配置文件,主要包括core-site.xml、hdfs-site.xml和mapred-site.xml。core-site.xml:fs.defaultFS hdfs://localhost:9000
hdfs-site.xml:dfs.replication 1 dfs.name.dir /opt/hadoop-2.10.1/hadoop_data/hdfs/namenode dfs.data.dir /opt/hadoop-2.10.1/hadoop_data/hdfs/datanode
mapred-site.xml:mapreduce.framework.name yarn
啟動Hadoop:使用以下命令啟動Hadoop。$ start-all.sh
測試Hadoop:使用以下命令測試Hadoop是否正常運(yùn)行。$ hadoop fs -mkdir /test
三、配置Hadoop集群
配置SSH無密碼登錄:Hadoop需要使用SSH來在不同節(jié)點(diǎn)之間傳輸數(shù)據(jù),因此需要配置SSH無密碼登錄。編輯hdfs-site.xml:在hdfs-site.xml文件中配置HDFS的復(fù)制因子和數(shù)據(jù)目錄。配置core-site.xml:在core-site.xml文件中配置NameNode和ResourceManager的IP地址和端口。配置yarn-site.xml:在yarn-site.xml文件中配置ResourceManager的IP地址和端口。在所有節(jié)點(diǎn)上啟動Hadoop:使用以下命令在所有節(jié)點(diǎn)上啟動Hadoop。$ start-all.sh
Copyright @ 2015-2022 亞洲晚報網(wǎng)版權(quán)所有 備案號: 豫ICP備20022870號-9 聯(lián)系郵箱:553 138 779@qq.com