Hadoop集群安装参考
一、说明
1.安装环境说明:
操作系统为Centos 6.4,安装的hadoop 版本为0.20.2-cdh3u6
2.安装后的集群环境说明:
集群内共6台机器,分别为namenode、secondnamenode、jobtrack、datanode(三个节点),参考如下:
namenode节点: 192.168.8.67(主机名:namenode)
secondnamenode节点: 192.168.8.65 (主机名:secondnamenode)
jobtrack节点: 192.168.8.68(主机名:jobtrack)
4.安装目录为/opt/hadoop
二、安装
1.下载hadoop-0.20.2-cdh3u6.tar.gz
2.解压hadoop-0.20.2-cdh3u6.tar.gz并将解压后的文件夹重命名为hadoop
3.将hadoop文件夹分别以root身份上传至namenode、secondnamenode、jotrack、datanode01、datanode02、datanode03的/opt目录下
4.更改/opt/hadoop目录的所有者为hadoop用户
参考命令:sudo chown -R hadoop.hadoop /opt/hadoop
5.设置环境变量
参考如下:
export HADOOP_HOME=/opt/hadoop
export PATH=$PATH:$HADOOP_HOME/bin
6.设置各个hadoop节点的配置文件,参考如下
分别进入每个节点机器的/opt/hadoop/conf目录下完成如下配置:
(1).namenode:
a.core-site.xml:
io.file.buffer.size 65536 fs.default.name hdfs://namenode:9000 hadoop.proxyuser.hadoop.hosts * hadoop.proxyuser.hadoop.groups *
b.hdfs-site.xml:
dfs.permissions false dfs.name.dir /home/hadoop/hadoop/data/name true dfs.replication 3 dfs.block.size 134217728
c.mapred-site.xml:
d.masters:mapred.child.java.opts -Xmx1024m io.sort.mb 500m mapred.tasktracker.map.tasks.maximum 4 true mapred.tasktracker.reduce.tasks.maximum 2 true mapred.job.tracker jobtrack:9001 true
#secondnamenode的地址(可以输入主机名或者输入ip) secondnamenode #192.168.8.65e.slaves:
#各datanode节点的主机名或ip地址 #192.168.8.62 #192.168.8.63 #192.168.8.64 datanode01 datanode02 datanode03此项配置完成后,先别着急启动hadoop,好多东西还没设置,继续往下走.....
(2).secondnamenode
a.core-site.xml:
b.hdfs-site.xml:hadoop.tmp.dir /home/hadoop/hadoop/tmp/ io.file.buffer.size 65536 fs.default.name hdfs://namenode:9000 hadoop.proxyuser.hadoop.hosts * hadoop.proxyuser.hadoop.groups *
c.mapred-site.xml:dfs.permissions false dfs.name.dir /home/hadoop/hadoop/data/name true dfs.data.dir /home/hadoop/hadoop/data/data true dfs.replication 3 dfs.block.size 134217728
d.masters和slaves无需配置mapred.child.java.opts -Xmx1024m io.sort.mb 500m mapred.tasktracker.map.tasks.maximum 4 true mapred.tasktracker.reduce.tasks.maximum 2 true mapred.job.tracker jobtrack:9001 true
此项配置完成后,先别着急启动hadoop,好多东西还没设置,继续往下走.....
(3).jobtrack
a.core-site.xml:
hadoop.tmp.dir /home/hadoop/hadoop/tmp/ io.file.buffer.size 65536 fs.default.name hdfs://namenode:9000 hadoop.proxyuser.hadoop.hosts * hadoop.proxyuser.hadoop.groups *
b.hdfs-site.xml:
dfs.permissions false dfs.name.dir /home/hadoop/hadoop/data/name true dfs.data.dir /home/hadoop/hadoop/data/data true dfs.replication 3 dfs.block.size