ubantu 16.4下Hadoop完全分布式搭建实战教程

更新时间：2018年10月21日 10:26:02 作者：靠，疯了吧

这篇文章主要给大家介绍了关于在ubantu 16.4下Hadoop完全分布式搭建的相关资料，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

前言

本文主要介绍了关于ubantu 16.4 Hadoop完全分布式搭建的相关内容，分享出来供大家参考学习，下面话不多说了，来一起看看详细的介绍吧

一个虚拟机

1.以 NAT网卡模式装载虚拟机

2.最好将几个用到的虚拟机修改主机名，静态IP /etc/network/interface，这里是 s101 s102 s103 三台主机 ubantu，改/etc/hostname文件

3.安装ssh

　在第一台主机那里s101 创建公私密匙

　　 ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

　　 >cd .ssh

　　 >cp id_rsa.pub >authorized_keys 　创建密匙库

　　将id_rsa.pub传到其他主机上，到.ssh目录下

　　通过服务端 nc -l 8888 >~/.ssh/authorized_keys

　　客户端 nc s102 8888 <id_rsa.pub

开始安装Hadoop/jdk

1、安装VM-tools 方便从win 10 拖拉文件到ubantu

2、创建目录 /soft

3、改变组 chown ubantu:ubantu /soft 方便传输文件有权限

4、将文件放入到/soft （可以从桌面cp/mv src dst）

tar -zxvf jdk或hadoop 自动创建解压目录

配置安装环境（/etc/environment）

1.添加　　JAVA_HOME=/soft/jdk-...jdk目录

2.添加　　HADOOP_HOME=/soft/hadoop（Hadoop目录）

3.在path里面加/soft/jdk-...jdk/bin:/soft/hadoop/bin/:/soft/hadoop/sbin

4.通过 java -version 查看有版本号成功

5.hadoop version 有版本号成功

开始配置HDFS四大文件 core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml

core-site.xml

<configuration>
 <property>
 <name>fs.defaultFS</name>
 <value>hdfs://s101:9000</value>
 </property>

</configuration>

2.hdfs-site.xml

<configuration>
<!-- Configurations for NameNode: -->
<property>
 <name>dfs.replication</name>
 <value>2</value>
</property>

<property>
 <name>dfs.namenode.name.dir</name>
 <value>file:/data/hdfs/name</value>
</property>

<property>
 <name>dfs.datanode.data.dir</name>
 <value>file:/data/hdfs/data</value>
</property>

<property>
 <name>dfs.namenode.secondary.http-address</name>
 <value>s101:50090</value>
</property>

<property>
 <name>dfs.namenode.http-address</name>
 <value>s101:50070</value>
 <description>
 The address and the base port where the dfs namenode web ui will listen on.
 If the port is 0 then the server will start on a free port.
 </description>
</property> 

<property>
 <name>dfs.namenode.checkpoint.dir</name>
 <value>file:/data/hdfs/checkpoint</value>
</property>

<property>
 <name>dfs.namenode.checkpoint.edits.dir</name>
 <value>file:/data/hdfs/edits</value>
</property>
</configuration>

3. mapred-site.xml

<configuration>
 <property>
 <name>mapreduce.framework.name</name>
 <value>yarn</value>
 </property>
</configuration>

4.yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->
 <property>
 <name>yarn.nodemanager.aux-services</name>
 <value>mapreduce_shuffle</value>
 </property>
 <property>
 <name>yarn.resourcemanager.hostname</name>
 <value>s101</value>
 </property>
</configuration>

到此成功一半。。。。。。。。。。。。。。

创建文件夹

mkdir /data/hdfs/tmp
mkdir /data/hdfs/var
mkdir /data/hdfs/logs
mkdir /data/hdfs/dfs
mkdir /data/hdfs/data
mkdir /data/hdfs/name
mkdir /data/hdfs/checkpoint
mkdir /data/hdfs/edits

记得将目录权限修改

sudo chown ubantu:ubantu /data

接下来传输 /soft文件夹到其他主机

创建 xsync可执行文件

sudo touch xsync

sudo chmod 777 xsync 权限变成可执行文件

sudo nano xsync

#!/bin/bash
pcount=$#
if((pcount<1));then
 echo no args;
 exit;
fi

p1=$1;
fname=`basename $p1`
pdir=`cd -P $(dirname $p1);pwd`

cuser=`whoami`
for((host=102 ; host<105 ;host=host+1));do
 echo --------s$host--------
 rsync -rvl $pdir/$fname $cuser@s$host:$pdir
done

xsync /soft-------->就会传文件夹到其他主机

xsync /data

创建 xcall 向其他主机传命令

#!/bin/bash
pcount=$#
if((pcount<1));then
 echo no args;
 exit;
fi
echo --------localhost--------

$@
for ((host=102;host<105;host=host+1));do
 echo --------$shost--------
 ssh s$host $@
done

别着急快结束了哈

还得配置 workers问价

将需要配置成数据节点（DataNode）的主机名放入其中，一行一个

注意重点来了

先格式化 hadoop -namenode -format

再启动 start-all.sh

查看进程 xcall jps

进入网页

是不是很想牛泪，成功了耶！！！

中间出现了很多问题

　　1， rsync 权限不够：删除文件夹更改文件夹权限chown

　　2.学会看日志 log

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对脚本之家的支持。

您可能感兴趣的文章:

linux系统终端修改字体的方法
我们以debian为例，介绍两种linux修改终端字体的设置方法，大家参考使用吧
2014-01-01
Linux知识点小结
这篇文章主要为大家分享了Linux知识点，帮助大家更加详细的学习Linux
2016-01-01
ubuntu无法ssh远程，提示'Permission denied (publickey
SSH（Secure Shell）是一种加密的网络协议,用于在网络上安全地传输数据,它被广泛用于远程登录和执行命令,有时候使用SSH登录时,可能会遇到错误消息Permission denied (publickey)导致登录失败,这种情况可能由多种原因引起,将探讨导致SSH登录失败的可能性,并提供解决方案
2025-04-04
Linux /etc/network/interfaces配置接口方法
在本篇文章里小编给各位分享的是一篇关于Linux /etc/network/interfaces配置接口方法知识点，需要的朋友们可以学习下。
2020-02-02
Linux中环境变量配置的步骤详解
Linux中环境变量包括系统级和用户级，系统级的环境变量是每个登录到系统的用户都要读取的系统变量，而用户级的环境变量则是该用户使用系统时加载的环境变量。所以下面这篇文章主要给大家介绍了关于Linux中环境变量配置的相关资料，需要的朋友可以参考下。
2017-07-07
Linux下新增用户、指定用户组、家目录、获取sudo权限方式
这篇文章主要介绍了Linux下新增用户、指定用户组、家目录、获取sudo权限方式，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2023-04-04
Apache ab并发负载压力测试实现方法
Apache的ab命令模拟多线程并发请求，测试服务器负载压力，也可以测试nginx、lighthttp、IIS等其它Web服务器的压力
2019-09-09
启用 Apache Rewrite 重写模块的详细过程
Apache的mod_rewrite是最强大的URL 操作模块之一,使用 mod_rewrite,您可以重定向和重写 url,这对于在您的网站上实现 seo 友好的 URL 结构特别有用,在本文中,我们将引导您了解如何在基于 Debian 和基于 RHEL 的系统上在 Apache 中启用 mod 重写,感兴趣的朋友一起看看吧
2025-02-02
关于Grep的多次管道过滤的问题及解决
这篇文章主要介绍了关于Grep的多次管道过滤的问题及解决方案，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2023-03-03
浅谈linux线程切换问题
下面小编就为大家带来一篇浅谈linux线程切换问题。小编觉得挺不错的，现在就分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2017-01-01

ubantu 16.4下Hadoop完全分布式搭建实战教程

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具