云服务器搭建Hadoop分布式的过程详解

更新时间：2023年10月26日 11:51:16 作者：几窗花鸢

这篇文章主要介绍了云服务器搭建Hadoop分布式的过程,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

1.服务器配置

服务器	主机名	配置
115.157.197.82	s1	10核
115.157.197.84	s2	10核
115.157.197.109	s3	10核
115.157.197.31	s4	10核
115.157.197.60	gracal	10核

所有的软件安装在/opt/module下，软件安装包在/opt/softs下

2.Java环境

所有的服务器的java统一1.8版本，查看java版本

java --version

若存在java环境不统一，或者没有1.8版本的jdk

无1.8版本的java

 yum install -y java-1.8.0-openjdk*

环境不统一

#查看java版本
alternates --config java
#选择1.8版本的数字

相关的JAVA_HOME、Hadoop_HOME环境变量都保存在/etc/profile.d/my_env.sh中

3. 安装Hadoop

确保Hadoop统一版本：hadoop3.1.3
编写文件分发脚本，可以在一台服务器分发到其他服务器：xsync脚本，在/home/gaochuchu/bin目录下

4. 集群配置

各个组件的分布情况

	s1	s2	s3	s4	gracal
HDFS	NameNode DataNameNode	DataNameNode	SecondaryNameNode DataNameNode	DataNameNode	DataNameNode
YARN	NodeManager	ResourceManager NodeManager	NodeManager	NodeManager	NodeManager

常用端口配置（分Hadoop2.x和Hadoop3.x的区别）

端口名称	Hadoop2.x	Hadoop3.x
NameNode内部通信端口	8020/9000	8020/
NameNode HTTP UI	50070	9870
MapReduce查看执行任务端口	8088	8088（容易和框架端口冲突，本文配置的7666）
历史服务器通信端口	19888	19888

在客户端机器（笔记本）配置ip和服务器主机名的映射，希望能通过主机名+端口号在浏览器访问各个Web页面
- 问题：通过s2:7666无法访问ResourceManger的web UI，而通过直接的ip:7666又可以访问其webUI
  - 遇到这个问题我无法理解为什么会出问题
  - 漫长的排错过程：
    - 1.检查了服务器之间的ip和主机名的映射，各个服务器主机之间通过主机名可以ping通，说明映射没有问题
    - 2.检查客户端mac本机的hosts文件映射未发现问题，并且在客户端的终端也能ping通各个主机名，说明映射没有问题
    - 3.且查看各个服务器的防火墙也处于关闭状态
    - 4.通过netstat -nltp|grep 7666查看端口的监听情况，也是正常监听状态
    - 5.在网上搜索很多相关解决方案：关闭防火墙，设置etc/sysconfig/selinux的级别为disable，都没有结果
    - 因此，我认为应该在客户端本机出现问题，验证问题过程

6.1 发现在本地主机telnet s2 7666可以成功访问，但是curl s2:7666没有输出页面的任何信息

6.2 使用cur -v s2:7666查看相关信息

发生地址的重定位，然后使用命令curl -v http://s2:7666/cluser

成功返回了相关的html信息，说明页面其实是可以访问的

6.3 但是浏览器端还是无法访问：后查询到浏览器可能配置了代理服务器，而’curl’命令未配置代理。代理服务器会烦扰浏览器的访问。

因此我关闭了VPN代理，成功访问到s2:7666页面！！

以后VPN代理一定要慎用！！！排查了这么久发现最后居然是代理问题

启动集群测试
- 启动HDFS

[gaochuchu@s1 hadoop-3.1.3]$ sbin/start-dfs.sh

启动YARN

[gaochuchu@s1 hadoop-3.1.3]$ sbin/start-yarn.sh

问题：

解决：

这里的hadoop配置的是root用户创建的hadoop环境，本地用户无权限
修改环境变量/etc/profile，注释配置的HADOOP_HOME,重新source

运行hadoop自带的wordcount示例程序报错，并且一直卡在Running Job位置，报错信息如下：

java.io.IOException: Got error, status=ERROR, status message , ack with firstBadLink as [某ip]:9866
at org.apache.hadoop.hdfs.protocol.datatransfer.DataTransferProtoUtil.checkBlockOpStatus(DataTransferProtoUtil.java:134)
at org.apache.hadoop.hdfs.protocol.datatransfer.DataTransferProtoUtil.checkBlockOpStatus(DataTransferProtoUtil.java:110)
at org.apache.hadoop.hdfs.DataStreamer.createBlockOutputStream(DataStreamer.java:1778)
at org.apache.hadoop.hdfs.DataStreamer.nextBlockOutputStream(DataStreamer.java:1679)
at org.apache.hadoop.hdfs.DataStreamer.run(DataStreamer.java:716)
......
Caused by: java.net.NoRouteToHostException: No route to host
at sun.nio.ch.SocketChannelImpl.checkConnect(Native Method)
at sun.nio.ch.SocketChannelImpl.finishConnect(SocketChannelImpl.java:716)
at org.apache.hadoop.net.SocketIOWithTimeout.connect(SocketIOWithTimeout.java:206)
at org.apache.hadoop.net.NetUtils.connect(NetUtils.java:531)
at org.apache.hadoop.ipc.Client$Connection.setupConnection(Client.java:700)
at org.apache.hadoop.ipc.Client$Connection.setupIOstreams(Client.java:804)
at org.apache.hadoop.ipc.Client$Connection.access$3800(Client.java:421)
at org.apache.hadoop.ipc.Client.getConnection(Client.java:1606)
at org.apache.hadoop.ipc.Client.call(Client.java:1435)
... 19 more

如何解决这种问题？

注意报错信息:No route to host ,说明没有到host的路由，排查思路，确定与对应服务器端口是否联通
首先测试某ip自身9866端口是否联通，说明联通

说明s1服务器和…31:9866可能是不连通的

经查找相关资料说明是…31服务器的icmp(Internet Control Message Protocol)被禁用导致。
命令查看iptable是否有防火墙设置：

iptables -L INPUT --line-numbers

发现：

命令删除这条记录：

iptables -D INPUT 28

5. 编写集群的启动脚本

因为每次集群启动需要在NameNode节点的HADOOPHOME目录下使用命令启动HDFS

sbin/start-dfs.sh

在Yarn节点上通过命令启动Yarn（ResourceManager）

 sbin/start-yarn.sh

配置了历史服务器，还需要在历史服务器的节点上使用命令启动历史服务器

mapred --daemon start historyserver

相应的停止集群也需要通过以下三个命令来停止集群

sbin/stop-dfs.sh
sbin/stop-yarn.sh
mapred --daemon stop historyserver

因此,可以编写相关的脚本启停（HDFS Yarn Historyserver）

在/home/gaochuchu/bin 目录下编写myhadoop.sh脚本启停Hadoop集群

#启动Hadoop集群
myhadoop.sh start
#停止Hadoop集群
myhadoop.sh stop

服务器各节点的状态都需要通过在笔不同服务器上通过jps命令查看，比较麻烦

在/home/gaochuchu/bin 目录下编写jpsall脚本，可以查看所有服务器上的节点状态

到此这篇关于云服务器搭建Hadoop分布式的过程详解的文章就介绍到这了,更多相关云服务器搭建Hadoop内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

IMail 的安装和设置图文教程
IMail 的安装和设置图文教程，使用IMail的朋友可以参考下。
2011-09-09
N点主机管理系统重置密码方法(在线修改密码)
这篇文章主要介绍了N点主机管理系统重置密码方法(在线修改密码),需要的朋友可以参考下
2015-10-10
Cisco网络防火墙配置方法
这篇文章主要介绍了Cisco网络防火墙配置方法,需要的朋友可以参考下
2016-04-04
多核心服务器和高主频服务器怎么选？cpu主频高和核心多哪个更好？
这篇文章主要介绍了多核心服务器和高主频服务器怎么选？cpu主频高和核心多哪个更好？,需要的朋友可以参考下
2023-07-07
Tomcat 启动错误（8080端口被占用）处理方法
8080端口被占用的解决方法，其实这个方法，可以用于其它一些端口被占用的问题。
2009-07-07
IBM X346 板载 Raid1 功能启用及Win2003系统安装小记
有两台IBM X346 m/t-8840-cdr 服务器，板载raid控制器版本号为v.4.30.9，硬盘位0，1各装一块146G IBM 原装SCSI硬盘。
2011-04-04
生产服务器突然本机无法访问本机IP的端口的问题及解决方法
生产服务器突然无法访问自己本机IP地址的端口,通过localhost或者127.0.0.1都可以正常访问,本文给大家分享生产服务器突然本机无法访问本机IP的端口的问题及解决方法,感兴趣的朋友一起看看吧
2023-11-11
CentOS简单操作命令及node.js的安装方法
这篇文章主要介绍了CentOS简单操作命令及node.js的安装方法,列举了CentOS的常用查看命令及安装node.js的方法,需要的朋友可以参考下
2016-05-05
详解aws免费服务器申请及网络代理搭建教程
这篇文章主要介绍了aws免费服务器申请及网络代理搭建教程,本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2021-12-12
本地部署Jellyfin影音服务器并实现在公网访问的过程
Jellyfin作为相对知名的影音服务器,在NAS平台广受欢迎,但笔者连韭菜都不愿意当,自然没有NAS这样的专业装备,只有一台淘汰下来的台式机,这篇文章主要介绍了本地部署Jellyfin影音服务器并实现在公网访问的过程,需要的朋友可以参考下
2023-11-11