docker swarm 集群故障与异常详解

 更新时间:2018年02月24日 11:37:07   作者:博客园团队  
这篇文章主要介绍了docker swarm 集群故障与异常详解,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧

本文介绍了docker swarm 集群故障与异常详解,分享给大家,具体如下:

在上次遭遇 docker swarm 集群故障后,我们将 docker 由 17.10.0-ce 升级为最新稳定版 docker 17.12.0-ce 。

前天晚上22:00之后集群中的2个节点突然出现CPU波动,在CPU波动之后,在凌晨夜深人静、访问量极低的时候,整个集群出现了故障,访问集群上的所有站点都出现了502,过了一段时间后自动恢复正常。

ECS实例:swarm1-node5,CPU百分比于00:52发生告警,值为96.14%,持续时间0分钟

。。。

昨天早上发现访问部分节点中的容器应用响应有些慢,于是我们通过阿里云控制台强制重启这些节点后恢复正常。

今天上午我们在集群上更新一个应用时(部署新的镜像),出现了奇怪的问题。应用是在 swarm1-node1 这个 manager 节点上部署的,部署后容器运行在其他节点上,但奇怪的是只有在 swarm1-node1 这个节点上可以正常访问容器中的站点,在其他节点上访问都是 503 ,用 docker stack rm 命令删除应用并重新部署问题依旧。

当时 docker-flow-proxy(路由应用) 的 2 个容器都是部署在 swarm1-node1 节点上的,从问题现象看,在 swarm1-node1 节点上 docker-flow-proxy 容器与外界的通信正常,docker-flow-proxy 容器与其他节点上的容器的 overlay 网络(网络A)通信正常;在其他节点上,外界的请求通过 overlay 网络(网络B)被正常转发到 docker-flow-proxy 容器,却不能被正常路由到其他节点上对应的容器(也是通过 overlay 网络A)。对这个奇怪现象实在想不通,但是问题摆在那,想不通也要解决。想不通背后的原因,那我们换个角度,其他节点都异常,就 swarm1-node1 正常,根据少数服从多数的粗暴原则,那就认为swarm1-node1 不正常吧。于是通过下面的命令将swarm1-node1 节点下线:

docker node update --availability drain swarm1-node1

swarm1-node1 下线后,其他节点都恢复了正常,果然是 swarm1-node1 不正常。

swarm1-node1 下线的背后是 docker-flow-proxy 容器换到其他节点上运行。

问题就这样被猜测解决了。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • Docker搭建Redis Cluster集群的教程详解

    Docker搭建Redis Cluster集群的教程详解

    这篇文章主要为大家详细介绍了Docker搭建Redis Cluster集群的相关知识,文中的示例代码讲解详细,具有一定的借鉴价值,有需要的可以参考下
    2024-03-03
  • supervisor下的Dockerfile的多服务镜像封装操作

    supervisor下的Dockerfile的多服务镜像封装操作

    这篇文章主要介绍了supervisor下的Dockerfile的多服务镜像封装操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-11-11
  • Docker网络之单host网络及使用案例

    Docker网络之单host网络及使用案例

    本文重点给大家讲解Docker单主机网络的相关知识及使用案例,重点是使用案例,感兴趣的朋友一起看看吧
    2017-08-08
  • Docker 删除及清理镜像的方法

    Docker 删除及清理镜像的方法

    本文主要介绍了Docker 删除及清理镜像的方法,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-03-03
  • Docker+selenium实现自动化健康报备的方法

    Docker+selenium实现自动化健康报备的方法

    这篇文章主要介绍了Docker+selenium实现自动化健康报备的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-03-03
  • 5分钟教你实现用docker搭建Redis集群模式和哨兵模式

    5分钟教你实现用docker搭建Redis集群模式和哨兵模式

    本文主要介绍了5分钟实现用docker搭建Redis集群模式和哨兵模式,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-09-09
  • IDEA连接远程服务器Docker部署Spring Boot项目的详细教程

    IDEA连接远程服务器Docker部署Spring Boot项目的详细教程

    这篇文章主要介绍了IDEA连接远程服务器Docker部署Spring Boot项目,本文通过图文并茂的形式给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-06-06
  • docker-compose之基本语法解读

    docker-compose之基本语法解读

    这篇文章主要介绍了docker-compose之基本语法解读,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-03-03
  • Docker私有仓库管理和删除本地仓库中的镜像

    Docker私有仓库管理和删除本地仓库中的镜像

    这篇文章主要介绍了Docker私有仓库管理和删除本地仓库中的镜像,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-01-01
  • Docker之Dockerfile使用方法详解

    Docker之Dockerfile使用方法详解

    当使用Docker构建容器化应用程序时,Dockerfile是一个用于定义容器镜像的文本文件,Dockerfile 的编写是构建容器的基础,它允许您定义容器的构建步骤、环境和配置,所以本文就给大家讲讲Docker的Dockerfile使用方法,需要的朋友可以参考下
    2023-09-09

最新评论