彻底搞懂Docker镜像分层的实现

 更新时间:2022年02月21日 09:25:11   作者:postnull  
本文我们会深入的学习Docker的镜像分层的原理和实现,通过实例和与git的类比,帮助我们加深对镜像的理解,对Docker镜像分层相关知识感兴趣的朋友一起看看吧

创建测试镜像

我们创建一个最简单的镜像:

1.构建测试镜像v1.0:docker build -t image_test:1.0 .

FROM alpine:3.15.0 #除了继承基础镜像,啥也不做

2.构建测试镜像v2.0:docker build -t image_test:2.0 .

FROM alpine:3.15.0
RUN dd if=/dev/zero of=file1 bs=10M count=1 #添加一个10M的文件file1

3.构建测试镜像v3.0:docker build -t image_test:3.0 .

FROM alpine:3.15.0
RUN dd if=/dev/zero of=file1 bs=10M count=1 #添加一个10M的文件file1
RUN dd if=/dev/zero of=file2 bs=10M count=1 #添加一个10M的文件file2

这样本地就构建了3个测试镜像:

查看镜像

我们有2种方法查看镜像:

  1. 使用docker inspect:获取镜像的元数据
  2. 使用docker history:查看镜像的构建历史 使用docker inspect

使用docker inspect

查看镜像的元数据。
其中Parent可以看到父镜像, Layers这一项下面可以看到镜像的所有层。

使用docker history

使用docker history可以看到镜像的构建历史。
我们每一行列出了镜像包含的层。

使用docker history我们看到有一行很特别,就是镜像ID为的行,这一行是什么呢?
看了 官方文档 的描述,我们知道这些构建步骤要么是构建在另一个系统,要么是镜像的部分是从DockerHub上拉取下来的,要么是使用的是另一种构建工具BuildKit构建的。
很显然,我们这里就是第二种情况,因为我们的Dockerfile中第一句指令就是FROM alpine:3.15.0.

镜像分层图

根据上面的docker history命令,我们可以轻松的画出三个镜像的分层图:

从上面的图可以看到,我们的镜像是分层的,我们的Dockerfile中新增一条指令,就会新增一层!
如果我们将多个命令合成一个,那么也只会生成一层。修改一下上面的image_test:3.0,把两条RUN合并成一条:

FROM alpine:3.15.0
RUN dd if=/dev/zero of=file1 bs=10M count=1 && \
    dd if=/dev/zero of=file2 bs=10M count=1

使用docker history 查看image_test:4.0,可以看到,只有2层了!

镜像分层的好处

知道了镜像是分层的,那么我们是不是好奇为啥要这么设计呢?
试想一下我们如果不分层会有什么问题?

以拉取镜像为例!
拉取镜像的镜像很大,比如Redis的镜像有100多M
第一次我们拉取6.2版本的Redis,下载了完成的100M到本地,下次我要下载6.2.6版本的,是不是又得下载100M。
尽管可能两个版本之间就改了几行配置文件。

这样是非常低效的。如果能只下载有差异的部分就好了!

这个痛点,也就是镜像分层要解决的问题。实际上,Docker也是这么实现的。
第一次下载redis:6.2时,因为之前没有下载过,所以下载了所有的层,总共113M。网络慢点的话还是需要花一些时间的!

第二次下载redis:7.0-rc,就变得快了很多!因为前面3层是redis:6.2是一样的,这些层已经下载过了!

这种思想和我们常用的版本管理工具git也是一样的!
如果版本2是基于版本1的基础上,那么版本2不需要copy一份全量的数据,只需一份和版本1差异化的增量数据即可!

这样的最终好处是,可以体现在以下方面:

  • 拉取更快:因为分层了,只需拉取本地不存在的层即可!
  • 存储更少:因为共同的层只需存储一份即可!
  • 运行时存储更少:容器运行时可以共享相同的层!

对于第3点,多个基于相同镜像运行的容器,都可以直接使用相同的镜像层,每个容器只需一个自己的可写层即可:

镜像分层的实现

前面说过,Docker镜像分层和Git的版本很像!我们不妨以此类比!只是为了方便我们理解:

GitDocker
版本分层
在前一个版本的基础上在前一层的基础上
修改了代码Dockerfile中加了RUN等指令
commit了修改,新增了一个版本新建一个镜像层
新版本只包含差异新镜像只包含了差异修改
已提交的commit是不能修改的旧的镜像层是不能修改的

总而言之,镜像层是只读的,新的镜像层是基于前一个镜像层的修改,只保留了增量修改的部分!
使用了联合文件系统,对文件系统的修改作为一次提交来一层层的叠加!

容器本质上也是在镜像的基础上加了一层可写层!这个在另外的章节再详细讨论!

Copy-on-write策略

Copy-on-write是一种提高文件共享和复制效率的策略。
如果一个文件和目录在低一层的镜像层中存在,并且其它层想要读取这个文件,就直接使用这个文件。
如果其它层想要修改这个文件(不管是构建镜像时,还是在容器运行的过程中),这个文件都会被先拷贝到新的一层中,然后再修改它。

这样做的好处是可以大大减少每一层的大小!
更具体的实现请参考官方文档中:Copy-on-write策略

到此这篇关于彻底搞懂Docker镜像分层的文章就介绍到这了,更多相关Docker镜像分层内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 基于Docker的Mysql主备搭建的实现步骤

    基于Docker的Mysql主备搭建的实现步骤

    本文主要介绍了基于Docker的Mysql主备搭建的实现步骤,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-01-01
  • Docker中容器数据卷详解

    Docker中容器数据卷详解

    这篇文章主要介绍了Docker中容器数据卷详解的相关资料,需要的朋友可以参考下
    2022-11-11
  • 使用docker部署mysql并开启binlog的方法

    使用docker部署mysql并开启binlog的方法

    本文介绍了如何使用Docker部署MySQL服务并配置开启binlog,以便通过Flink CDC Connector实现对MySQL数据的实时同步,有需要的朋友可以借鉴参考下,希望能够有所帮助
    2022-02-02
  • Docker 通过端口来连接一个容器的实现

    Docker 通过端口来连接一个容器的实现

    这篇文章主要介绍了Docker 通过端口来连接一个容器的实现,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-11-11
  • Docker复制现有容器的实现方法

    Docker复制现有容器的实现方法

    在使用Docker进行应用开发和部署时,我们经常需要基于现有的容器创建相似的环境,本文主要介绍了Docker复制现有容器的实现方法,具有一定的参考价值,感兴趣的可以了解一下
    2024-03-03
  • docker如何删除悬空镜像

    docker如何删除悬空镜像

    文章介绍了如何使用Docker命令删除悬空镜像,以提高服务器空间利用率,通过使用docker image命令结合filter和awk工具,可以过滤出没有Tag的镜像,并将其删除,总结了两种方法,一种是通过管道和awk命令,另一种是使用更简单的docker rmi命令
    2025-02-02
  • Docker挂载资料卷部署Nginx

    Docker挂载资料卷部署Nginx

    这篇文章介绍了Docker挂载资料卷部署Nginx,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-01-01
  • 详解Docker私有仓库最简便的搭建方法

    详解Docker私有仓库最简便的搭建方法

    本篇文章主要介绍了Docker私有仓库最简便的搭建方法,具有一定的参考价值,有兴趣的可以了解一下。
    2017-02-02
  • 在vscode中使用ssh运行docker:从下载到运行全流程

    在vscode中使用ssh运行docker:从下载到运行全流程

    首先在本机或者服务器上下载docker并运行,本文目的旨在本机下载docker并打包,然后在服务器上进行加载,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧
    2024-08-08
  • docker安装tomcat8的实现方法

    docker安装tomcat8的实现方法

    这篇文章主要介绍了docker安装tomcat8的实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-02-02

最新评论