详谈Linux写时拷贝技术(copy-on-write)必看篇

 更新时间:2017年07月03日 15:19:00   投稿:jingxian  
下面小编就为大家带来一篇详谈Linux写时拷贝技术(copy-on-write)必看篇。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧

COW技术初窥

在linux程序中,fork()会产生一个和父进程完全相同的子进程,但子进程在此后多会exec系统调用,出于效率考虑,linux中引入了“写时复制”技术,也就是只有进程空间的各段的内容要发生变化时,才将父进程的内容复制一份给子进程。

那么子进程的物理空间没有代码,怎么去取指令执行exec系统调用呢??

在fork之后exec之前两个进程用的是相同的物理空间(内存区),子进程的代码段、数据段、堆栈都是指向父进程的物理空间,也就是说,两者的虚拟空间不同,其对应的物理空间是一个。当父子进程中有更改相应段的行为发生时,再为子进程相应的段分配物理空间。如果不是因为exec,内核会给子进程的数据段、堆栈段分配相应的物理空间(至此两者都有各自的进程空间,互不影响),而代码段继续共享父进程的物理空间(两者的代码完全相同)。而如果是因为exec,由于两者执行的代码不同,子进程的代码段也会分配单独的物理空间。

在网上看到的还有个细节问题是:fork之后内核会将子进程排在队列的前面,以让子进程先执行,以免父进程执行导致写时复制,而后子进程执行exec系统调用,因无意义的复制而造成效率的下降。

COW详述

现在有一个父进程P1,这是一个主体,那么它是有灵魂也是有身体的。现在在其虚拟地址空间(有相应的数据结构表示)上有:正文段,数据段,堆,栈这四个部分,相应地,内核要为这四个部分分配给自的物理块。即正文段块、数据段块、堆块、栈块。至于如何分配,这是内核去做的事,在此不详述。

1. 现在P1用fork()函数为进程创建一个子进程P2

内核:

(1) 复制P1的正文段,数据段,堆,栈这四个部分,注意是其内容相同。

(2) 为这四个部分分配物理块,P2的:正文段(为P1的正文段的物理块,其实就是不为P2分配正文段块,让P2的正文段指向P1的正文段块),数据段(P2自己的数据段块,为其分配对应的块),堆(P2自己的堆块),栈(P2自己的栈块)。如下图所示,同左到右大的方向箭头表示复制内容:

 2. 写时复制技术

写时复制技术:内核只为新生成的子进程创建虚拟空间结构,它们复制于父进程的虚拟空间结构,但是不为这些段分配物理内存,它们共享父进程的物理空间,当父子进程中有更改相应的段的行为发生时,再为子进程相应的段分配物理空间。

3. vfork

vfork的做法更加简单粗暴,内核连子进程的虚拟地址空间也不创建了,直接共享了父进程的虚拟空间,当然了,这种做法就顺水推舟的共享了父进程的物理空间

总结

传统的fork()系统调用直接把所有的资源复制给新创建的进程。这种实现过于简单并且效率低下,因为它拷贝的数据也许并不共享,更糟的情况是,如果新进程打算立即执行一个新的映像,那么所有的拷贝将是无用功。

Linux的fork()使用写时拷贝(copy-on-write)页实现。写时拷贝是一种可以推迟甚至免除拷贝数据的技术。内核此时并不复制整个地址空间,而是让父进程和子进程共享一个拷贝。只有在需要写入的时候,数据才会复制,从而使各个进程拥有各自的拷贝。也就是说,资源的复制只有在需要写入的时候才进行,在此之前,只是以只读方式共享。这种技术使地址空间的页的拷贝被推迟到实际发生写入的时候。

在页根本不会被写入的情况下,举例来说,fork()之后立即调用exec(),它们就无需复制了,fork()的实际开销就是复制父进程的页表以及给子进程创建唯一的进程描述符。在一般情况下,进程创建后都会马上运行一个可执行的文件,这种优化可以避免拷贝大量根本不会使用的数据(地址空间常常包含数十兆的数据)。由于Unix强调进程快速执行的能力,所以这个优化是很重要的,注:Linux COW和exec没有必然联系

以上这篇详谈Linux写时拷贝技术(copy-on-write)必看篇就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • 如何调试Linux shell脚本

    如何调试Linux shell脚本

    最简单的调试命令当然是使用echo命令。您可以使用echo在任何怀疑出错的地方打印任何变量值。这也是绝大多数的shell程序员要花费80%的时间来调试程序的原因。Shell程序的好处在于不需要重新编译,插入一个echo命令也不需要多少时间
    2013-06-06
  • shell脚本监控mysql主从状态

    shell脚本监控mysql主从状态

    这篇文章主要介绍了shell脚本监控mysql主从状态,如果异常则邮件警告,需要的朋友可以参考下
    2014-05-05
  • Bash 中 nohup 与 & 的区别及用法详解

    Bash 中 nohup 与 & 的区别及用法详解

    在Bash中,`&`、`nohup`和`disown`各有用途:`&`用于后台运行命令,选择合适的工具可以实现后台任务的稳定运行,本文介绍Bash 中 nohup 与 & 的区别及用法,感兴趣的朋友一起看看吧
    2025-01-01
  • Linux Netcat(nc)命令的使用方法详解

    Linux Netcat(nc)命令的使用方法详解

    在网络编程和网络安全领域,Netcat(简称 nc)是一个功能强大的工具,它可以用来监听网络端口、发送数据、接收数据等,Netcat 因其灵活性和强大的功能,被广泛用于网络调试和安全测试,本文介绍了Linux Netcat(nc)命令的使用方法,需要的朋友可以参考下
    2024-12-12
  • 高级开发运维测试必须掌握的envsubst命令使用详解

    高级开发运维测试必须掌握的envsubst命令使用详解

    这篇文章主要为大家介绍了高级开发运维测试必须掌握的envsubst命令使用详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-04-04
  • scp 将数据从一台linux服务器复制到另一台linux服务器

    scp 将数据从一台linux服务器复制到另一台linux服务器

    这篇文章主要介绍了scp 将数据从一台linux服务器复制到另一台linux服务器,需要的朋友可以参考下
    2017-09-09
  • Shell常用操作符总结

    Shell常用操作符总结

    这篇文章主要介绍了Shell常用操作符总结,本文讲解了算术操作 符、关系操作符、测试操作符等内容,需要的朋友可以参考下
    2015-05-05
  • Shell脚本之Expect免交互的实现

    Shell脚本之Expect免交互的实现

    这篇文章主要介绍了Shell脚本之Expect免交互的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-10-10
  • Linux中nmcli命令使用详解

    Linux中nmcli命令使用详解

    nmcli是Linux系统中的一个命令行工具,用于管理网络连接,它可以帮助用户配置和管理网络连接、网络设备以及网络连接的属性,本文给大家详细介绍了Linux nmcli命令使用方法,需要的朋友可以参考下
    2024-03-03
  • linux dev 常见特殊设备介绍与应用(loop,null,zero,full,random)

    linux dev 常见特殊设备介绍与应用(loop,null,zero,full,random)

    这篇文章主要介绍了linux dev 常见特殊设备介绍与应用(loop,null,zero,full,random),需要的朋友可以参考下
    2015-10-10

最新评论