Linux文件系统之缓冲区详解

 更新时间:2024年02月25日 09:16:35   作者:春人.  
在 Linux 中,缓冲区通常指的是用于临时存储数据的内存区域,它可以用来提高系统性能,Linux 中有多种类型的缓冲区,包括文件系统缓冲区、网络缓冲区等,本文给大家详细介绍了Linux文件系统之缓冲区,感兴趣的朋友可以参考下

一、先看现象

#include <stdio.h>
#include <string.h>
#include <unistd.h>

int main()
{
    const char* fstr = "Hello fwrite\n";
    const char* str = "Hello write\n";

    printf("Hello printf\n");
    fprintf(stdout, "Hello fprintf\n");
    fwrite(fstr, strlen(fstr), 1, stdout); // 返回值是写入成功的快数

    write(1, str, strlen(str)); // 返回值是写入成功的字节数

    // fork();
    return 0;
}

在这里插入图片描述

结构分析:带 fork 的输出重定向最终把有一些内容向 log.txt 文件中写入了多次,并且打印顺序也有所不同。

int main()
{
    const char* fstr = "Hello fwrite";
    const char* str = "Hello write";

    printf("Hello printf");
    fprintf(stdout, "Hello fprintf");
    fwrite(fstr, strlen(fstr), 1, stdout); // 返回值是写入成功的快数

    close(1);

    // write(1, str, strlen(str)); // 返回值是写入成功的字节数

    // fork();
    return 0;
}

在这里插入图片描述

结果分析:代码中只使用了库函数向显示器中进行写入,并且在字符串的结尾没有加 \n,在最后面将标准输出对应的文件描述符进行了关闭,最终显示器上什么也没有。上一段代码在字符串的结尾加上了 \n 最终字符串被成功的打印到了屏幕上。

int main()
{
    const char* str = "Hello write";

    write(1, str, strlen(str)); // 返回值是写入成功的字节数
    close(1);
    
    return 0;
}

在这里插入图片描述

结果分析:字符串的结尾依然不加 \n,但是这一次采用系统调用接口,最后仍然将标准输出对应的文件描述符进行关闭,这一次字符串被成功的打印了出来。

二、用户缓冲区的引入

write 为什么能将不带 \n 的字符串写入到显示器文件中。首先我们需要明确一点进程打开的每一个文件都有一个属于自己的操作系统级别的文件缓冲区,该缓冲区的存在,可以减少对外设的读写操作以提高计算机的效率。举个栗子,在一个进程中向磁盘里的同一个文件进多次行写入,文件缓冲区的存在,可以将每次写入的内容先存储在文件缓冲区中,最后在程序退出或者调用 close 的时候,一次性将文件缓冲区中的所有内容刷新到磁盘。如果没有该文件缓冲区,那在进程里对文件进行 n 次写操做,就要对应 n 次向磁盘的写操作,CPU 和外设之间是存在非常大的速度差的,这样效率会非常低。

write 作为系统调用接口,它就是直接向文件缓冲区中写入,最后在调用 close 接口或者程序退出的时候,会将文件缓冲区的内容刷新到对应的外设中。

printffprintffwrite 底层一定是封装了 write 系统调用接口,那为什么使用 write 系统调用接口就可以将字符串写入到显示器,使用 C 库函数没能把字符串写入到显示器文件?原因在进度条的那篇文章中讲过,我们使用的这些 C 库函数,是把字符串写入到了缓冲区中,这个缓冲区和上面的文件缓冲区有所不同,这里说的缓冲区是 C 语言给我们提供的语言层面的缓冲区,也叫做用户级缓冲区\n 具有刷新用户级缓冲区的作用,因此不加 \n 并且在程序结束前将显示器对应的文件描述符进行了关闭,最终就导致字符串在用户级缓冲区中,没有被刷新到文件缓冲区,所以屏幕上就什么也没有。这里我们可以肯定,在这些 C 库函数中,并不是立即调用 write 接口,而是在遇到 \n 后才去调用 write 接口将用户缓冲区的内容刷新到文件缓冲区中。

在这里插入图片描述

总结:使用 C 系统调用接口向文件中写入,写入的内容先被存储在用户缓冲区中,在合适的时候(遇到 \n)才会进行刷新,这里刷新的本质是调用 write 将数据从用户缓冲区写入内核。

之前说的 exit 会刷新缓冲区,其实就是刷新用户缓冲区,因为 exit 作为 C 库函数,可以看见用户缓冲区,而 _exit 作为系统调用接口,无法看到语言层面的用户缓冲区,因此也就无法刷新用户缓冲区。

三、用户缓冲区的刷新策略

  • 无缓冲:直接刷新,数据不在用户缓冲区中停留。
  • 行缓冲:不刷新,直到碰到 \n
  • 全缓冲:缓冲区满了才刷新。

所谓刷新就是调用 write 接口将数据写入操作系统中的文件缓冲区。显示器文件对应采用的就是行缓冲,向磁盘文件中写入采用的是全缓冲。进程在退出的时候也会刷新用户缓冲区,还可以调用 fflush 进行刷新。

四、为什么要有用户缓冲区

  • 解决效率问题,缓冲区就像菜鸟驿站,不需要我们自己坐火车坐飞机去送东西,而是直接交给菜鸟驿站,然后就可以干自己的事情了,菜鸟驿站可以选择攒上一大批快递然后统一寄送出去。用户缓冲区的存在本质上提高了 C 语言的效率,也就是提高了用户的效率,因为 C 语言是程序员在使用,在使用 C 库函数进行文件写入时,大部分情况只需要把数据交给缓冲区,然后就可以快速的返回,不需要每一次都亲力亲为的去和操作系统打交道。
  • 配合格式化,有些和文件写入相关的 C 库函数是格式化输出函数,在我们看来,它可以写入整形、符点型,但是最终都是以字符串的形式进行写入。格式化就是将类型全都转化成字符串,先写入到用户缓冲区,用户缓冲区中存的一定都是字符串。

用户缓冲区,有进也有出,将数据写入到用户缓冲区中就就叫做进,将用户缓冲区中的数据刷新到内核中的文件缓冲区中,被刷新的数据就可以从用户缓冲区中删掉,这就叫做出。用户缓冲就像就像水流一样源源不断,流的概念就是因此而来。

小TipsFILE 里面就有对应打开文件的缓冲区字段和维护信息。每个被进程打开文件都有自己对应的文件缓冲区。FILE 对象属于用户,用户缓冲区可以看作是在堆上申请的一块空间。

五、现象解释

这下再来解释上面代码中有 fork 然后重定向,写入了多次的原因。首先重定向后,将本来向显示器文件写入的内容,写到了磁盘文件,显示器文件的缓冲区采用行缓冲,即遇到 \n 就会刷新,而磁盘文件采用的是全缓冲,当缓冲区满了才刷新。因此在重定向后,会把三条 C 库函数写入的内容全部保存到缓冲区中,然后调用 fork 创建子进程,此时父子进程代码共享,数据写时拷贝,在程序退出的时候回去刷新用户缓冲区,上面说过,刷新就是将用户缓冲区中的数据写入到内核,然后将用户缓冲区中的内容清空,上面还说过,缓冲区就是在堆上申请的一段空间,可以看作数据部分,因为要删除数据,所以就会进行写时拷贝,此时之前父进程用户缓冲区中的内容就会给子进程拷贝一份,然后父子进程都执行刷新动作,各自刷新自己的缓冲区数据,这就是为什么最终出现多份的原因。没有重定向,只向显示器打印四条消息,是因为显示器采用的是行刷新策略,在调用 fork 前,对应的字符串就已经被刷新出去了。在 fork 的时候,父进程的用户缓冲区中是空的,什么也没有。

磁盘文件全缓冲验证

int main()
{
    const char* fstr = "Hello fwrite\n";
    const char* str = "Hello write\n";

    printf("Hello printf\n");
    sleep(2);
    fprintf(stdout, "Hello fprintf\n");
    sleep(2);
    fwrite(fstr, strlen(fstr), 1, stdout); // 返回值是写入成功的快数
    sleep(2);

    write(1, str, strlen(str)); // 返回值是写入成功的字节数

    sleep(5);

    fork();
    return 0;
}

在这里插入图片描述

分析:最先将 write 内容写入到文件中,因为它是直接写入到文件缓冲区,而剩下的 C 库函数对应的内容是统一一次全部刷新到内核,即使每个字符串后面都有 \n,但最后还是统一全部刷新,这就证明了磁盘文件采用的是全刷新策略。

六、结语

以上就是Linux文件系统之缓冲区详解的详细内容,更多关于Linux缓冲区的资料请关注脚本之家其它相关文章!

相关文章

  • 移植新内核到Linux系统上的操作步骤

    移植新内核到Linux系统上的操作步骤

    今天小编就为大家分享一篇关于移植新内核到Linux系统上的操作步骤,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2018-12-12
  • linux之centos7防火墙基本使用详解

    linux之centos7防火墙基本使用详解

    这篇文章主要介绍了linux之centos7防火墙基本使用详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-02-02
  • linux环境下安装jdk和Tomcat详细步骤

    linux环境下安装jdk和Tomcat详细步骤

    大家好,本篇文章主要讲的是linux环境下安装jdk和Tomcat详细步骤,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收一下,方便下次浏览
    2021-12-12
  • Git fetch和pull的详解及区别

    Git fetch和pull的详解及区别

    这篇文章主要介绍了Git fetch和pull的详解及区别的相关资料,需要的朋友可以参考下
    2017-02-02
  • Linux定时自动删除旧垃圾文件的Autotrash工具

    Linux定时自动删除旧垃圾文件的Autotrash工具

    今天小编就为大家分享一篇关于Linux定时自动删除旧垃圾文件的工具,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2018-09-09
  • Linux文本处理工具使用详解

    Linux文本处理工具使用详解

    在本篇文章里小编给各位分享的是一篇关于Linux文本处理工具使用详解内容,有兴趣的朋友们可以学习下。
    2020-03-03
  • LNMP系列教程之 设置404错误页面

    LNMP系列教程之 设置404错误页面

    在之前的文章中分享到”设置301重定向的方法“文章,提到301,那肯定也要说说404错误页面吧。因为我们默认安装了LNMP后404页面不会自动设置,也不会默认到程序的404错误页面,而需要我们手工设置
    2012-09-09
  • sphinx使用及其简单配置方法

    sphinx使用及其简单配置方法

    sphinx使用及其简单配置方法,需要的朋友可以参考下
    2011-04-04
  • Linux I/O多路复用详解及实例

    Linux I/O多路复用详解及实例

    这篇文章主要介绍了Linux I/O多路复用详解及实例的相关资料,并附实例代码,需要的朋友可以参考下
    2016-11-11
  • Linux修改用户所属组的方法

    Linux修改用户所属组的方法

    在本篇文章里小编给大家整理的是关于Linux修改用户所属组的方法,有需要的朋友们参考下。
    2020-02-02

最新评论