【Linux】:重定向和缓冲区

news2024/11/23 12:12:51

朋友们、伙计们,我们又见面了,本期来给大家带来关于重定向和缓冲区的相关知识点,如果看完之后对你有一定的启发,那么请留下你的三连,祝大家心想事成!

C 语 言 专 栏:C语言:从入门到精通

数据结构专栏:数据结构

个  人  主  页 :stackY、

C + + 专 栏   :C++

Linux 专 栏  :Linux

目录

1. 重定向

1.1 输出重定向 

1.2 追加重定向

1.3 输入重定向

1.4 重定向系统调用接口

2. 标准错误stderr

3. 缓冲区

3.1 缓冲区存在的价值

3.2 缓冲区的刷新方式

3.3 分析样例 

3.4 用户缓冲区和内核缓冲区

3.5 何为刷新

3.6 FILE结构体


1. 重定向

重定向这个概念在前面Linux常见指令章节就介绍过它的指令以及用法,那么本节来一起深入了解一下重定向:

1.1 输出重定向 

echo 字符串 > 文件 :将本来输出在显示器文件(标准输出)上的字符串输出至指定的文件。

标准输出对应的文件fd是1。

下面用代码来实现一下重定向的功能:
 

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <string.h>

#define FILE_NAME "log.txt"

int main()
{
    // 关闭标准输出
    close(1);
    int fd = open(FILE_NAME, O_WRONLY | O_CREAT | O_TRUNC, 0666);
    printf("fd: %d\n", fd);
    fprintf(stdout, "stdout->fd: %d\n", stdout->_fileno);

    // 刷新
    fflush(stdout);
    close(fd);
}

先看结果,再分析代码:

我们都知道文件fd的分配规则,是寻找最小的未被使用的fd进行分配,所以我们先把1号文件描述符关闭,然后再打开文件时,1号文件描述符就被新打开的文件分配走了,这些C语言打印函数,默认是往1号文件描述符对应的文件中打印,简单的说就是它们只认识1这个数字,并不会在乎这个文件到底是不是显示器文件,所以才会把数据打印到新打开的文件中。

至于这里为什么要加这个fflush用来刷新缓冲区在后续会详细介绍。

1.2 追加重定向

追加重定向直接把打开文件时的方式从清空改为追加即可:

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <string.h>

#define FILE_NAME "log.txt"

int main()
{
    // 关闭标准输出
    close(1);
    //int fd = open(FILE_NAME, O_WRONLY | O_CREAT | O_TRUNC, 0666);
    int fd = open(FILE_NAME, O_WRONLY | O_CREAT | O_APPEND, 0666);
    printf("fd: %d\n", fd);
    fprintf(stdout, "stdout->fd: %d\n", stdout->_fileno);

    // 刷新
    fflush(stdout);
    close(fd);
}


1.3 输入重定向

cat指令默认是从标准输入键盘文件中读取数据;

cat < 文件:本来从键盘读取数据,但是重定向为从指定的文件读取数据。

标准输入对应的文件fd是0。

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <string.h>

#define FILE_NAME "log.txt"

int main()
{
    // 关闭标准输入
    close(0);

    int fd = open(FILE_NAME, O_RDONLY);

    char buffer[1024];
    fread(buffer, 1, sizeof(buffer), stdin);

    printf("%s\n", buffer);
    close(fd);
}

当我们把标准输入文件fd关闭后,根据文件fd的分配规则,新创建的文件就被分配到了0号文件fd,C语言的这些读取接口只认识0号文件fd,只认识0这个数组,所以就直接从0号fd对应的文件中直接读取。

重定向之后上层的fd不变,但是底层fd的指向在变化,所以重定向的本质是修改特定文件fd的下标内容。 

1.4 重定向系统调用接口

#include <unistd.h>
int dup2(int oldfd, int newfd);

代码演示:

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

#define FILE_NAME "log.txt"

int main()
{
    int fd = open(FILE_NAME, O_RDONLY);
    // 重定向
    dup2(fd, 0);
    char buffer[1024];
    fread(buffer, 1, sizeof(buffer), stdin);

    printf("%s\n", buffer);
    close(fd);
}

dpu2接口其实是文件描述符级别的数组内容的拷贝!

注意:

程序替换是不影响曾经的重定向;

程序替换没有创建新的进程,它更改的是物理到虚拟的转化以及对应的页表,并不会影响进程PCB,所以程序替换不会影响重定向。 

2. 标准错误stderr

打印结果分为错误打印和正确打印,正确打印对应的是stdin,错误打印对应的是stderr,它们两者都是打印在显示器上的。

有了stderr之后,就可以将正确打印和错误打印的数据分别存储在两个不同的文件,最主要的是为了查错,当程序出错时,直接去存储错误结果文件查找错误原因。

我们在命令行使用的重定向都是简写,完整的写法是:

./exe 1 > log.txt  // 输出重定向至log.txt
./exe 1 > log.txt 2 > &1 // 将标准输出和标准错误都重定向至log.txt
./exe 1 > log.txt 2 > log.txt.error // 标准输出重定向至log.txt,标准错误重定向至log.txt.error

3. 缓冲区

在前面的文件fd章节提到过,读写数据的本质是将内核缓冲区中的数据来回拷贝。

那么我们所理解的缓冲区其实就是一块由操作系统提供的内存空间。

3.1 缓冲区存在的价值

举一个现实中的例子来理解缓冲区:

小明居住在西安,他的好朋友居住在苏州,小华和小明每年都要过生日,双方都会在彼此过生日的时候挑选好生日礼物,小明等到小华过生日的前两个月,直接骑着骑行车从西安历经两个月到了苏州,刚好把他给小华准备的生日礼物送到,小华在小明过生日的时候也一样,都是骑两个月自行车去送礼物,就这样持续了好几年,某一天小明和小华家楼下都开了一家快递公司,每小华过生日的小明直接把礼物交给快递公司,让快递公司托运给小华,当小明把礼物给快递公司时,站在小明的视角礼物已经送走了,但是站在小华的视角,礼物当前还没收到,需要时间,但这个时间肯定比小明骑着自行车送过来要更快。

在这个例子中,这个快递公司扮演的角色就类似于缓冲区,正是有了快递公司的存在,大大提升了小明送礼物的效率。

所以缓冲区的存在可以提高使用者的效率,正是因为有了缓冲区的存在,我们可以积累一部分数据再统一发送,减小了发送成本,提升了发送效率。 

3.2 缓冲区的刷新方式

因为缓冲区可以暂存数据,所以它必须要有对应的刷新策略;
一般策略:

  • 1. 无缓冲(有数据立即刷新)
  • 2. 行缓冲(按行为单位进行刷新)
  • 3. 全缓冲(等到数据写满缓冲区再刷新)

特殊策略:

  • 1. 强制刷新
  • 2. 进程退出的时候,一般要进行刷新缓冲区

对于显示器文件,一般使用的是行刷新策略;

对于磁盘文件,一般使用的是全缓冲策略。

3.3 分析样例 

下面以缓冲区这个概念为基础,分析一下下面这段代码:

#include <stdio.h>
#include <string.h>
#include <unistd.h>

int main()
{
    fprintf(stdout, "C: hello fprintf\n");
    printf("C: hello printf\n");
    fputs("C: hello fputs\n", stdout);
    const char *str = "system call: hello write\n";
    write(1, str, strlen(str));

    fork(); // 注意fork的位置!
    return 0;
}

命令行运行结果:

当我们直接运行是,和预期一致,都是打印在显示器上的,没有任何问题,但是一旦我们重定向至文件,此时就很奇怪了,接下来我们一步一步分析: 

  • 1. 当我们直接向显示器打印,显示器文件的刷新方式是行刷新,我们打印的字符串都有'\n',在fork创建子进程之前,数据已经被刷新完毕,所以三条C接口消息和一条系统调用接口消息。
  • 2.  当我们将内容重定向至文件log.txt,本质就是向磁盘文件进行写入,我们的系统对于数据的刷新策略从行缓冲变成了全缓冲!
  • 3. 全缓冲的策略意味着缓冲区变大,我们写入的简单数据不足以把缓冲区写满,所以在fork执行的时候,数据依旧停留在缓冲区中。
  • 4. 当进程退出的时候,一般要刷新缓冲区,即使数据没有满足刷新条件!
  • 5. 观察文件中的写入结果发现C接口写入的数据是双倍的,但是系统调用接口写入的数据只有一个,所以这里的缓冲区和和操作系统没有关系,只和C语言本身有关!
  • 6. C/C++提供给我们的缓冲区,里面一定保存的是用户的数据,属于当前进程在运行时自己的数据,但是,当我们把数据交给了OS,此时该数据就属于OS,不属于用户了。
  • 7. 刷新缓冲区的这个操作就是把进程的数据写入到操作系统,刷新的操作属于清空、写入,所以,在fork之后,OS检测到了父子进程任意一方要对数据进行写入、清空,此时就发生了写时拷贝,父子进程各有一份数据,所以才会C语言调用的接口写入数据时才会写入两次。
  • 8. 系统调用接口是直接写入到操作系统,不属于进程数据,所以不发生写时拷贝,只会有一份数据。

3.4 用户缓冲区和内核缓冲区

用户缓冲区就是我们使用的C/C++提供的语言级别的缓冲区。

内核缓冲区是由OS提供的一块内存空间。

3.5 何为刷新

我们使用C语言的接口写入数据时首先是要把数据写入到C语言提供的缓冲区的,那么C语言的缓冲区就有对应的刷新策略(行缓冲、全缓冲等),当数据满足刷新策略时,就会将数据写入到内核缓冲区,所以从用户缓冲区写入到内核缓冲区的这个工作就叫做刷新。

内核缓冲区刷新也有它对应的刷新策略。

C/C++语言提供的缓冲区也是为了提高函数调用(printf、fprintf等)的效率。 

3.6 FILE结构体

前面说过FILE结构体中包含了文件描述符,现在来看它里面也必定也包含了C缓冲区

在Linux在命令行输入:vim /usr/include/libio.h +246 就可以查看对应的FILE结构体对象了。

朋友们、伙计们,美好的时光总是短暂的,我们本期的的分享就到此结束,欲知后事如何,请听下回分解~,最后看完别忘了留下你们弥足珍贵的三连喔,感谢大家的支持!    

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1926588.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【题解】 栈和排序(栈 + 预处理 / 贪心)

https://www.nowcoder.com/practice/95cb356556cf430f912e7bdf1bc2ec8f?tpId196&tqId37173&ru/exam/oj 预处理最大值 #include <climits> // 包含标准整数类型的定义 #include <vector> // 包含标准vector容器的定义class Solution {public:/*** 栈排…

接着探索Linux的世界 -- 基本指令(文件查看、时间相关、打包压缩等等)

话不多说&#xff0c;直接进入主题 一、cat指令 -- 查看目标文件的内容 语法&#xff1a;cat [选项][文件] 功能&#xff1a; 查看目标文件的内容 -b 对非空输出行编号 -n 对输出的所有行编号 -s 不输出多行空行 1、查看目标文件的内容 2、 -b 对非空输出行编号 3、-n 对…

论文浅尝 | 学会使用上下文学习来进行命名实体识别

笔记整理&#xff1a;王润哲&#xff0c;东南大学硕士&#xff0c;研究方向为大模型 链接&#xff1a;https://aclanthology.org/2023.acl-long.764.pdf 1. 动机 实体关系是知识图谱中不可或缺的一层重要信息&#xff0c;它们描述了实体之间的语义关系&#xff0c;这种连接使得…

【填坑指南】PHP8报:Unable to load dynamic library ‘zip.so’ 错误

1.原因分析 这种情况多数发生在PHP安装时因为各种原因失败后&#xff0c;残余的库与最后安装的PHP版本不兼容导致的。 2.我的路径 一开始我按照以前摸索出来的安装PHP7.3的成功经验来编译方法安装PHP8.3&#xff0c;发现以前的套路已经失效了。反复重装PHP8.3失败后&#xf…

Visual Studio 安装程序无法执行修复或更新

一.问题场景 出现问题的场景&#xff1a;当你的VS已经安装但是无法在工具中下载新组件或者卸载了当时一直无法安装。 二.问题原因 如果计算机上的 Visual Studio 实例已损坏&#xff0c;则可能会出现此问题。 三.解决方法 如果之前尝试修复或更新 Visual Studio 失败&…

Qt5离线安装包无法下载问题解决办法

Qt5离线安装包无法下载问题解决办法 文章目录 Qt5离线安装包无法下载问题解决办法1、前言2、Qt5安装包下载办法 更多精彩内容&#x1f449;个人内容分类汇总 &#x1f448;&#x1f449;Qt开发经验 &#x1f448; 1、前言 Qt安装包官方下载地址 Qt5离线安装包目前在国内已经被墙…

Meta即将推出4000亿的Llama 3 超级AI模型,或将改写大语言模型竞争格局!|TodayAI

2024年4月&#xff0c;科技巨头Meta发布了其最新的AI大型语言模型——Llama 3&#xff0c;该模型基于一个至少比前代产品Llama 2大七倍的数据集&#xff0c;展现出前所未有的性能。在最初发布时&#xff0c;Llama 3提供了8B和70B两种参数规模的版本&#xff0c;并迅速超越了Goo…

SpringBoot新手快速入门系列教程十一:自动生成API文档,Springboot3.x集成SpringDoc

本次项目我们用Maven来做&#xff0c;最近发现gradle其实很多项目的支持比较差&#xff0c;所以项目还是用Maven来新建项目。对比了市面上的几种API生成第三方库&#xff0c;只有springdoc 是能够按照文档就能部署出来的。 官网&#xff1a; OpenAPI 3 Library for spring-bo…

【学习笔记】无人机(UAV)在3GPP系统中的增强支持(八)-通过无人机进行无线接入

引言 本文是3GPP TR 22.829 V17.1.0技术报告&#xff0c;专注于无人机&#xff08;UAV&#xff09;在3GPP系统中的增强支持。文章提出了多个无人机应用场景&#xff0c;分析了相应的能力要求&#xff0c;并建议了新的服务级别要求和关键性能指标&#xff08;KPIs&#xff09;。…

C++基础(二十):常见C++11的新特性

1979年&#xff0c;贝尔实验室的本贾尼等人试图分析unix内核的时候&#xff0c;试图将内核模块化&#xff0c;于是在C 语言的基础上进行扩展&#xff0c;增加了类的机制&#xff0c;完成了一个可以运行的预处理程序&#xff0c;称之为C with classes。语言的发展就像是练功打怪…

gd32发送数据,定义参数,接收中断

void usart_receive_data(uint8_t ucch) {usart_data_receive(UART3); } void usart_send_data(uint8_t ucch) {usart_data_transmit(UART3,(uint8_t)ucch);while(usart_flag_get(UART3,USART_FLAG_TBE) RESET); } 这是在c文件中定义函数&#xff0c;之后在h文件中声明&#…

记录些Redis题集(2)

Redis 的多路IO复用 多路I/O复用是一种同时监听多个文件描述符&#xff08;如Socket&#xff09;的状态变化&#xff0c;并能在某个文件描述符就绪时执行相应操作的技术。在Redis中&#xff0c;多路I/O复用技术主要用于处理客户端的连接请求和读写操作&#xff0c;以实现高并发…

eProsima Fast DDS getting started

系列文章目录 文章目录 系列文章目录preface**对象与数据结构**● Publish-Subscriber模块● RTPS模块**配置Attributes** Discovery传输控制前言0、安装cmake安装相关源码安装&#xff1a;- A foonathan_memory_vendor- C fastcdr- D tinyxml2- E asio- F openssl- G fastrtps…

贪心:交换论证法

目录 切蛋糕的最小总开销 切蛋糕的最小总开销 交换论证&#xff1a; 设横切的开销为 h&#xff0c;如果先横切&#xff0c;设需要横切 cnt_h 次。 设竖切的开销为 v&#xff0c;如果先竖切&#xff0c;设需要竖切 cnt_v 次。 先横切&#xff0c;再竖切&#xff0c;那么竖切…

模拟电路再理解系列(3)-共射极放大电路

1.三极管 共射极放大电路的主要器件是三极管&#xff0c;先来梳理一下这个经常见到的元器件 结构 三极管的三个极&#xff1a;基极&#xff0c;集电极&#xff0c;发射极 基极流经的电流来控制集电极和发射极之间的导通和关闭&#xff0c;之前看过一个形象的比喻&#xff0c…

51单片机9(使用左移实现流水灯编程)

一、序言&#xff1a;下面我们来给大家介绍一下这个流水灯&#xff0c;流水灯如何来实现&#xff1f;我们依然使用这个工程来完成它。 1、那要使用实现这个流水灯&#xff0c;那我们只需要让D1到D8逐个的点亮&#xff0c;那同样要实现它足够的点亮&#xff0c;也会涉及到延时&…

windows10 安装Anaconda

文章目录 1. 下载2. 安装3. 配置环境变量4. 检查是否安装成功 1. 下载 官网下载 https://www.anaconda.com/download 下载的最新版本&#xff0c;要求python的版本也高一些 清华大学开源软件镜像站 https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 所有版本在这个网…

在 PostgreSQL 里如何实现数据的分布式事务的回滚和补偿机制?

&#x1f345;关注博主&#x1f397;️ 带你畅游技术世界&#xff0c;不错过每一次成长机会&#xff01;&#x1f4da;领书&#xff1a;PostgreSQL 入门到精通.pdf 文章目录 在 PostgreSQL 里如何实现数据的分布式事务的回滚和补偿机制一、分布式事务的概念与挑战&#xff08;一…

书生大模型实战营-入门岛-第二关

Python实现wordcount def wordcount(text):words text.split()ans{}for word in words:if word not in ans: ans[word] 1 else: ans[word] 1 return ans text """Hello world! This is an example. Word count is fun. Is it fun to cou…

【日常记录】【CSS】display:inline 的样式截断

文章目录 1. 案例2. css属性&#xff1a;box-decoration-break参考地址 1. 案例 现在有一篇文章&#xff0c;某些句子&#xff0c;是要被标记的&#xff0c;加一些css 让他突出一下 可以看到&#xff0c;在最后&#xff0c;断开了&#xff0c;那如若要让 断开哪里的样式 和 开始…