Linux 系统编辑 --文件IO

news2025/1/11 21:07:03

目录

1.文件 IO

1.1系统调用

1.2 C 标准库文件 IO 函数 

1.3 open/close 函数

1.4 文件描述符表 

1.7 read/write 函数

1.8 缓冲区

1.9 错误处理函数 

2.0 阻塞、非阻塞   

2.1 lseek 函数


辅助学习资料
        
参考书 1 :《 Unix 环境高级编程》 W.Richard Stevens [ ] 本讲课堂义作为 APUE 的引导。适合初学 Linux 的学员。
TCP/IP 详解》 (3 ) ,《 UNIX 网络编程》(2 卷)
参考书 2 :《 Linux 系统编程》 RobertLoVe [ ]
参考书 3 :《 Linux/UNIX 系统编程手册》 Michael Kerrisk [ ]
参考书 4 :《 Unix 内核源码剖析》 青柳隆宏 [ ]
业内知名:《 Linux 内核源代码情景分析》、《 Linux 内核设计与实现》、《深入理解 Linux内核》

1.文件 IO

1.1系统调用

什么是系统调用:
由操作系统实现并提供给外部应用程序的编程接口。 (Application Programming Interface ,API)。是应用程序同系统之间数据交互的桥梁。C 标准函数和系统函数调用关系。一个 helloworld 如何打印到屏幕。

1.2 C 标准库文件 IO 函数 

fopen fclose fseek fgets fputs fread fwrite......
r 只读、 r+ 读写
w 只写并截断为 0 w+ 读写并截断为 0
a 追加只写、 a+ 追加读写

1.3 open/close 函数

函数原型:
int open(const char *pathname, int flags);
int open(const char *pathname, int flags, mode_t mode);
int close(int fd);

常用参数

O_RDONLY O_WRONLY O_RDWR
O_APPEND O_CREAT O_EXCL O_TRUNC O_NONBLOCK
创建文件时,指定文件访问权限。权限同时受 umask 影响。结论为:文件权限 = mode & ~umask
使用头文件: <fcntl.h>

 open 常见错误

1. 打开文件不存在
2. 以写方式打开只读文件 ( 打开文件没有对应权限 )
3. 以只写方式打开目录
文件描述符:
PCB 进程控制块
可 使 用 命 令
locate sched.h
查 看 位 置 :
/usr/src/linux-headers-3.16.0-30/include/linux/sched.h
struct task_struct { 结构体

1.4 文件描述符表 

结构体 PCB 的成员变量 file_struct *file 指向文件描述符表。从应用程序使用角度,该指针可理解记忆成一个字符指针数组,下标 0/1/2/3/4... 找到文件结构体。本质是一个键值对 0、 1 2... 都分别对应具体地址。但键值对使用的特性是自动映射,我们只操作键不直接使用值。新打开文件返回文件描述符表中未使用的最小文件描述符。
STDIN_FILENO 0
STDOUT_FILENO 1
STDERR_FILENO 2
1.5 最大打开文件数
一个进程默认打开文件的个数 1024
命令查看 ulimit -a 查看 open files 对应值。默认为 1024
可以使用 ulimit -n 4096 修改
当然也可以通过修改系统配置文件永久修改该值,但是不建议这样操作。
cat /proc/sys/fs/file-max 可以查看该电脑最大可以打开的文件个数。受内存大小影响。
1.6 FILE 结构体
主要包含文件描述符、文件读写位置、 IO 缓冲区三部分内容。
struct file {
...
文件的偏移量;
文件的访问权限;
文件的打开标志;
文件内核缓冲区的首地址;
struct operations * f_op;
...
};
查看方法:
(1) /usr/src/linux-headers-3.16.0-30/include/linux/fs.h
(2) lxr :百度 lxr lxr.oss.org.cn → 选择内核版本 ( 3.10) → 点击 File Search 进行搜
→ 关键字:“ include/linux/fs.h ” → Ctrl+F 查找 “ struct file {
→ 得到文件内核中结构体定义
→ “ struct file_operations ”文件内容操作函数指针
→ “ struct inode_operations ”文件属性操作函数指针

1.7 read/write 函数

ssize_t read(int fd, void *buf, size_t count);
ssize_t write(int fd, const void *buf, size_t count);
read write 函数原型类似。使用时需注意: read/write 函数的第三个参数。练习:编写程序实现简单的 cp 功能。
程序比较:如果一个只读一个字节实现文件拷贝,使用 read write 效率高,还是使用对应的标库函数(fgetc fputc) 效率高呢?
strace 命令
shell 中使用 strace 命令跟踪程序执行,查看调用的系统函数。

1.8 缓冲区

read write 函数常常被称为 Unbuffered I/O 。指的是无用户及缓冲区。但不保证不使用内核缓冲区。

1.9 错误处理函数 

 

错误号: errno
perror 函数: void perror(const char *s);
strerror 函数:
char *strerror(int errnum);
查看错误号:
/usr/include/asm-generic/errno-base.h
/usr/include/asm-generic/errno.h
#define EPERM
1 /* Operation not permitted */
#define ENOENT 2 /* No such file or directory */
#define ESRCH
3
/* No such process */
#define EINTR
4
/* Interrupted system call */
#define EIO
5 /* I/O error */
#define ENXIO
6 /* No such device or address */
#define E2BIG
7 /* Argument list too long */
#define ENOEXEC 8 /* Exec format error */
#define EBADF
9 /* Bad file number */
#define ECHILD
10 /* No child processes */
#define EAGAIN 11 /* Try again */
#define ENOMEM 12 /* Out of memory */
#define EACCES
13 /* Permission denied */
#define EFAULT
14 /* Bad address */
#define ENOTBLK 15 /* Block device required */
#define EBUSY
16 /* Device or resource busy */
#define EEXIST
17 /* File exists */
#define EXDEV
18 /* Cross-device link */
#define ENODEV 19 /* No such device */
#define ENOTDIR 20 /* Not a directory */
#define EISDIR
21 /* Is a directory */
#define EINVAL
22 /* Invalid argument */
#define ENFILE
23 /* File table overflow */
#define EMFILE
24 /* Too many open files */
#define ENOTTY 25 /* Not a typewriter */
#define ETXTBSY 26 /* Text file busy */
#define EFBIG
27 /* File too large */
#define ENOSPC 28 /* No space left on device */
#define ESPIPE
29 /* Illegal seek */
#define EROFS
30 /* Read-only file system */
#define EMLINK 31 /* Too many links */
#define EPIPE
32 /* Broken pipe */
#define EDOM
33 /* Math argument out of domain of func */
#define ERANGE 34 /* Math result not representable */

2.0 阻塞、非阻塞   

   读常规文件是不会阻塞的,不管读多少字节, read 一定会在有限的时间内返回。从终端设备或网络读则不一定,如果从终端输入的数据没有换行符,调用 read 读终端设备就会阻塞,如果网络上没有接收到数据包,调用 read 从网络读就会阻塞,至于会阻塞多长时间也是不确定的,如果一直没有数据到达就一直阻塞在那里。同样,写常规文件是不会阻塞的,而向终端设备或网络写则不一定。
  现在明确一下阻塞( Block )这个概念。当进程调用一个阻塞的系统函数时,该进程被置于睡眠(Sleep )状态,这时内核调度其它进程运行,直到该进程等待的事件发生了(比如网络上接收到数据包,或者调用 sleep 指定的睡眠时间到了)它才有可能继续运行。与睡眠状态相对的是运行(Running )状态,在 Linux 内核中,处于运行状态的进程分为两种情况:正在被调度执行。CPU 处于该进程的上下文环境中,程序计数器( eip )里保存着该进程的指令地址,通用寄存器里保存着该进程运算过程的中间结果,正在执行该进程的指令,正在读写该进程的地址空间。
 就绪状态。该进程不需要等待什么事件发生,随时都可以执行,但 CPU 暂时还在执行另一个进程,所以该进程在一个就绪队列中等待被内核调度。系统中可能同时有多个就绪的进程,那么该调度谁执行呢?内核的调度算法是基于优先级和时间片的,而且会根据每个进程的运行情况动态调整它的优先级和时间片,让每个进程都能比较公平地得到机会执行,同时要兼顾用户体验,不能让和用户交互的进程响应太慢。
阻塞读终端:【 block_readtty.c
非阻塞读终端 nonblock_readtty.c
非阻塞读终端和等待超时:【 nonblock_timeout.c
注意,阻塞与非阻塞是对于文件而言的。而不是 read write 等的属性。 read 终端,默认阻塞读。
总结 read 函数返回值:
1. 返回非零值: 实际 read 到的字节数
2. 返回 -1 1 ): errno != EAGAIN ( != EWOULDBLOCK) read 出错
2 ): errno == EAGAIN ( == EWOULDBLOCK) 设置了非阻塞读,并且没有数据到达。
3. 返回 0 :读到文件末尾。

2.1 lseek 函数

文件偏移
Linux 中可使用系统函数 lseek 来修改文件偏移量 ( 读写位置 ) 每个打开的文件都记录着当前读写位置,打开文件时读写位置是 0 ,表示文件开头,通常读写多少个字节就会将读写位置往后移多少个字节。但是有一个例外,如果以 O_APPEND方式打开,每次写操作都会在文件末尾追加数据,然后将读写位置移到新的文件末尾。lseek和标准 I/O 库的 fseek 函数类似,可以移动当前读写位置(或者叫偏移量。回忆 fseek 的作用及常用参数。 SEEK_SET SEEK_CUR SEEK_END int fseek(FILE *stream, long offset, int whence); 成功返回 0 ;失败返回 -1
特别的:超出文件末尾位置返回 0 ;往回超出文件头位置,返回 -1 off_t lseek(int fd, off_t offset, int whence); 失败返回 -1 成功:返回的值是较文件起始位
置向后的偏移量。特别的:lseek 允许超过文件结尾设置偏移量,文件会因此被拓展。 注意文件“读”和“写”使用同一偏移位置。 【lseek.c
lseek 常用应用:
1. 使用 lseek 拓展文件: write 操作才能实质性的拓展文件。单 lseek 是不能进行拓展的。一般:write(fd, "a", 1)
od -tcx filename 查看文件的 16 进制表示形式
od -tcd filename 查看文件的 10 进制表示形式
2. 通过 lseek 获取文件的大小: lseek(fd, 0, SEEK_END);
lseek_test.c
【最后注意】: lseek 函数返回的偏移量总是相对于文件头而言。
fcntl 函数
改变一个【已经打开】的文件的 访问控制属性。重点掌握两个参数的使用,F_GETFL F_SETFL
fcntl.c
ioctl 函数
对设备的 I/O 通道进行管理,控制设备特性。 ( 主要应用于设备驱动程序中 ) 。通常用来获取文件的【物理特性】(该特性,不同文件类型所含有的值各不相同)
ioctl.c
传入传出参数
传入参数
const 关键字修饰的 指针变量 在函数内部读操作。 char *strcpy(cnost char *src, char *dst);
传出参数
1. 指针做为函数参数
2. 函数调用前,指针指向的空间可以无意义,调用后指针指向的空间有意义, 且作为函数的返回值传出
3. 在函数内部写操作。
传入传出参数:
1. 调用前指向的空间有实际意义 2. 调用期间在函数内读、写 ( 改变原值 ) 操作 3. 作为函数返回值传出。
扩展阅读:
关于虚拟 4G 内存的描述和解析:
一个进程用到的虚拟地址是由内存区域表来管理的,实际用不了 4G 。而用到的内存区域,会通过页表映射到物理内存。所以每个进程都可以使用同样的虚拟内存地址而不冲突,因为它们的物理地址实际上是不同的。内核用的是 3G 以上的 1G 虚拟内存地址,其中 896M 是直接映射到物理地址的, 128M 按需映射 896M 以上的所谓高位内存。各进程使用的是同一个内核。首先要分清“可以寻址”和“实际使用”的区别。其实我们讲的每个进程都有 4G 虚拟地址空间,讲的都是“可以寻址” 4G ,意思是虚拟地址的 0-3G 对于一个进程的用户态和内核态来说是可以访问的,而 3-4G 是只有进程的内核态可以访问的。并不是说这个进程会用满这些空间。其次,所谓“独立拥有的虚拟地址”是指对于每一个进程,都可以访问自己的 0-4G 的虚拟地址。虚拟地址是“虚拟”的,需要转化为“真实”的物理地址。好比你有你的地址簿,我有我的地址簿。你和我的地址簿都有 1、 2 3 4 页,但是每页里面的实际内容是不一样的,我的地址簿第 1 页写着 3 你的地址簿第 1 页写着 4 ,对于你、我自己来说都是用第 1 页(虚拟),实际上用的分别是第 3 4 页(物理),不冲突。内核用的 896M 虚拟地址是直接映射的,意思是只要把虚拟地址减去一个偏移量( 3G ) 就等于物理地址。同样,这里指的还是寻址,实际使用前还是要分配内存。而且 896M 只是个最大值。如果物理内存小,内核能使用(分配)的可用内存也小。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/733119.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MFC学习日记(二)——VS2012应用程序工程中文件的组成结构

上一篇我们用应用程序向导生成框架程序后&#xff0c;我们可以打开工程所在的文件夹看到以下以解决方案命名的文件夹&#xff0c;此文件夹中包含了几个文件和一个以工程名命名的子文件夹&#xff0c;这个子文件夹中又包含了若干个文件和一个res文件夹&#xff0c;创建工程时的选…

Vue2:axios解决跨域的问题(vue2没有config情况下)

在vue2上用axios发起Post模拟注册的时候&#xff0c;调用接口&#xff0c;提示报错&#xff1a; axios({method: post,url: http://1.12.254.80:8080/api/user/register,// url: /user/api/user/register,data: { // 请求体数据userAccount: userName,userPassword: pwd1,check…

离线环境下安装微软Visual Studio 2022 生成工具

1. 前言 最近&#xff0c;在学习cython的时候&#xff0c;需要安装windows下的C/C编译、链接工具。开始觉得传统的msvc太大了&#xff0c;想要尝试Mingw&#xff0c;但是都是编译错误。无奈之下&#xff0c;还是要安装msvc。 微软提供了Visual Studio 2022 Build Tools &…

MySQl数据库第五课 --------在SQl的简单命令--------学习学习

作者前言 欢迎小可爱们前来借鉴我的gtiee秦老大大 (qin-laoda) - Gitee.com ———————————————————————————— 目录 数据库的简单介绍 1.数据储存 2.数据库类型 &#xff08;1&#xff09;.关系型数据库 &#xff08;2&#xff09;.非关系型数据库…

大学英语六级相当于雅思考试多少分

雅思考试的难度&#xff0c;可以和大学英语六级进行对应&#xff0c;大家可以通过分数来基本确认雅思考试的难度系数。跟着小编来一起看看大学英语六级相当于雅思考试多少分&#xff1f; 英语六级相当于雅思多少分 大学英语六级和雅思没有直接的分数对应关系&#xff0c;一般大…

部署LVS+Keepalived高可用集群

目录 一、keepalived概述 1.1管理LVS负载均衡软件 1.2VRRP(Virtual Router Redundancy Protocol) 原理 二、keepalived服务的重要功能 2.1自动切换&#xff08;failover&#xff09; 2.2健康检查&#xff08;health checking&#xff09; 2.3高可用&#xff08;HA&#x…

深度神经网络剪枝算法基础理论

非结构化剪枝可获得更高的剪枝率与精度&#xff0c;但是其非结构化特征带来的随机连接使得往往需要专门的软、硬件设计来支持其推理加速&#xff0c;而在现有的边缘硬件上难以满足其应用条件。鉴于此&#xff0c;目前在剪枝领域的研究多集中在结构化剪枝上&#xff0c;如图1.11…

RabbitMQ系列(22)--RabbitMQ优先级队列

前言&#xff1a;在购物系统中有一个订单催付的场景&#xff0c;如果客户在购物系统下单后在设定的时间内未付款那么就会给客户推送一条短信提醒&#xff0c;这是一个比较简单的功能&#xff0c;但是&#xff0c;商家对我们来说&#xff0c;肯定是要区分大客户和小客户的&#…

Xshell7/Xftp7 解决强制更新问题:要继续使用此程序,您必须应用最新的更新或使用最新版本

文章目录 一、背景二、解决方案方案一&#xff1a;重新安装&#xff08;推荐&#xff09;方案二&#xff1a;修改nslicense.dll文件&#xff08;不推荐&#xff09;方案三&#xff1a;修改系统时间&#xff08;可选&#xff09;Xshell.batXftp.bat 三、总结 一、背景 Xshell7/…

音频编码流程 ----- PCM编码为AAC格式

文章目录 1.音频编码流程2.编码函数API含义解释3.音频编码实战Demo PCM转AAC格式 1.音频编码流程 2.编码函数API含义解释 av_frame_make_writable 确保帧数据可写&#xff0c;尽可能避免数据复制.如果帧可写&#xff0c;则不执行任何操作&#xff0c;如果不可写&#xff0c;则…

ssm整合shiro安全框架 前后端分离项目

上一篇文章我们使用ssm整合了shiro安全框架前后端没有进行分离 本篇文章在上一章的项目基础上进行前后端代码分离操作 一、根据账号和密码登录后前后端代码分离&#x1f349; (1)定义一个统一的json类 统一返回的格式&#x1f95d; package com.lzq.vo;import lombok.AllArg…

免费开源 | 基于SpringBoot的博客系统

介绍 基于springboot后端架构&#xff0c;websocket实现私信&#xff0c;前端采用thymeleafbootstraplayuiRedis 注册使用邮箱验证注册&#xff0c;且验证码存在redis中&#xff0c;所以需要有redis环境 软件架构 springbootwebsocketthymeleafbootstraplayuiRedismysql 8.…

设计模式--代理设计模式

&#x1f389;&#x1f389;&#x1f389;写在前面&#xff1a; 博主主页&#xff1a;&#x1f339;&#x1f339;&#x1f339;戳一戳&#xff0c;欢迎大佬指点&#xff01; 目标梦想&#xff1a;进大厂&#xff0c;立志成为一个牛掰的Java程序猿&#xff0c;虽然现在还是一个…

C++之std::function和lambda表达式回调函数(一百五十二)

简介&#xff1a; CSDN博客专家&#xff0c;专注Android/Linux系统&#xff0c;分享多mic语音方案、音视频、编解码等技术&#xff0c;与大家一起成长&#xff01; 优质专栏&#xff1a;Audio工程师进阶系列【原创干货持续更新中……】&#x1f680; 人生格言&#xff1a; 人生…

新版本FasterTransformer的FUSED_MHA

关于 UNFUSED_PADDED_MHA VS FUSED_MHA FUSED_MHA用了另一种kernel的执行方法(和添加链接描述相同,将在下一个section说明)UNFUSED_PADDED 的 KERNELS执行代码在 src/fastertransformer/kernels/unfused_attention_kernels.cu enum class AttentionType {UNFUSED_MHA,UNFUSED…

C#,中国福利彩票《刮刮乐》的数学算法(01)——幸运123

彩票名称&#xff1a;幸运123面值&#xff1a;20元/张最高奖&#xff1a;100万&#xff08;人民币&#xff09;全套款式&#xff1a;2款玩法介绍&#xff1a; 一份好运&#xff0c;二倍快乐&#xff0c;三重惊喜。福彩刮刮乐新游戏“幸运123”&#xff0c;红色的票面上点缀着礼…

基于simulink使用同步图像跟踪白板上的标记(附源码)

一、前言 此示例演示如何使用Simulink基于图像跟踪白板上的标记。 二、模型 示例模型包含模型引用层次结构。每个模型都有助于图像处理算法。 ex_tracking_marker- 跟踪输入视频中的标记的顶级模型。此模型使用视频查看器块呈现输出视频&#xff0c;并将输出帧记录在工作区变…

Unity桌面弹球小游戏Finger Soccer Game Kit 1.1

按住鼠标左键发射打球 还可以开启双人模式来玩 地址&#xff1a;https://download.csdn.net/download/Highning0007/88020441

《分布式中间件技术实战:Java版》学习笔记(三):Redis实现点赞、取消赞功能

用户在发布内容&#xff08;包括博客、想法、日记等等&#xff09;时&#xff0c;后台数据入库后&#xff0c;要往Redis的有序集合添加一条分数为0的记录。这个有序集合是用来对内容点赞量做排序的。同时&#xff0c;可以记录用户操作日志。 Override public String insertArt…

C++常用库函数 4.数学函数

函数名&#xff1a;abs 函数原型&#xff1a;int abs(int n) ; 参数 in 需要求绝对值的整数。 所需头文件&#xff1a;<cstdlib>或<cmath> 功能和返回值&#xff1a;返回 n 的绝对值&#xff1b;没有错误返回函数名&#xff1a;acos 函数原型&#xff1a;doubl…