Linux文件原生操作

news2025/1/31 7:30:10

Linux 中一切皆文件,那么 Linux 文件是什么?

在 Linux 中的文件

可以是:传统意义上的有序数据集合,即:文件系统中的物理文件

也可以是:设备,管道,内存。。。(Linux 管理的一切对象)

Linux 中的文件描述符

文件描述符是一个整数值,他在内核中被用于标识打开的文件或其它 I/O 资源

当打开一个文件时,系统会分配一个文件描述符来唯一标识该文件

文件描述符的范围通常是 0 到 1023

  • 0、1、2 被系统占用,分别代表标准输入、标准输出和标准错误
  • 进程中可用的文件描述符范围是 3 到 1023

Linux 原生文件编程接口

示例 -- 文件复制

文件复制实现

test1.c

#define _LARGEFILE_SOURCE
#define _LARGEFILE64_SOURCE
#define _FILE_OFFSET_BITS 64

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <memory.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

static int copy(int src, int des)
{
    int ret = 0;
    char buf[256] = {0};
    
    do
    {
        ret = read(src, buf, sizeof(buf));
        ret = (ret > 0) ? write(des, buf, ret) : ret;
    } while( ret == sizeof(buf) );
    
    return (ret >= 0);
}

int main(int argc, char* argv[]) 
{
    int src = 0;
    int des = 0;
    
    if( argc == 3 )
    {
        if( (src = open(argv[1], O_RDONLY)) == -1 )
        {
            printf("source: open error...\n");
            exit(-1);
        }
        
        if( (des = open(argv[2], O_CREAT | O_WRONLY, 0777)) == -1 )
        {
            printf("dest: open error...\n");
            exit(-1);
        }
        
        if( copy(src, des) )
        {
            printf("succeed: %s ==> %s\n", argv[1], argv[2]);
        }
        else
        {
            printf("failed...\n");
        }
        
        close(src);
        close(des);
    }
    else
    {
        printf("invalid parameters...\n");
    }
    
    return 0;
}

第 1 - 3 行的宏定义是为了可以拷贝更大的文件

第 19 - 22 行,一直不断的从源文件读取 256 字节,写入到目的文件,直到最后写入的字节不足256字节,就认为是拷贝结束了

程序运行结果如下图所示:

示例 -- 外存数组

需求:

  • 创建一个可以存储 "无限" 个元素的数组
  • 数组大小可动态扩大,即:动态向数组中追加元素
  • 提供统一访问数据元素的方式,即:以 0 下标作为起始位置

解决方案 => 时间换空间

C 语言中的数组将数据存储于内存中,使用数组前必须定义大小

  • 优点:访问速度快    缺点:大小必须固定

若要实现可 "无限追加" 的数组,则需要将数据存储于外存中

  • 将数组元素存储于文件中 (不必预先定义大小,可实时拓展)
  • 根据数组元素大小实时定位文件读写位置,并读写固定大小的数据
  • 优点:数组大小不受限制    缺点:访问速度较慢

外存数组接口设计

关键代码设计

外存数组应用示例

外存数组实现

ext_array.h

#ifndef _EXT_ARRAY_H_
#define _EXT_ARRAY_H_

typedef void EArray;

#define EArray_Init(n, type)    EArray_Init_(n, sizeof(type)) 

#define EArray_Get(type, arr, index)  ({    \
    type ret = {0};                         \
    EArray_Get_(arr, index, &ret);          \
    ret;                                    \
})

#define EArray_Set(type, arr, index, v)  ({ \
    type val = v;                           \
    EArray_Set_(arr, index, &val);          \
})

#define EArray_Append(type, arr, v)  ({ \
    type val = v;                       \
    EArray_Append_(arr, &val);          \
})

EArray* EArray_Init_(unsigned int n, unsigned int esize);

int EArray_Get_(EArray* arr, unsigned int index, void* e);
int EArray_Set_(EArray* arr, unsigned int index, const void* e);

int EArray_Append_(EArray* arr, const void* e);

unsigned int EArray_Length(EArray* arr);

void EArray_Release(EArray* arr);

#endif

ext_array.c

#define _LARGEFILE_SOURCE
#define _LARGEFILE64_SOURCE
#define _FILE_OFFSET_BITS 64

#include <time.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <fcntl.h>
#include "ext_array.h"

typedef struct _ext_array_
{
    int fd;
    char name[128];
    unsigned int esize;
    unsigned int length;
}ExtArray;

EArray* EArray_Init_(unsigned int n, unsigned int esize)
{
    ExtArray* ret = malloc(sizeof(ExtArray));
    
    if( ret )
    {
        time_t t = {0};
    
        time(&t);
        
        sprintf(ret->name, "./%ld", t);
    
        if( (ret->fd = open(ret->name, O_CREAT | O_RDWR, 0777)) != -1 )
        {
            int i = 0;
            
            for(i=0; i<n*esize; i++)
            {
                char c = 0;
                write(ret->fd, &c, 1);
            }
            
            ret->esize = esize;
            ret->length = n;
        }
        else
        {
            free(ret);
            ret = NULL;
        }
    }
    
    return ret;
}

int EArray_Get_(EArray* arr, unsigned int index, void* e)
{
    int ret = -1;
    ExtArray* ea = arr;
    
    if( ea && e && (index < ea->length) )
    {
        lseek(ea->fd, index * ea->esize, SEEK_SET);
        ret = read(ea->fd, e, ea->esize);
    }
    
    return ret;
}

int EArray_Set_(EArray* arr, unsigned int index, const void* e)
{
    int ret = -1;
    ExtArray* ea = arr;
    
    if( ea && e && (index < ea->length) )
    {
        lseek(ea->fd, index * ea->esize, SEEK_SET);
        ret = write(ea->fd, e, ea->esize);
    }
    
    return ret;
}

int EArray_Append_(EArray* arr, const void* e)
{
    int ret = -1;
    ExtArray* ea = arr;
    
    if( ea && e )
    {
        lseek(ea->fd, 0, SEEK_END);
        ret = write(ea->fd, e, ea->esize);
        
        if( ret != -1 )
        {
            ea->length += 1;
        }
    }
    
    return ret;
}

unsigned int EArray_Length(EArray* arr)
{
    int ret = -1;
    ExtArray* ea = arr;
    
    if( ea )
    {
        ret = ea->length;
    }
    
    return ret;
}

void EArray_Release(EArray* arr)
{
    ExtArray* ea = arr;
    
    if( ea )
    {
        close(ea->fd);
        unlink(ea->name);
        free(ea);
    }
}

test2.c


#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <memory.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

#include "ext_array.h"

int main(int argc, char* argv[]) 
{
    EArray* arr = EArray_Init(5, int);
    int i = 0;
    
    printf("length = %d\n", EArray_Length(arr));
    
    for(i=0; i<EArray_Length(arr); i++)
    {
        EArray_Set(int, arr, i, i + 1);
    }
    
    EArray_Append(int, arr, 1000);
    
    printf("length = %d\n", EArray_Length(arr));
    
    for(i=0; i<EArray_Length(arr); i++)
    {
        int val = EArray_Get(int, arr, i);
        printf("val = %d\n", val);
    }
    
    EArray_Release(arr);
    
    return 0;
}


EArray_Init_(...) 函数用于创建一个随机文件名的文件,用于存储数组的内容,将这片预定义的空间先写为0

EArray_Get_(...) 和 EArray_Set_(...) 函数通过 lseek(...) 定位到要读写元素的位置,然后进行读写

EArray_Append_(...) 函数通过 lseek(...) 定位到文件的末尾,然后再进行写入操作

我们定义 EArray_Get、EArray_Set 和 EArray_Append 这三个宏,是因为这三个函数末尾带下划线的版本需要传入元素的地址而不是数据,而传入地址,我们每次调用的时候都必须先定义出一个变量出来,再传入这个变量的地址,这样使用很不方便,所以才定义这三个宏,可以直接传入数据

Linux 一切皆文件?

ASCII C 文件操作:

  • stdin => 标准输入流,stdout => 标准输出流,stderr => 标准错误输出

Linux 原生文件操作:

  • 1 => 显示设备,0 => 输入设备,2 => 错误设备

以文件的方式操作设备

通过 ASCII C 文件操作 => 输入 / 输出

通过 Linux 文件操作 => 输入 / 输出

设备文件操作

test3.c


#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <memory.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

static void ascii_file_io()
{
    char buf[16] = {0};
    int i = 0;
    char c = 0;
    
    do
    {
        fread(&c, sizeof(c), 1, stdin);
        
        if( c == '\n' )
            break;
        else
            buf[i++] = c;
        
    } while( i < 16);
    
    fwrite("output: ", 1, 8, stdout);
    fwrite(buf, 1, i, stdout);
    fwrite("\n", 1, 1, stdout);
}

static void linux_file_io()
{
    char buf[16] = {0};
    int i = 0;
    /*
    do
    {
        char c = 0;
        
        read(0, &c, 1);
        
        if( c == '\n' )
            break;
        else
            buf[i++] = c;
        
    } while( i < 16);*/
    
    i = read(0, buf, sizeof(buf));
    
    write(1, "output: ", 8);
    write(1, buf, i);
    write(1, "\n", 1);
}
int main(int argc, char* argv[]) 
{
    // ascii_file_io();
    linux_file_io();
    
    return 0;
}

第 50 行,我们读取文件描述符 0(标准输入),标准输入默认为行缓冲,所以我们在键盘上输入换行符,read 才会返回

程序运行结果如下图所示:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2286814.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

(undone) MIT6.S081 2023 学习笔记 (Day7: LAB6 Multithreading)

网页&#xff1a;https://pdos.csail.mit.edu/6.S081/2023/labs/thread.html 任务1&#xff1a;Uthread: switching between threads (moderate) (doing) 在这个练习中&#xff0c;你将设计一个用户级线程系统中的上下文切换机制&#xff0c;并实现它。为了帮助你开始&#xf…

Zookeeper入门部署(单点与集群)

本篇文章基于docker方式部署zookeeper集群&#xff0c;请先安装docker 目录 1. docker初期准备 2.启动zookeeper 2.1 单点部署 2.2 集群部署 3. Linux脚本实现快速切换启动关闭 1. docker初期准备 拉取zookeeper镜像 docker pull zookeeper:3.5.6 如果拉取时间过长&#xf…

【AI非常道】二零二五年一月(二),AI非常道

经常在社区看到一些非常有启发或者有收获的话语&#xff0c;但是&#xff0c;往往看过就成为过眼云烟&#xff0c;有时再想去找又找不到。索性&#xff0c;今年开始&#xff0c;看到好的言语&#xff0c;就记录下来&#xff0c;一月一发布&#xff0c;亦供大家参考。 有关AI非…

jQuery小游戏(二)

jQuery小游戏&#xff08;二&#xff09; 今天是新年的第二天&#xff0c;本人在这里祝大家&#xff0c;新年快乐&#xff0c;万事胜意&#x1f495; 紧接jQuery小游戏&#xff08;一&#xff09;的内容&#xff0c;我们开始继续往下咯&#x1f61c; 游戏中使用到的方法 key…

【硬件测试】基于FPGA的QPSK+帧同步系统开发与硬件片内测试,包含高斯信道,误码统计,可设置SNR

目录 1.算法仿真效果 2.算法涉及理论知识概要 2.1QPSK 2.2 帧同步 3.Verilog核心程序 4.开发板使用说明和如何移植不同的开发板 5.完整算法代码文件获得 1.算法仿真效果 本文是之前写的文章 《基于FPGA的QPSK帧同步系统verilog开发,包含testbench,高斯信道,误码统计,可…

NVIDIA GPU介绍:概念、序列、核心、A100、H100

概述 入职一家大模型领域创业公司&#xff0c;恶补相关知识。 概念 一些概念&#xff1a; HPC&#xff1a;High Performance Computing&#xff0c;高性能计算SoC&#xff1a;System on Chip&#xff0c;单片系统FLOPS&#xff1a;Floating Point Operations Per Second&am…

C++ list 容器用法

C list 容器用法 C 标准库提供了丰富的功能&#xff0c;其中 <list> 是一个非常重要的容器类&#xff0c;用于存储元素集合&#xff0c;支持双向迭代器。<list> 是 C 标准模板库&#xff08;STL&#xff09;中的一个序列容器&#xff0c;它允许在容器的任意位置快速…

解密全同态加密中的自举(Bootstrapping)

摘要 自举&#xff08;Bootstrapping&#xff09;是全同态加密&#xff08;Fully Homomorphic Encryption, FHE&#xff09;中经常使用的术语。熟悉 FHE 的人都知道&#xff0c;自举是 FHE 方案中最复杂且计算密集的部分。然而&#xff0c;只有极少数非 FHE 专家真正理解自举操…

显示当前绑定变量

来自v$sql中的信息 测试两个变量的情况&#xff08;实际可以看6个&#xff0c;可根据需要修改&#xff09; DROP TABLE T1 PURGE; CREATE TABLE T1 AS SELECT A.*,SYSDATE RIQI FROM DBA_USERS A ORDER BY 1;var mc char(3); var id number; exec :mc:SYS; exec :id:50;set li…

arm-linux-gnueabihf安装

Linaro Releases windows下打开wsl2中的ubuntu&#xff0c;资源管理器中输入&#xff1a; \\wsl$gcc-linaro-4.9.4-2017.01-x86_64_arm-linux-gnueabihf.tar.xz 复制到/home/ark01/tool 在 Ubuntu 中创建目录&#xff1a; /usr/local/arm&#xff0c;命令如下&#xff1a; …

宝塔面板SSL加密访问设置教程

参考:https://www.bt.cn/bbs/thread-117246-1-1.html 如何快速使用证书加密访问面板 因早期默认未开启https访问所以没有相关的风险提醒&#xff0c;现面板默认已开启https加密访问、提升安全性 由于采用的是服务器内部本身签发证书&#xff0c;不被公网浏览器信任请参考以下步…

Baklib在知识管理创新中的价值体现与其他产品的优势比较分析

内容概要 在当前的数字化时代&#xff0c;知识管理成为企业成功的重要组成部分。有效的知识管理不仅有助于提升内部沟通效率&#xff0c;还能促进创新与决策的科学化。尤其是Baklib作为一种知识中台&#xff0c;具有独特的价值&#xff0c;它能够融合企业内外的知识资源&#…

机器学习周报-文献阅读

文章目录 摘要Abstract 1 相关知识1.1 WDN建模1.2 掩码操作&#xff08;Masking Operation&#xff09; 2 论文内容2.1 WDN信息的数据处理2.2 使用所收集的数据构造模型2.2.1 Gated graph neural network2.2.2 Masking operation2.2.3 Training loss2.2.4 Evaluation metrics 2…

C语言连接Mysql

目录 C语言连接Mysql下载 mysql 开发库 方法介绍mysql_init()mysql_real_connect()mysql_query()mysql_store_result()mysql_num_fields()mysql_fetch_fields()mysql_fetch_row()mysql_free_result()mysql_close() 完整代码 C语言连接Mysql 下载 mysql 开发库 方法一&#xf…

Synology 群辉NAS安装(6)安装mssql

Synology 群辉NAS安装&#xff08;6&#xff09;安装mssql 写在前面mssql 2019:成功安装说明&#xff0c;这个最终成功了 mssql 2022没有成功1. pull image2.启动mssql docker container 远程连接 写在前面 mssq是一个重要节点。 这是因为我对mysql没有一丝好感。虽然接触了许…

WEB集群1-5天

文章目录 第一天、1、初始化配置1. 编写的初始化的脚本 init_env.sh2. 远程拷贝初始化脚本到mysql服务器里3.在mysql这台服务器上执行脚本 2、总结 第二天1、yumyum介绍yum操作将冯老师提供的网站的源码包上传到web服务器 2、部署网站1、解压文件2、epel源&#xff1a;可以提供…

“AI视频智能分析系统:让每一帧视频都充满智慧

嘿&#xff0c;大家好&#xff01;今天咱们来聊聊一个特别厉害的东西——AI视频智能分析系统。想象一下&#xff0c;如果你有一个超级聪明的“视频助手”&#xff0c;它不仅能自动识别视频中的各种元素&#xff0c;还能根据内容生成详细的分析报告&#xff0c;是不是感觉特别酷…

kaggle视频追踪NFL Health Safety - Helmet Assignment

3年前的比赛了&#xff0c;检测视频中的头盔&#xff0c;通过对比赛录像的分析&#xff0c;正确指派球员。每个进攻都有两个相关的视频&#xff0c;一个是边线视角&#xff0c;另一个是端区视角&#xff0c;而且这两个视频是同步的&#xff0c;即视频中的每一帧都是对应的。我用…

idea对jar包内容进行反编译

1.先安装一下这个插件java Bytecode Decompiler 2.找到这个插件的路径&#xff0c;在idea的plugins下面的lib文件夹内&#xff1a;java-decompiler.jar。下面是我自己本地的插件路径&#xff0c;以作参考&#xff1a; D:\dev\utils\idea\IntelliJ IDEA 2020.1.3\plugins\java-d…

deepseek R1 14b硬件要求

RTX2080ti 11G显卡&#xff0c;模型7b速度挺快&#xff0c;试试14B也不错。 7B显存使用5.6G&#xff0c;11B显存刚好够&#xff0c;出文字速度差不多。 打算自己写个移动宽带的IPTV播放器&#xff0c;不知道怎么下手&#xff0c;就先问他了。