C语言网络编程基础（linux）

文件描述符与套接字
网络编程的基本流程
基础的函数和结构体（持续更新）
- socket函数
- sockaddr和sockaddr_in结构体
- bind函数
- listen函数
- accept函数
- recv函数
- writev函数
- readv函数
- connect函数
- fcntl函数
epoll相关函数
- epoll_create
- epoll_ctl函数
- epoll_wait函数

文件描述符与套接字

在linux操作系统下，有万物皆文件的概念，当一个进程想要打开/创建一个文件时，内核会给进程返回一个文件描述符，文件描述符是一个非负数，常用int类型表示，起到索引的作用，是为了高效管理进程打开/创建的文件的，指向的是被打开的文件。所有I/O的系统操作也都是通过文件描述符来的；每一个进程都有一个文件描述符表，里面记录的就是进程打开/创建文件的记录

套接字是一种特殊的文件描述符，用于进程和进程之间的网络通信，常用在网络编程中

进程和进程之间通信主要有六种方式，分别是：
1.管道
2.消息队列
3.共享内存
4.信号
5.信号量
6.套接字.

套接字便是其中的一种.

网络编程的基本流程

在这里插入图片描述
这个流程很经典，就不过多赘述了.

基础的函数和结构体（持续更新）

函数太多了，这里只记录一些常用的函数

socket函数

#include <sys/socket.h>

int socket(int domain, int type, int protocol);

其中
domain表示指定套接字的地址族或协议族。常见的值包括：

AF_INET：用于IPv4 地址族。
AF_INET6：用于IPv6 地址族。
AF_UNIX 或 AF_LOCAL：用于本地（Unix 域）套接字通信。

type表示指定套接字的类型，常见的值包括：

SOCK_STREAM：用于基于流的 TCP 套接字。
SOCK_DGRAM：用于基于数据报的 UDP 套接字。
SOCK_RAW：用于原始套接字，允许更底层的数据包处理。

protocol 参数通常为 0，表示选择默认的协议。在大多数情况下，操作系统会自动选择正确的协议，例如，对于 IPv4 TCP 套接字，它会选择 TCP 协议。

返回值：socket函数的返回值是一个文件描述符（fd），经常作为网络编程中其他函数的参数.

常见的使用方式

int sockfd = socket(AF_INET, SOCK_STREAM, 0);
    if (sockfd == -1) {
        perror("socket");
        exit(EXIT_FAILURE);
    }

sockaddr和sockaddr_in结构体

sockaddr

#include <sys/socket.h>
struct sockaddr {  
     sa_family_t sin_family;//地址族
　　  char sa_data[14]; //14字节，包含套接字中的目标地址和端口信息               
　　 };

sockaddr已经被sockaddr_in取代了，这里就不详细说了。

sockaddr_in

#include<netinet/in.h>或#include <arpa/inet.h>

struct sockaddr_in {
    short int sin_family;      // 地址族（Address Family），通常为 AF_INET
    unsigned short int sin_port;  // 端口号（Port Number）
    struct in_addr sin_addr;     // IPv4 地址（32 位的 IPv4 地址）
    unsigned char sin_zero[8];   // 不使用，填充字节
};

sockaddr_in 是用于表示 IPv4 地址的 C 语言结构体，通常在网络编程中与套接字套接字相关的函数一起使用

常见的使用方式：

struct sockaddr_in addr;
    memset(&addr, 0, sizeof(addr));
    addr.sin_family = AF_INET;//绑定地址族，使用ipv4
    addr.sin_addr.s_addr = htonl(INADDR_LOOPBACK); // 127.0.0.1 //绑定地址
    addr.sin_port = htons(8000); //绑定端口

bind函数

int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

1.sockfd参数表示要进行绑定的套接字文件描述符（是socket函数的返回值）

2.sockaddr 结构体是刚才上述所说的结构体，但是sockaddr不如sockaddr_in好用，所以一般情况下是定义一个sockaddr_in结构体，然后使用强制转换成sockaddr类型

3.addrlen参数表示结构体的长度

常用的使用方式：

 struct sockaddr_in server_addr;
    server_addr.sin_family = AF_INET;
    server_addr.sin_port = htons(8080);  // 端口号 8080
    server_addr.sin_addr.s_addr = INADDR_ANY;  // 任意地址
    memset(server_addr.sin_zero, 0, sizeof(server_addr.sin_zero));
    
if (bind(sockfd, (struct sockaddr *)&server_addr, sizeof(server_addr)) == -1) {
        perror("Bind failed");
        exit(1);
    }

listen函数

listen函数作用：让套接字变成可以被动连接的状态，等待客户端的连接

int listen(int sockfd, int backlog);

sockfd参数表示文件描述符

backlog参数表示等待连接队列的最大长度，即在调用 accept 函数之前可以排队等待的最大连接数。通常，这个值为一个正整数，决定了同时等待的连接数量。

常用的使用方法：

int backlog = 5; // 最大等待连接数
if (listen(sockfd, backlog) == -1) {
        perror("Listen failed");
        exit(1);
    }

accept函数

accept 函数用于接受传入的连接请求，通常在服务器端用于接受客户端的连接

int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);

1.sockfd是文件描述符
2.addr是 sockaddr结构体，用于接收客户端的地址，端口等信息，所以跟Bind函数调用时的sockaddr要区分开来

3.addrlen是结构体的大小

常见的使用方式：

 struct sockaddr_in new_addr;
 int new_sock;
 
 addr_size = sizeof(new_addr);
 new_sock = accept(sockfd, (struct sockaddr*)&new_addr, &addr_size);

返回值：在成功接受连接请求时返回一个新的套接字，该套接字用于与客户端进行通信。这个新套接字是已连接套接字，它是服务器与客户端之间的通信通道。

这里要重点强调一下，我们后续进行客户端和服务端之间的通信时，使用的是accept函数返回的新套接字，而之前用socket函数创建的旧套接字仍然在监听新的连接请求（用于接收连接请求，而不是直接用来通信）

recv函数

recv 函数用于从已连接套接字（或者数据报套接字）接收数据
注意是已连接的套接字

int recv(int sockfd, void *buf, size_t len, int flags);

1.sockfd是文件描述符
2.buf是接收数据的缓冲区指针
3.len是缓冲区的大小
4.flags通常设置为0

返回值是recv函数读到的字节数，如果返回值为 -1，表示读取失败，失败的原因会存储在errno里面
recv函数的返回值总结

常见的使用方式:

int bytes_read=recv(sockfd,buffer,sizeof(buffer),0);

recv函数是一个阻塞函数，如果在读取时，发现并没有数据可以读，就会被阻塞住，如果不想被阻塞住，可以用fcntl函数将文件描述符设置为非阻塞模式，具体操作请看fcntl函数.

recv 和 read 函数在某些方面类似，因为它们都用于从文件描述符中读取数据。然而，它们有一些区别：

来源：
recv 是套接字库函数，用于在网络编程中接收数据。它可以用于套接字（sockets）等网络通信相关的操作。
read 是标准C I/O 函数，通常用于文件描述符，但也可以用于套接字等。它更一般化，可用于读取任何可读的文件描述符。

参数:
recv 在最后一个参数中可以指定额外的选项（flags），允许对接收操作进行控制。
read 没有额外的选项参数，它只接受文件描述符、缓冲区和长度。

错误处理:
recv 返回的错误值可能包含更多关于套接字通信的信息，如连接已断开等。因此，错误代码可能更详细。
read 的错误码可能相对简单，不会提供关于底层通信的额外信息，但它可用于读取多种文件类型。

用法:
recv 主要用于网络编程，特别是在套接字通信中，用于接收数据。
read 主要用于文件和通用文件描述符的读取，可用于从文件、管道、套接字等读取数据。

writev函数

writev 函数用于将多个分散的数据写入文件描述符（通常是文件或套接字）
也被称为集中写，与write函数的最大区别就是writev函数可以一次性写出多个缓冲区，而write函数一次性只能写出一个缓冲区

ssize_t writev(int fd, const struct iovec *iov, int iovcnt);

1.fd参数表示文件描述符
2.iov参数表示指向iovec结构体数组的结构体指针
3.iovcnt表示数组中结构体的数量

iovec数组

struct iovec {
    void *iov_base;    // 缓冲区的起始地址
    size_t iov_len;    // 缓冲区的长度
};

常见的使用方式：

    iov[0].iov_base = buf1; //缓冲区的起始地址
    iov[0].iov_len = strlen(buf1);//缓冲区的长度！
    iov[1].iov_base = buf2;
    iov[1].iov_len = strlen(buf2);

    int fd = 1;  
    ssize_t bytes_written = writev(fd, iov, 2);//将这两个缓冲区的内容全部
    //                                           写入文件描述符

readv函数

用于把文件描述符中的数据一次性读到多个缓冲区中，也叫作分散读

ssize_t readv(int fd, const struct iovec *iov, int iovcnt);

使用方法和writev类似

iov[0].iov_base= buf1;
iov[0].iov_len=sizeof(buf1);
iov[1].iov_base = buf2;
iov[1].iov_len = sizeof(buf2);
ssize_t bytes_read = readv(fd,iov,2);

connect函数

connect 函数用于建立一个客户端套接字与服务端套接字之间的连接。它在客户端套接字上调用，指示客户端要连接到指定的服务器地址和端口。

int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

1.sockfd表示要连接的客户端文件描述符
2.sockaddr表示连接时的地址及端口等信息
3.addrlen表示结构体的大小

常见使用方式：

int sockfd = socket(AF_INET, SOCK_STREAM, 0);
    if (sockfd == -1) {
        perror("socket");
        exit(1);
    }

    // 准备服务器地址信息
    struct sockaddr_in server_addr;
    server_addr.sin_family = AF_INET;
    server_addr.sin_port = htons(8080);  // 服务器端口
    server_addr.sin_addr.s_addr = inet_addr("127.0.0.1");  // 服务器IP地址

    // 连接到服务器
    if (connect(sockfd, (struct sockaddr *)&server_addr, sizeof(server_addr)) == -1) {
        perror("connect");
        exit(1);
    }

fcntl函数

fcntl 函数是一个在 Unix 和类 Unix 操作系统中使用的函数，主要用于控制文件描述符（file descriptor）的属性和执行各种操作。这包括修改文件状态标志、获取或设置文件描述符的属性、以及执行非阻塞操作等。具体来说，fcntl 函数的一些常见用途包括：

1.修改文件状态标志：通过 fcntl 函数，你可以修改文件描述符的状态标志，例如将文件设置为非阻塞模式，以便在读写操作时不会被阻塞。这是通过设置 O_NONBLOCK 标志实现的。

2.获取或设置文件描述符属性：你可以使用 fcntl 函数获取或设置文件描述符的各种属性，如获取或设置文件的访问模式、文件的拥有者、或文件的屏蔽字（file mode creation mask）等。

3.复制文件描述符：你可以使用 F_DUPFD 命令来复制一个文件描述符，这会创建一个新的文件描述符，指向与原始文件描述符相同的文件。

4.获取或设置文件锁：fcntl 函数还可用于获取或设置文件锁，以确保多个进程可以安全地访问共享文件。你可以使用 F_GETLK 命令来获取文件锁信息，或使用 F_SETLK 和 F_SETLKW 命令来设置或阻塞文件锁。

5.取消文件锁：通过 F_SETLK 命令，你还可以用来取消现有的文件锁。

参考链接：fcntl

#include <fcntl.h>

int fcntl(int fd, int cmd, ... /* arg */);

1.fd是要操作的文件描述符
2.cmd是对应的操作命令，如下：

F_DUPFD：创建一个新的文件描述符，指向与原始文件描述符相同的文件。

F_GETFD：获取文件描述符的标志。

F_SETFD：设置文件描述符的标志。

F_GETFL：获取文件的状态标志（如 O_RDONLY、O_WRONLY、O_NONBLOCK 等）。

F_SETFL：设置文件的状态标志。

F_GETOWN：获取文件描述符的所有权（如进程 ID 或进程组 ID）。

F_SETOWN：设置文件描述符的所有权。

F_GETLK：获取文件锁的信息。

F_SETLK：设置文件锁，如果锁已存在则返回错误。

F_SETLKW：设置文件锁，如果锁已存在则等待。

使用例子：

//对文件描述符设置非阻塞
int setnonblocking(int fd)
{
    int old_option = fcntl(fd, F_GETFL);
    int new_option = old_option | O_NONBLOCK;// O_NONBOLOCK为非阻塞标志.
    fcntl(fd, F_SETFL, new_option);
    return old_option;
}

因为文件描述符的标志是一个位掩码，所以必须要先获取原来的状态，再跟新状态或运算，才可以修改文件描述符的状态.

epoll相关函数

epoll是linux操作系统，内核提供给用户态专门用于多路复用的系统调用函数，其作用是可以让一个进程维护多个socket.

epoll的流程
1.使用epoll_create函数创建一个指向内核事件表的文件描述符

2.使用epoll_ctl函数将想要监听的socket和想要监听的事件类型注册到epoll上

3.使用epoll_wait函数等待事件到达，进程/线程通过对应的事件处理方式处理事件

epoll_create

#include <sys/epoll.h>
int epoll_create(int size)

作用：创建一个指向epoll内核事件表的文件描述符，返回值用于epoll其他函数的第一个参数

epoll_ctl函数

#include <sys/epoll.h>
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event)

用于将文件描述符注册到epoll上，或者对已经注册好的文件描述符修改和删除

1.第一个参数是epoll_create函数的句柄
2.第二个参数是一个命令，分别用三个宏表示注册，修改，删除

EPOLL_CTL_ADD (注册新的fd到epfd)，
EPOLL_CTL_MOD (修改已经注册的fd的监听事件)，
EPOLL_CTL_DEL (从epfd删除一个fd)；

3.event参数表示要监听的事件

epoll_event结构体

struct epoll_event {
__uint32_t events; //表示事件的类型
epoll_data_t data; //
};

events对应的事件类型有如下几种：
EPOLLIN：表示对应的文件描述符可以读（包括对端SOCKET正常关闭）

EPOLLOUT：表示对应的文件描述符可以写

EPOLLPRI：表示对应的文件描述符有紧急的数据可读（这里应该表示有带外数据到来）

EPOLLERR：表示对应的文件描述符发生错误

EPOLLHUP：表示对应的文件描述符被挂断；

EPOLLET：将EPOLL设为边缘触发(Edge Triggered)模式，这是相对于水平触发(Level Triggered)而言的

EPOLLONESHOT：只监听一次事件，当监听完这次事件之后，如果还需要继续监听这个socket的话，需要再次把这个socket加入到EPOLL队列里

epoll_data_t是一个共用体（联合体）表示用户数据，用来存储额外的信息

typedef union epoll_data {
    void *ptr;
    int fd;
    uint32_t u32;
    uint64_t u64;
} epoll_data_t;

ptr：一个指向 void 类型的指针，通常用于关联一个任意类型的指针。
fd：一个整数，通常用于关联一个文件描述符（比如套接字描述符）。
u32：一个32位的无符号整数。
u64：一个64位的无符号整数。

epoll_ctl常见的使用方式：(这里如果看不太懂events下面还有详解）

     epoll_event event;
     event.data.fd = fd;//设置文件描述符！
 #ifdef ET
     event.events = EPOLLIN | EPOLLET | EPOLLRDHUP;
 8#endif
 
#ifdef LT
    event.events = EPOLLIN | EPOLLRDHUP;
#endif

    if (one_shot)
        event.events |= EPOLLONESHOT;
    epoll_ctl(epollfd, EPOLL_CTL_ADD, fd, &event);
    setnonblocking(fd);

删除：

epoll_ctl(epollfd, EPOLL_CTL_DEL, fd, 0);
   close(fd);

修改

void modfd(int epollfd, int fd, int ev)
 {
     epoll_event event;
     event.data.fd = fd;
 
 #ifdef ET
     event.events = ev | EPOLLET | EPOLLONESHOT | EPOLLRDHUP;
 #endif
 
#ifdef LT
    event.events = ev | EPOLLONESHOT | EPOLLRDHUP;
#endif

    epoll_ctl(epollfd, EPOLL_CTL_MOD, fd, &event);
}

epoll_wait函数

用于等待事件的发生，当监控的文件描述符上有事件发生时，返回有事件发生的文件描述符的个数，通知进程处理事件

#include <sys/epoll.h>
int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout)；

1.epfd是epoll_wait函数创建的句柄
2.events表示内核得到的事件的集合
3.maxevents表示events的大小，即能够处理的最大事件数
4.timeout表示超时时间：
-1：阻塞
0：非阻塞
大于0：指定毫秒数

常见的使用方式：

int epfd = epoll_create(1); // 创建 epoll 实例
struct epoll_event events[MaxEvents]; // 用于存储事件的数组

// 将需要监听的文件描述符添加到 epoll 实例（epfd）中，使用 epoll_ctl 函数。

int num_events = epoll_wait(epfd, events, MaxEvents, timeout);

epoll_ctl函数和epoll_wait函数中的events详解：

epoll_ctl 函数：
events 参数用于指定你希望监听的事件，这个参数是用于告诉 epoll 实例需要监听哪些事件的。在调用 epoll_ctl 函数时，你需要为 events 参数赋值，指定感兴趣的事件类型，如 EPOLLIN（可读事件）或 EPOLLOUT（可写事件）等。
events 参数通常是一个位掩码，可以使用位运算来指定多个事件，例如 EPOLLIN | EPOLLOUT 表示同时监听可读和可写事件。
events 参数的角色是告诉 epoll 实例你关心的事件类型以及要监听的文件描述符。

epoll_wait 函数：
events 参数用于接收 epoll_wait 函数返回的已发生事件的信息。在调用 epoll_wait 之前，你不需要为 events 参数赋值，因为它将由 epoll_wait 函数填充。
当 epoll_wait 函数返回时，它会将已发生的事件信息填充到 events 数组中。你可以检查每个事件的类型和相关的文件描述符，以确定发生了什么事件。