分包和粘包在TCP网络编程中是非常常见的，分包会造成接收端接收的数据不全的问题，粘包会造成接收多余的数据的文件。

这里做一个举例，例如客户端A要发送字符串“helloworld”给服务器B，A是一次性发送，但TCP有可能会将其分成两个包去发送，如分成“hello”和“world”，当服务器不知道数据已经被分成两个包去发送了，它只是接收也一个包，即只接收了“hello”，造成数据接收不全的问题！

或者说，当发送的数据过小时，却连续发送多次时，TCP会将他们同时打包，一起发送，接收时如果也是一次性接收，那么就会接收了多余的数据了！

一、TCP分包

二、TCP粘包

三、分包和粘包的解决方案

1. 组合数据关键代码

2. 解析数据关键代码

四、示例

client.c

server.c

编译运行测试

五、总结

一、TCP分包

场景：发送方发送字符串”helloworld”，接收方却分别接收到了两个数据包：字符串”hello”和”world”；

发送端发送了数量较多的数据，接收端读取数据时候数据分批到达，造成一次发送多次读取；

造成分包的原因：

TCP是以段（Segment）为单位发送数据的,建立TCP链接后,有一个最大消息长度（MSS）.如果应用层数据包超过MSS,就会把应用层数据包拆分,分成两个段来发送.

这个时候接收端的应用层就要拼接这两个TCP包，才能正确处理数据。

相关的,路由器有一个MTU（最大传输单元）一般是1500字节,除去IP头部20字节,留给TCP的就只有MTU-20字节。所以一般TCP的MSS为MTU-20=1460字节；

当应用层数据超过1460字节时,TCP会分多个数据包来发送。

二、TCP粘包

场景：发送方发送字符串”helloworld”，接收方却接收到了两个字符串”hello”和”world”；

发送端发送了几次数据，接收端一次性读取了所有数据，造成多次发送一次读取；通常是网络流量优化，把多个小的数据段集满达到一定的数据量，从而减少网络链路中的传输次数；

造成TCP粘包的原因：

TCP为了提高网络的利用率,会使用一个叫做Nagle的算法.该算法是指,发送端即使有要发送的数据,如果很少的话,会延迟发送.如果应用层给TCP传送数据很快的话,就会把两个应用层数据包“粘”在一起,TCP最后只发一个TCP数据包给接收端.

三、分包和粘包的解决方案

发送数据前，给数据附加固定的头部长度：

1. 包标识：包头部的特殊标识，用来标识包的开始；

2. 数据长度：数据包的大小，固定长度，2、4 或者8字节；

3. 数据内容：数据内容，长度为数据头定义的长度大小；

假设包标识是FBEB，即，如果发送的数据是helloworld，则组合发送的数据为：FBEB10helloworld

实际操作如下：

a）发送端：先发送包表示和长度，再发送数据内容。

b）接收端：先解析本次数据包的大小N，再读取N个字节，这N个字节就是一个完整的数据内容。

具体流程如下：

按照这种思路，就可以解决分包和粘包的问题了！

1. 组合数据关键代码

#define DATA_LEN_BYTES  4
const char *TAG = "FBEB";

char *message = "helloworld";

int ms_len = strlen(message);  
int tag_len = strlen(TAG);

// 组装数据包
char *buf = (char*)malloc(ms_len + tag_len + DATA_LEN_BYTES);
memset(buf, '\0', ms_len + tag_len + DATA_LEN_BYTES);

strcpy(buf, TAG);
*((int *)(buf + tag_len)) = ms_len;
memcpy(buf + tag_len + DATA_LEN_BYTES, message, ms_len);

这样组合出来的数据就是符合上面我们规定的那样了！

解析再按相应规则进行解析就可以得到数据了！

2. 解析数据关键代码

#define DATA_LEN_BYTES  4
const char *TAG = "FBEB";

int tag_len = strlen(TAG);
char buf[1024] = { '\0' };


// 1. 首先接收头部信息
read(client_sock, buf, tag_len + DATA_LEN_BYTES);


// 2. 通过strncmp比较，即可得知数据开始部分是否是我们定义的标识
if (strncmp(buf, TAG, tag_len) == 0) { /* 符合条件 */ }


// 3. 获得实际数据的大小
int dataLen = *((int *)(buf + tag_len));


// 4. 循环接收数据，存储到buf中
int count = 0;
int readLen = 0;
while (count < dataLen) {
    readLen = read(client_sock, buf + count, dataLen - count);    // dataLen-count：还需要接收多少数据
    
    count += readLen;    // 统计已经接收了多少数据
}

这样，不管是分包和粘包问题都可以正常的接收了！

四、示例

客户端发送消息给服务器，服务器发送消息给客户端！模拟分包发送！

客户端发送数据给服务器时，将数据拆成三个包发送；服务器发送数据给客户端时，将数据包拆成两个包发送！

client.c

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <string.h>
#include <errno.h>

#define SERVER_PORT     4567
#define SERVER_IP       "127.0.0.1"
#define DATA_LEN_BYTES  4

const char *TAG = "Jtom";




int read_package(int client_sock, char *buf, unsigned int len) {
    int readLen = 0;    // 当前读取字节数
    int count = 0;      // 已经读取字节数
    
    if (buf == NULL || client_sock < 1) {
        printf("Parameters are wrong!\n");
        return -1;
    }
      
    
    int tag_len = strlen(TAG);

    int ret = read(client_sock, buf, tag_len + DATA_LEN_BYTES);
    if (-1 == ret) {
        fprintf(stderr, "read failed! reason：%s", strerror(errno));
        return ret;
    } else if (0 == ret) {
        printf("1read data return 0!\n");
        return ret;
    }

    // 对TAG进行检查
    if (strncmp(buf, TAG, tag_len) == 0) {
        int dataLen = *((int *)(buf + tag_len));
        //printf("dataLen = %d\n", dataLen);
        
        int failCount = 0;  // 失败重试
        
        // 读取数据部分
        count = 0;
        readLen = 0;
        while (count < dataLen) {
            readLen = read(client_sock, buf + count, dataLen - count);
            printf("readLen = %d\n", readLen);
            if (-1 == readLen) {
                if (5 > failCount) {
                    failCount++;
                    readLen = 0;
                } else {
                    fprintf(stderr, "read failed! reason：%s", strerror(errno));
                    return readLen;
                }
                
            } else if (0 == readLen) {
                if (5 > failCount) {
                    failCount++;
                    readLen = 0;
                } else {
                    printf("2read data return 0!\n");
                    return ret;
                } 
            }
            
            count += readLen;
        }
        
        return dataLen;
    }
}    



// 线程执行函数
void *my_thread_handle(void *arg) {
    
    char buf[1024] = { '\0' };
    int sockfd = *(int *)arg;
    int failCount = 0;  // 失败重试5次
    
    while (1) {
       // 读取服务器发送回来的信息
        int len = read_package(sockfd, buf, sizeof(buf));
        if (len > 0) {
            buf[len] = '\0';
            printf("receive[%d]: %s", len, buf);
        } else {
            if (5 > failCount) {
                failCount++;
                sleep(1);
            } else {               
                fprintf(stderr, "connect server off!\n");                             
                break;
            }
        }            
        
        if (strncmp(buf, "end", 3) == 0) {
            break;
        }
        memset(buf, '\0', sizeof(buf));
    }
    
    pthread_exit(NULL);
}



int main(int argc, char *argv[]){

    int sockfd;
    char message[1024] = { '\0' };
    struct sockaddr_in servaddr;
    int n;
    char *buf = NULL;


    sockfd = socket(AF_INET, SOCK_STREAM, 0);

    memset(&servaddr, '\0', sizeof(struct sockaddr_in));

    servaddr.sin_family = AF_INET;
    inet_pton(AF_INET, SERVER_IP, &servaddr.sin_addr);
    servaddr.sin_port = htons(SERVER_PORT);

    int ret = connect(sockfd, (struct sockaddr *)&servaddr, sizeof(servaddr));
    if (-1 == ret) {
        printf("connet failed! reason：%s\n", strerror(errno));
        exit(1);
    }
    
    
    // 创建线程取接收客户端发送过来的数据
    pthread_t mythread;
    // 创建线程
    ret = pthread_create(&mythread, 0, my_thread_handle, &sockfd);
    if (0 != ret) {
        printf("create thread failed!\n");
        exit(1);
    }
    
    
    while (1) {
        fgets(message, 1024, stdin);
        
        int ms_len = strlen(message);  
        int tag_len = strlen(TAG);
        
        // 组装数据包
        buf = (char*)malloc(ms_len + tag_len + DATA_LEN_BYTES);
        memset(buf, '\0', ms_len + tag_len + DATA_LEN_BYTES);
        
        strcpy(buf, TAG);
        *((int *)(buf + tag_len)) = ms_len;
        memcpy(buf + tag_len + DATA_LEN_BYTES, message, ms_len);
        
        
        // 先发送头部，即标识符和发送数据的大小
        write(sockfd, buf, tag_len + DATA_LEN_BYTES);
        
        // 模拟发送三个包
        write(sockfd, buf + tag_len + DATA_LEN_BYTES, 1);
        sleep(1);
        write(sockfd, buf + tag_len + DATA_LEN_BYTES + 1, 1);
        sleep(1);
        write(sockfd, buf + tag_len + DATA_LEN_BYTES + 2, ms_len - 2);
        
        if (strncmp(buf + tag_len + DATA_LEN_BYTES, "exit", 4) == 0) {
            free(buf);
            break;
        }
        free(buf);
    }
   

    printf("finished.\n");
    close(sockfd);

    return 0;
}

server.c

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <string.h>        // strerror
#include <ctype.h>
#include <arpa/inet.h>
#include <netinet/in.h>
#include <stdlib.h>
#include <errno.h>
 

#define SERVER_PORT     4567
#define SERVER_IP       "127.0.0.1"
#define DATA_LEN_BYTES  4

const char *TAG = "Jtom";



int read_package(int client_sock, char *buf, unsigned int len) {
    int readLen = 0;    // 当前读取字节数
    int count = 0;      // 已经读取字节数
    
    if (buf == NULL || client_sock < 1) {
        printf("Parameters are wrong!\n");
        return -1;
    }
      
    
    int tag_len = strlen(TAG);

    int ret = read(client_sock, buf, tag_len + DATA_LEN_BYTES);
    if (-1 == ret) {
        fprintf(stderr, "read failed! reason：%s", strerror(errno));
        return ret;
    } else if (0 == ret) {
        printf("read data return 0!\n");
        return ret;
    }

    // 对TAG进行检查
    if (strncmp(buf, TAG, tag_len) == 0) {
        int dataLen = *((int *)(buf + tag_len));
        //printf("dataLen = %d\n", dataLen);
        
        int failCount = 0;  // 失败重试
        
        // 读取数据部分
        count = 0;
        readLen = 0;
        while (count < dataLen) {
            readLen = read(client_sock, buf + count, dataLen - count);
            printf("readLen = %d\n", readLen);
            if (-1 == readLen) {
                if (5 > failCount) {
                    failCount++;
                    readLen = 0;
                } else {
                    fprintf(stderr, "read failed! reason：%s", strerror(errno));
                    return readLen;
                }
                
            } else if (0 == readLen) {
                if (5 > failCount) {
                    failCount++;
                    readLen = 0;
                } else {
                    printf("read data return 0!\n");
                    return ret;
                } 
            }
            
            count += readLen;
        }
        
        return dataLen;
    }
}    



// 线程执行函数
void *my_thread_handle(void *arg) {
    
    char buf[1024] = { '\0' };
    int client_sock = *(int *)arg;
    int failCount = 0;
    
    while (1) {
       // 读取服务器发送回来的信息
        int len = read_package(client_sock, buf, sizeof(buf));
        if (len > 0) {
            buf[len] = '\0';
            printf("receive[%d]: %s", len, buf);
        } else {
            if (5 > failCount) {
                failCount++;
                sleep(1);
            } else {
                fprintf(stderr, "connect client off!\n");                             
                break;
            }
        }       
        
        if (strncmp(buf, "end", 3) == 0) {
            break;
        }
        memset(buf, '\0', sizeof(buf));
    }
    
    pthread_exit(NULL);
}
 
 
 
int main(void) {
	
	int ret = 0;
	int sock;	// 通信套接字
	struct sockaddr_in server_addr;
    char message[1024] = { '\0' };
	
	// 1.创建通信套接字
	sock = socket(AF_INET, SOCK_STREAM, 0);
	if (-1 == sock) {
		fprintf(stderr, "create socket error, reason: %s\n", strerror(errno));
		exit(-1);
	}
	
	// 2.清空标签，写上地址和端口号
	bzero(&server_addr, sizeof(server_addr));
	
	server_addr.sin_family = AF_INET;	// 选择协议组ipv4
	server_addr.sin_addr.s_addr = htonl(INADDR_ANY);	// 监听本地所有IP地址
	server_addr.sin_port = htons(SERVER_PORT);			// 绑定端口号
	
	// 3.绑定
	ret = bind(sock, (struct sockaddr *)&server_addr, sizeof(server_addr));
	if (-1 == ret) {
		fprintf(stderr, "socket bind error, reason: %s\n", strerror(errno));
		close(sock);
		exit(-2);
	}
	
	// 4.监听，同时监听128个请求
	ret = listen(sock, 128);
	if (-1 == ret) {
		fprintf(stderr, "listen error, reason: %s\n", strerror(errno));
		close(sock);
		exit(-2);
	}
	
	printf("等待客户端的链接\n");
    
    struct sockaddr_in client;
    int client_sock;
    char client_ip[64];
    
    socklen_t client_addr_len;		
    client_addr_len = sizeof(client);
    // 5.接受
    client_sock = accept(sock, (struct sockaddr *)&client, &client_addr_len);
    if (-1 == client_sock) {
        perror("accept error");
        close(sock);
        exit(-3);
    }
    
    // 打印客户端IP地址和端口号
    printf("client ip: %s\t port: %d\n",
            inet_ntop(AF_INET, &client.sin_addr.s_addr, client_ip, sizeof(client_ip)),
            ntohs(client.sin_port));
    
    
    // 创建线程取接收客户端发送过来的数据
    pthread_t mythread;
    // 创建线程
    ret = pthread_create(&mythread, 0, my_thread_handle, &client_sock);
    if (0 != ret) {
        printf("create thread failed!\n");
        exit(1);
    }
    
    
	
	while (1) {
		
		fgets(message, sizeof(message), stdin);
        int ms_len = strlen(message);  
        int tag_len = strlen(TAG);
        
        // 组装数据包
        char *buf = (char*)malloc(ms_len + tag_len + DATA_LEN_BYTES);  
        memset(buf, '\0', ms_len + tag_len + DATA_LEN_BYTES);
        
        strcpy(buf, TAG);
        *((int *)(buf + tag_len)) = ms_len;
        memcpy(buf + tag_len + DATA_LEN_BYTES, message, ms_len);
        
        
        // 先发送头部，即标识符和发送数据的大小
        write(client_sock, buf, tag_len + DATA_LEN_BYTES);
        
        // 模拟发送两个包
        write(client_sock, buf + tag_len + DATA_LEN_BYTES, 1);
        sleep(1);
        write(client_sock, buf + tag_len + DATA_LEN_BYTES + 1, ms_len - 1);
        
        if (strncmp(buf + tag_len + DATA_LEN_BYTES, "exit", 4) == 0) {
            free(buf);
            break;
        }

        free(buf);
	}
	
	// 9.关闭服务器套接字
	close(sock);
    close(client_sock);
	
	return 0;
}