文章目录
- 0. 代码仓库
- 1. TCP通信粘包问题
- 2. 粘包、拆包表现形式
- 2.1 正常情况
- 2.2 两个包合并成一个包
- 2.3 出现了拆包
- 3. 粘包的处理-参考仓库中的文件TcpSocket.cpp
- 3.1 发送数据时候的处理
- 3.2 接收数据时候的处理
0. 代码仓库
https://github.com/Chufeng-Jiang/OpenSSL_Secure_Data_Transmission_Platform
1. TCP通信粘包问题
tcp是以流动的方式传输数据,没有边界的一段数据。像打开自来水管一样,连成一片,没有边界。传输的最小单位为一个报 文段(segment)。
tcp Header中有个Options标识位,常见的标识为mss(Maximum Segment Size)指的是:连接层每次传输的数据有个最大限制MTU(Maximum Transmission Unit),一般是1500比特,超过这个量要分成多个报文段,mss则是这个最大限制减去TCP的header,光是要传输的数据的大小,一般为1460比特。换算成字节, 也就是180多字节。
tcp为提高性能,发送端会将需要发送的数据发送到缓冲区,等待缓冲区满了之后
,再将缓冲中的数据发送到接收方。 同理,接收方也有缓冲区这样的机制,来接收数据。
发现,如果客户端连续不断
的向服务端发送数据包时,服务端接收的数据会出现两个数据包粘在一起
的情况,这就是TCP协议中经常会遇到的粘包
以及拆包
的问题。
2. 粘包、拆包表现形式
现在假设客户端向服务端连续发送了两个数据包,用packet1和packet2来表示,那么服务端收到的数据可以分为三种,现列举如下:
2.1 正常情况
第一种情况,接收端正常收到两个数据包,即没有发生拆包和粘包的现象,此种情况不在本文的讨论范围内。
2.2 两个包合并成一个包
第二种情况,接收端只收到一个数据包,由于TCP是不会出现丢包的,所以这一个数据包中包含了发送端发送的两个数据包的信息,这种现象即为粘包。这种情况由于接收端不知道这两个数据包的界限,所以对于接收端来说很难处理。
2.3 出现了拆包
第三种情况,这种情况有两种表现形式,如下图。接收端收到了两个数据包,但是这两个数据包要么是不完整的,要么就是多出来一块,这种情况即发生了拆包和粘包。
3. 粘包的处理-参考仓库中的文件TcpSocket.cpp
3.1 发送数据时候的处理
添加4个字节的数据头,存储数据块的长度。
dataLen为发送原始数据的长度,在此基础上添加4个字节的长度,并开辟netdata空间用来存储数据。
int dataLen = sendData.size() + 4;
unsigned char *netdata = (unsigned char *)malloc(dataLen);
在发送的时候,需要从主机字节序转换为网络字节序。
先求将原始数据转换成网络字节序的长度大小
int netlen = htonl(sendData.size());再将原始数据的长度,拷贝到开辟的空间netdata前4个位置
memcpy(netdata, &netlen, 4);最后将原始数据内容拷贝到开辟的空间netdata中第4个字节以后的位置
memcpy(netdata + 4, sendData.data(), sendData.size());
int TcpSocket::sendMsg(string sendData, int timeout)
{
// 返回0->没超时, 返回-1->超时
int ret = writeTimeout(timeout);
if (ret == 0)
{
int writed = 0;
int dataLen = sendData.size() + 4;
// 添加的4字节作为数据头, 存储数据块长度
unsigned char *netdata = (unsigned char *)malloc(dataLen);
if (netdata == NULL)
{
ret = MallocError;
printf("func sckClient_send() mlloc Err:%d\n ", ret);
return ret;
}
// 转换为网络字节序
int netlen = htonl(sendData.size());
memcpy(netdata, &netlen, 4);
memcpy(netdata + 4, sendData.data(), sendData.size());
// 没问题返回发送的实际字节数, 应该 == 第二个参数: dataLen
// 失败返回: -1
writed = writen(netdata, dataLen);
......
3.2 接收数据时候的处理
先读包头的4个字节并转换成主机字节序,就知道报文有多长。
readn函数用于读取网络字节流的文件到缓存netdatalen空间中
ret = readn(&netdatalen, 4); //读包头 4个字节
int n = ntohl(netdatalen);根据包头中记录的数据大小申请内存, 接收数据,添加一个‘\0’结束符
char* tmpBuf = (char *)malloc(n + 1);根据长度读数据
ret = readn(tmpBuf, n);
string TcpSocket::recvMsg(int timeout)
{
// 返回0 -> 没超时就接收到了数据, -1, 超时或有异常
int ret = readTimeout(timeout);
if (ret != 0)
{
if (ret == -1 || errno == ETIMEDOUT)
{
printf("readTimeout(timeout) err: TimeoutError \n");
return string();
}
else
{
printf("readTimeout(timeout) err: %d \n", ret);
return string();
}
}
int netdatalen = 0;
ret = readn(&netdatalen, 4); //读包头 4个字节
if (ret == -1)
{
printf("func readn() err:%d \n", ret);
return string();
}
else if (ret < 4)
{
printf("func readn() err peer closed:%d \n", ret);
return string();
}
int n = ntohl(netdatalen);
// 根据包头中记录的数据大小申请内存, 接收数据
char* tmpBuf = (char *)malloc(n + 1);
if (tmpBuf == NULL)
{
ret = MallocError;
printf("malloc() err \n");
return NULL;
}
ret = readn(tmpBuf, n); //根据长度读数据
if (ret == -1)
{
printf("func readn() err:%d \n", ret);
return string();
}
else if (ret < n)
{
printf("func readn() err peer closed:%d \n", ret);
return string();
}
tmpBuf[n] = '\0'; //多分配一个字节内容,兼容可见字符串 字符串的真实长度仍然为n
string data = string(tmpBuf);
// 释放内存
free(tmpBuf);
return data;
}