写在前面
根据http协议的规范,content-length响应头用来标记固定长度响应信息长度,http客户端,比如浏览器也会解析这个字段来进行数据的解析。
1:测试
1.1:content-length等于实际内容匹配时
使用python脚本testcontent_lenth.py
:
#! /usr/bin/python
# -*- coding: utf-8 -*-
import socket
sock = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
server_address = ("127.0.0.1",12345)
sock.bind(server_address)
sock.listen(100)
while True:
conn,client_address = sock.accept()
try:
data = conn.recv(4096)
response = 'HTTP/1.1 200 OK\r\nContent-Length: 10\r\n\r\nHelloWorld'
conn.send(response.encode())
finally:
conn.close()
执行python testcontent_lenth.py
,后浏览器访问:
可以看到一切正常,当然这不是我们主要要分析的情况。
1.2:content-length小于实际内容匹配时
使用python脚本testcontent_lenth.py
:
#! /usr/bin/python
# -*- coding: utf-8 -*-
import socket
sock = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
server_address = ("127.0.0.1",12345)
sock.bind(server_address)
sock.listen(100)
while True:
conn,client_address = sock.accept()
try:
data = conn.recv(4096)
response = 'HTTP/1.1 200 OK\r\nContent-Length: 6\r\n\r\nHelloWorld'
conn.send(response.encode())
finally:
conn.close()
执行python testcontent_lenth.py
,后浏览器访问:
可以看到此时就不太对了,只获取了6个字符,这是为什么呢?这是因为啊,content-lenth的值是6,所以是浏览器根据协议只获取了6个字节,而并非只有6个字节。所以,问题出在应用层。那么对于原始tcp协议是不是完整的数据呢,我们可以通过wireshark来验证下:
点击开始开始抓包,接着再次在浏览器访问地址http://localhost:12345/
,就会抓到如下的包:
可以看到实际内容就是helloworld。也可以通过tcp数据流更清晰的查看:
1.3:content-length大于实际内容匹配时
使用python脚本testcontent_lenth.py
:
#! /usr/bin/python
# -*- coding: utf-8 -*-
import socket
sock = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
server_address = ("127.0.0.1",12345)
sock.bind(server_address)
sock.listen(100)
while True:
conn,client_address = sock.accept()
try:
data = conn.recv(4096)
response = 'HTTP/1.1 200 OK\r\nContent-Length: 11\r\n\r\nHelloWorld'
conn.send(response.encode())
finally:
conn.close()
执行python testcontent_lenth.py
,后浏览器访问:
可以看到直接报错了,报错的原因我们可以通过console看到:
问题还是出在content-length上。此时wireshark的抓包是这个样子的: