常用的HTTP服务压测工具介绍
在项目正式上线之前,我们通常需要通过压测来评估当前系统能够支撑的请求量、排查可能存在的隐藏bug,同时了解了程序的实际处理能力能够帮我们更好的匹配项目的实际需求,节约资源成本。
HTTP服务压力测试工具
在项目正式上线之前,我们通常需要通过压测来评估当前系统能够支撑的请求量、排查可能存在的隐藏bug,同时了解了程序的实际处理能力能够帮我们更好的匹配项目的实际需求,节约资源成本。
压测相关术语
- 响应时间(RT) :指系统对请求作出响应的时间.
- 吞吐量(Throughput) :指系统在单位时间内处理请求的数量
- QPS每秒查询率(Query Per Second) :“每秒查询率”,是一台服务器每秒能够响应的查询次数,是对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准。
- TPS(TransactionPerSecond):每秒钟系统能够处理的交易或事务的数量
- 并发连接数:某个时刻服务器所接受的请求总数
压力测试工具
ab
ab全称Apache Bench,是Apache自带的性能测试工具。使用这个工具,只须指定同时连接数、请求数以及URL,即可测试网站或网站程序的性能。
通过ab发送请求模拟多个访问者同时对某一URL地址进行访问,可以得到每秒传送字节数、每秒处理请求数、每请求处理时间等统计数据。
命令格式:
ab [options] [http://]hostname[:port]/path
常用参数如下:
-n requests 总请求数
-c concurrency 一次产生的请求数,可以理解为并发数
-t timelimit 测试所进行的最大秒数, 可以当做请求的超时时间
-p postfile 包含了需要POST的数据的文件
-T content-type POST数据所使用的Content-type头信息
更多参数请查看官方文档。
例如测试某个GET请求接口:
ab -n 10000 -c 100 -t 10 "http://127.0.0.1:8080/api/v1/posts?size=10"
测试POST请求接口:
ab -n 10000 -c 100 -t 10 -p post.json -T "application/json" "http://127.0.0.1:8080/api/v1/post"
wrk
wrk是一款开源的HTTP性能测试工具,它和上面提到的ab
同属于HTTP性能测试工具,它比ab
功能更加强大,可以通过编写lua脚本来支持更加复杂的测试场景。
Mac下安装:
brew install wrk
常用命令参数:
-c --conections:保持的连接数
-d --duration:压测持续时间(s)
-t --threads:使用的线程总数
-s --script:加载lua脚本
-H --header:在请求头部添加一些参数
--latency 打印详细的延迟统计信息
--timeout 请求的最大超时时间(s)
使用示例:
wrk -t8 -c100 -d30s --latency http://127.0.0.1:8080/api/v1/posts?size=10
输出结果:
Running 30s test @ http://127.0.0.1:8080/api/v1/posts?size=10
8 threads and 100 connections
Thread Stats Avg Stdev Max +/- Stdev
Latency 14.55ms 2.02ms 31.59ms 76.70%
Req/Sec 828.16 85.69 0.97k 60.46%
Latency Distribution
50% 14.44ms
75% 15.76ms
90% 16.63ms
99% 21.07ms
198091 requests in 30.05s, 29.66MB read
Requests/sec: 6592.29
Transfer/sec: 0.99MB
go-wrk
go-wrk是Go语言版本的wrk
,Windows同学可以使用它来测试,使用如下命令来安装go-wrk
:
go get github.com/adeven/go-wrk
使用方法同wrk
类似,基本格式如下:
go-wrk [flags] url
常用的参数:
-H="User-Agent: go-wrk 0.1 bechmark\nContent-Type: text/html;": 由'\n'分隔的请求头
-c=100: 使用的最大连接数
-k=true: 是否禁用keep-alives
-i=false: if TLS security checks are disabled
-m="GET": HTTP请求方法
-n=1000: 请求总数
-t=1: 使用的线程数
-b="" HTTP请求体
-s="" 如果指定,它将计算响应中包含搜索到的字符串s的频率
执行测试:
go-wrk -t=8 -c=100 -n=10000 "http://127.0.0.1:8080/api/v1/posts?size=10"
输出结果:
==========================BENCHMARK==========================
URL: http://127.0.0.1:8080/api/v1/posts?size=10
Used Connections: 100
Used Threads: 8
Total number of calls: 10000
===========================TIMINGS===========================
Total time passed: 2.74s
Avg time per request: 27.11ms
Requests per second: 3644.53
Median time per request: 26.88ms
99th percentile time: 39.16ms
Slowest time for request: 45.00ms
=============================DATA=============================
Total response body sizes: 340000
Avg response body per request: 34.00 Byte
Transfer rate per second: 123914.11 Byte/s (0.12 MByte/s)
==========================RESPONSES==========================
20X Responses: 10000 (100.00%)
30X Responses: 0 (0.00%)
40X Responses: 0 (0.00%)
50X Responses: 0 (0.00%)
Errors: 0 (0.00%)
wrk -c400 -t8 -d40s "https://api.xxx.io/api/homecampaigns?userid=8444602914701313&status=Ended&rewardtype=All%20Rewards&pagesize=10&pagenum=1&key="
Running 40s test @ https://api.xxx.io/api/homecampaigns?userid=8444602914701313&status=Ended&rewardtype=All%20Rewards&pagesize=10&pagenum=1&key=
8 threads and 400 connections
Thread Stats Avg Stdev Max +/- Stdev
Latency 1.09s 469.05ms 2.00s 56.74%
Req/Sec 11.99 9.45 110.00 88.35%
3105 requests in 40.11s, 24.77MB read
Socket errors: connect 158, read 0, write 0, timeout 1170
Requests/sec: 77.42
Transfer/sec: 632.49KB
hanpeng@hanpeng stargate_backend % go tool pprof http://xx.xx.xx.xxx:xxxx/debug/pprof/profile
Fetching profile over HTTP from http://xx.xx.xx.xxx:xxxx/debug/pprof/profile
Saved profile in /Users/hanpeng/pprof/pprof.stargate.samples.cpu.003.pb.gz
File: stargate
Type: cpu
Time: Mar 1, 2023 at 1:02pm (CST)
Duration: 30.13s, Total samples = 7.73s (25.66%)
Entering interactive mode (type "help" for commands, "o" for options)
(pprof) top
Showing nodes accounting for 4230ms, 54.72% of 7730ms total
Dropped 297 nodes (cum <= 38.65ms)
Showing top 10 nodes out of 257
flat flat% sum% cum cum%
1820ms 23.54% 23.54% 2110ms 27.30% syscall.Syscall
860ms 11.13% 34.67% 860ms 11.13% runtime.futex
580ms 7.50% 42.17% 580ms 7.50% runtime.epollwait
250ms 3.23% 45.41% 990ms 12.81% runtime.mallocgc
170ms 2.20% 47.61% 260ms 3.36% runtime.heapBitsSetType
130ms 1.68% 49.29% 130ms 1.68% runtime.memclrNoHeapPointers
120ms 1.55% 50.84% 120ms 1.55% runtime.memmove
120ms 1.55% 52.39% 120ms 1.55% runtime.nextFreeFast (inline)
90ms 1.16% 53.56% 90ms 1.16% runtime.(*itabTableType).find
90ms 1.16% 54.72% 90ms 1.16% runtime.usleep
(pprof) pdf
Generating report in profile001.pdf