Golang详解string
文章目录
- Golang详解string
- Golang中为什么string是只读的?
- stirng和[]byte的转化原理
- []byte转string一定需要内存拷贝吗?
- 字符串拼接性能测试
Golang中为什么string是只读的?
在Go语言中,string其实就是一个结构体,包含一个指向底层数组的指针和长度。字符串只读,在Go运行时能有效的管理内存分配,在创建字符串后不可修改,那么字符串就固定在内存中了,就可以消除跟踪和管理字符串修改的复杂性了。同时,在多线程的环境下,不可变性让字符串避免数据竞争和一致性问题,不需要额外的同步处理了。
stirng和[]byte的转化原理
从string的底层结构就知道是不可扩容的,string和[]byte的区别就是在[]byte中多了个容量,所以string转[]byte和[]byte转string都是进行内存的拷贝,指针数据和长度的匹配。
[]byte转string一定需要内存拷贝吗?
如果[]byte转string是临时场景,那么就不需要内存拷贝。就比如;
- 字符串拼接,临时使用
- 查找数据,临时使用
- 用于比较,临时使用
字符串拼接性能测试
Golang中常用的字符串拼接:
- strings.Builder
- strings.Join
- (加号) +
- fmt.Sprintf
- append
package main
import (
"bytes"
"fmt"
"strings"
"testing"
)
var loremIpsm = `It is a highly competitive world. One can feel the existence of competition everywhere, from the classroom to the job-hunting market. Looking for a fair opportunity to prove one's ability has become a matter of survival.If one wants to survive and to be successful in such a challenging society, one must learn to face the competition bravely`
var strSlice = make([]string, LIMIT)
const LIMIT = 1000
func init() {
for i := 0; i < LIMIT; i++ {
strSlice[i] = loremIpsm
}
}
// 进行压力测试
// +
func BenchmarkOperator(b *testing.B) {
for i := 0; i < b.N; i++ {
var q string
for _, s := range strSlice {
q = q + s
}
}
b.ReportAllocs()
}
// Sprintf
func BenchmarkSprintf(b *testing.B) {
for i := 0; i < b.N; i++ {
var q string
for _, s := range strSlice {
q = fmt.Sprintf(q, s)
}
}
b.ReportAllocs()
}
// strings.Join
func BenchmarkJoin(b *testing.B) {
for i := 0; i < b.N; i++ {
strings.Join(strSlice, "")
}
b.ReportAllocs()
}
// bytes.Buffer
func BenchmarkBuffer(b *testing.B) {
for i := 0; i < b.N; i++ {
var q bytes.Buffer
q.Grow(len(loremIpsm) * len(strSlice))
for _, s := range strSlice {
q.WriteString(s)
}
}
b.ReportAllocs()
}
// append
func BenchmarkAppend(b *testing.B) {
for i := 0; i < b.N; i++ {
var q []byte
for _, s := range strSlice {
q = append(q, s...)
}
}
b.ReportAllocs()
}
// strings.Builder
func BenchmarkBuilder(b *testing.B) {
for i := 0; i < b.N; i++ {
var q strings.Builder
q.Grow(len(loremIpsm) * len(strSlice))
for _, s := range strSlice {
q.WriteString(s)
}
}
b.ReportAllocs()
}
测试结果:
可以看到性能比较好的是strings.Builder、strings.Join、bytes.Buffer这三个性能相比之下比较高。
如果大量字符串进行拼接时建议使用以上性能好的拼接方式,如果是少量的字符串用+比较方便。fmt.Sprintf性能最差,它一般用于格式化返回字符串而不是拼接。