文章目录
- 学习资料
- StringTable
- String的基本特性
- String的内存分配
- StringTable为什么要调整?
- String的基本操作
- 字符串拼接操作
- 拼接操作与append操作的效率对比
- intern()的使用
学习资料
【尚硅谷宋红康JVM全套教程(详解java虚拟机)】
【阿里巴巴Java开发手册】https://www.w3cschool.cn/alibaba_java
JDK 8 JVM官方手册
StringTable
String的基本特性
String:字符串,使用一对“”引起来表示。
String声明为final的,不可被继承。
String实现了Serializable接口:表示字符串是支持序列化的。实现了Comparable接口:表示String可以比较大小。
String在jdk8及以前内部定义了final char[] value用于存储字符串数据。jdk9时改为byte[]。
String:代表不可变的字符序列。简称:
不可变性
。
1、当对字符串重新赋值时,需要重写指定内存区域赋值,不能使用原有的value进行赋值。
2、当对现有的字符串进行连接操作时,也需要重新指定内存区域赋值,不能使用原有的value进行赋值。
当调用String的replace()方法修改指定字符或字符串时,也需要重新指定内存区域赋值,不能使用原有的value进行赋值。
通过字面量的方式(区别于new)给一个字符串赋值,此时的字符串值声明在字符串常量池中。
字符串常量池中是不会存储相同的内容的字符串的。
String的String Pool是一个固定大小的HashTable,默认值大小长度是1009。如果放进String Pool的String非常多,就会造成Hash冲突严重,从而导致链表会很长,而链表长了后直接会造成的影响就是当调用String.intern时性能会大幅下降。
使用
-XX:StringTableSize
可设置StringTable的长度。
在jdk6中StringTable是固定的,就是
1009
的长度,所以如果常量池中的字符串过多就会导致效率下降很快。StringTableSize设置没有要求。
在jdk7中,StringTable的长度默认值是
60013
。
在jdk8中,StringTable的长度默认值是
60013
,1009是可设置的最小值。
String的内存分配
在Java语言中有8种基本数据类型和一种比较特殊的类型String。这些类型为了使它们在运行过程中速度更快、更节省内存,都提供了一种常量池的概念。
常量池就类似一个Java系统级别提供的缓存。8种基本数据类型的常量池都是系统协调的,
String类型的常量池比较特殊。它的主要使用方法有两种。
1、直接使用双引号声明出来的String对象会直接存储在常量池中,比如:String info = “diuxz.cn”;
2、如果不是用双引号声明的String对象,可以使用String提供的intern()方法。
Java6及以前,字符串常量池存放在永久代。
Java7中Oracle的工程师对字符串池的逻辑做了很大的改变,即将字符串常量池的位置调整到Java堆内。
1、所有的字符串都保存在堆(Heap)中,和其他普通对象一样,这样可以让你在进行调优应用时仅需要调整堆大小就可以了。
2、字符串常量池概念原本使用的比较多,但是这个改动使得我们有足够的理由让我们考虑在Java7中使用String.intern()。
Java8元空间,字符串常量在堆。
StringTable为什么要调整?
1、permSIze默认比较小;2、永久代垃圾回收频率低;
JDK 7中将StringTable放到了堆空间中。因为永久代的回收效率很低,在full gc的时候才会触发、永久代不足时才会触发。这就导致StringTable回收效率不高。而我们开发中会有大量的字符串被创建,回收效率低,导致永久代内存不足。放到堆里能及时回收内存。
String的基本操作
字符串拼接操作
常量与常量的拼接结果在常量池,原理是编译期优化。
常量池中不会存在相同内容的常量。
只要其中有一个是变量,则相当于在堆空间中new String(),具体的内容为拼接的结果,结果就在堆中。变量拼接的原理是StringBuilder。
字符串拼接操作不一定使用StringBuilder!
如果拼接符号左右两边都是字符串常量或常量引用,则仍然使用编译期优化,即非StringBuilder的方式。
针对于final修饰类、方法、基本数据类型、引用数据的量的结构时,能使用上final的时候建议使用上,这样能更好的使用编译期优化。
如果拼接的结果是调用intern()方法,则主动将常量池中还没有的字符串对象放入池中,并返回此对象地址,如果存在,则返回常量池中的地址。
拼接操作与append操作的效率对比
体会执行效率:通过StringBuilder的append()的方式添加字符串的效率要远高于使用String的字符串拼接方式!
详情:
1、StringBuilder的append()的方式:自始至终值创建过一个StringBuilder的对象。
2、使用String的字符串拼接方式:创建过多个StringBuilder和String的对象。
3、使用String的字符串拼接方式:内存中由于创建了较多的StringBuilder和String的对象,内存占用更大,并且更容易触发GC,严重影响效率。
改进空间:在实际开发中,如果基本确定前前后后添加的字符串长度不高于某个限定值的情况下,建议使用构造器new StringBuilder(int capacity);实例化。
package com.atguigu.java;
public class StringTest4 {
public static void main(String[] args) {
long start = System.currentTimeMillis();
//method1(100000);//花费的时间为:3484
//method2(100000);//花费的时间为:7
long end = System.currentTimeMillis();
System.out.println("花费的时间为:" + (end - start));
}
public static void method1(int highLevel){
String src = "";
for(int i = 0; i < highLevel; i++){
src = src + "a";//每次循环都会创建一个StringBuilder
}
}
public static void method2(int highLevel){
//只需要创建一个StringBuilder
StringBuffer src = new StringBuffer();
for(int i = 0; i < highLevel; i++){
src.append("a");
}
}
}
intern()的使用
如果不是用双引号声明的String对象,可以使用String提供的intern方法:intern方法会从字符串常量池中查询当前字符串是否存在,若不存在就会将当前字符串放入常量池中。
比如:String myInfo = new String(“diuxz.cn”).intern();
也就是说,如果在任意字符串上调用String.intern方法,那么其返回结果所指向的那个类实例,必须和直接以常量形式出现的字符串实例完全相同。因此下列表达式的值必定是true:
(“a” + “b” + “c”).intern() == “abc”
通俗点讲,Interned String就是确保字符串在内存里只有一份拷贝,这样可以节约内存空间,加快字符串操作任务的执行速度。注意:这个值会被存放在字符串内部池(String Intern Pool)。
大的网站平台,需要内存中存储大量的字符串。比如社交网站,很多人都存储:北京市、海淀区等信息。这时候如果字符串都调用intern()方法,就会明显降低内存的大小。
public static void main(String[] args) {
String s = new String("1");//字符串常量池、堆空间,分别创造两个对象,返回堆空间中的对象
s.intern();//返回字符串常量池对象,调用此方法之前,字符串常量池中已经存在了“1”
String s2 = "1";//返回字符串常量池对象
System.out.println(s == s2);//false,s是堆空间的对象,s2是字符串常量池的对象
String s3 = new String("1") + new String("1");//s3变量记录的地址为:new String(11)
//执行完上一行代码后,字符串常量池中不存在“11”,因为StringBuilder.toString()的调用,在字符串常量池中不生成“11”
s3.intern();//在字符串常量池中生成“11”
String s4 = "11";//使用的是上一行代码执行时在常量池中生成的“11”的地址
System.out.println(s3 == s4);//true,使用的共同的常量池地址
}