且敬我疯狂,生命中不败的篇章
—— 24.6.11
一、字符编码
计算机中储存的信息都是用二进制数表示的,而我们在屏幕上看到的数字、英文、标点符号、汉字等字符是二进制数转换之后的结果。[按照某种规则,将字符存储到计算机中,称为编码。]反之,将存储在计算机中的二进制数按照某种规则解析显示出来,称为“解码”。比如说,按照A规则存储,同样按照A规则解析,那么就能显示正确的文本f符号。反之,按照A规则存储,再按照B规则解析,就会导致乱码现象。
字符编码 character Encoding:就是一套自然语言的字符与二进制数之间的对应规则。
二、字符集
字符集 charset:也叫编码表。是一个系统支持的所有字符的集合,包括各国家文字、标点符号、图形符号、数字等。
计算机要准确的存储和识别各种字符集符号,需要进行字符编码,一套字符集必然至少有一套字符编码。常见字符集有ASCII字符集、GBK字符集、Unicode字符集等。
1.想要不乱码,编码和解码遵循的规则(字符编码)要一致,想要不乱码,最重要的是先知道这个字符按照什么编码去存的
2.UTF-8中一个汉字占3个字节,GBK中一个汉字占2个字节
三、转换流 InputStreamReader
1.概述:
是字节流通向字符流的桥梁 —> 读数据
2.构造:
InputStreamReader(InputStream in,String charsetName)
charsetName:指定编码,不区分大小写
3.作用:
可以直接指定编码,按照指定的编码去读内容
4.用法:
基本用法和FileReader一样
5.示例:
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStreamReader;
public class Demo277InputStreamReader {
public static void main(String[] args) throws IOException {
InputStreamReader isr = new InputStreamReader(new FileInputStream("D:\\2LFE\\Desktop\\IO转换流.txt"),"GBK");
int data = isr.read();
System.out.println((char)data);
isr.close();
}
}
四、转换流 OutputStreamWriter
1.概述:
是字符流通向字节流的桥梁 —> 写数据
2.构造:
OutputstreamWriter(OutputStream out,String charsetName)
3.作用:
按照指定的编码规则去存数据
4.用法:
和Filewriter一样
5.示例:
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStreamWriter;
public class Demo278OutputStreamReader {
public static void main(String[] args) throws IOException {
OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream("AllWillBest_Java/src/S97IOReserveStream\\output.txt"), "UTF-8");
osw.write("一切都会好的");
osw.close();
}
}