一.字符集
如果使用字节流 , 把文本文件中的内容读取到内存时, 可能会出现乱码
如果使用字节流 , 把中文写入文本文件中 , 也有可能会出现乱码
读取n.txt"你好" 两个汉字
字节流读中文,每次只能读一部分所以出现了乱码
字符集(Character set),顾名思义是字符的集合。字符是各种文字和符号的总称,包括文字、标点符号、图形符号、数字、控制符号等。常用的字符集有:ASCII字符集、GBK字符集、Unicode字符集等。
标准ASCII字符集
ASCII(American Standard Code for Information Interchange): 美国信息交换标准代码,包括了英文、符号等。标准ASCII使用1个字节存储一个字符,首尾是0,总共可表示128个字符
GBK(汉字内码扩展规范,国标)
GBK是中国的码表,一个中文以2个字节的形式存储。但不包含世界上所有国家的文字
英文、数字占1个字节
Unicode字符集(统一码,也叫万国码)
UTF-8是Unicode字符集的一种编码方案,采取可变长编码方案,共分四个长度区:1个字节,2个字节,3个字节,4个字节英文字符、数字等只占1个字节(兼容标准ASCII编码),汉字字符占用3个字节。
二.字符流
Java提供一些字符流类,以字符为单位读写数据,专门用于处理流读文本文件可能会有一个小问题。就是遇到中文字符时,可能不会显示完整的字符,那是因为一个中文字符可能占用多个字节存储的问题
1. 字符输出流【Writer】
字符输出流Writer类的常用方法
- public void write(int c):写出一个字符。
- public void write(char[] cbuf):将 b.length字符从指定的字符数组写出此输出流。
- public abstract void write(char[] b, int off, int len):从指定的字符数组写出 len字符,从偏移量 off开始输出到此输出流。
- public void write(String str) :写出一个字符串。
- public void write(String str,int off,int len):写出一个字符串的一部分。
- public abstract void close():关闭流,释放资源,但是在关闭之前会先刷新流。一旦关闭,就不能再写数据。
- public abstract void flush():刷新流,还可以继续写数据
2.FileWriter类
ava.io.FileWriter类是写出字符到文件的便利类。构造时使用系统默认的字符编码(UTF-8)和默认字节缓冲区。
FileWriter类的构造方法:
- FileWriter(File file):创建一个新的 FileWriter,给定要读取的File对象。
- FileWriter(String fileName):创建一个新的 FileWriter,给定要读取的文件的名称。
- FileWriter(File file,boolean append): 创建一个新的 FileWriter,追加写入。
- FileWriter(String fileName,boolean append): 创建一个新的 FileWriter,追加写入。
关闭输出流,无法写出字符到文件中。但是关闭的流对象,是无法继续写出数据的。如果我们既想写出数据,又想继续使用流,就需要flush 方法了。
- flush:刷新缓冲区,流对象可以继续使用。
- close:关闭流,释放系统资源。关闭前会刷新缓冲区。防止数据丢失
- 即便是flush方法写出了数据,操作的最后还是要调用close方法,释放系统资源。
3 字符输入流【Reader】
java.io.Reader抽象类是表示用于读取字符流的所有类的超类,可以读取字符信息到内存中。它定义了字符输入流的基本共性功能方法。
字符输入流Reader类的常用方法:
- public int read():每次可以读取一个字符的数据,读取到文件末尾,返回-1。 返回字符数据的编码值。
- public int read(char[] cbuf):一次最多读取cbuf.length个字符数据,并把读取的字符数据存储到cbuf数组中。返回实际读取到的字符数据个数。 读取到文件末尾返回:-1
4 FileReader类
java.io.FileReader类是读取字符文件的便利类。构造时使用系统默认的字符编码(UTF-8)和默认字节缓冲区。
FileReader类的构造方法:
- FileReader(File file): 创建一个新的 FileReader ,给定要读取的File对象。
- FileReader(String fileName): 创建一个新的 FileReader ,给定要读取的文件的名称。
三.字符缓冲流
1 .字符缓冲流概述
字符缓冲流不具备读写功能 , 只提供缓冲区 , 真正读写还是需要依赖于构造接收的基本的字符流。
字符缓冲流的构造方法
- public BufferedReader(Reader in):创建一个 新的缓冲输入流。
- public BufferedWriter(Writer out): 创建一个新的缓冲输出流。
2 字符缓冲流复制纯文本文件
将c.txt文件内容复制给a.txt
3 字符缓冲流特有功能
- BufferedReader:public String readLine(): 读取文件一行数据, 不包含换行符号 , 读到文件的末尾返回null。
- BufferedWriter:public void newLine(): 写一个行分隔符,会根据操作系统的不同,写入不同的行分隔符
需求:读取文件中的数据排序后再次写出去