Java 超详细讲解字符流

 更新时间:2022年04月08日 16:23:16   作者:再美不及姑娘你  
字符流就是在字节流的基础上,加上编码,形成的数据流,字符流出现的意义是因为字节流在操作字符时,可能会有中文导致的乱码,所以由字节流引申出了字符流

一、字符流的由来

由于使用字节流操控中文时不是很方便,Java就提供了字符流来进行操控中文

实现原理:字节流+编码表

为什么用字节流进行复制带有中文的文本文件时没有问题?

因为底层操作会自动进行字节拼接成中文

怎样识别该字节是中文呢?

汉字在存储时,无论是UTF-8还是GBK,第一个字节都是负数用来提示

二、编码表

字符集:

是一个系统支持的所有字符的集合,包括国家文字、标点符号、图形符号、数字等

计算机要准确的存储和识别各种字符集符号,就需要进行字符编码,一套字符集必然至少有一套字符编码

常见的字符集有ASCII字符集、GBXXX字符集、Unicode字符集等

GBK:最常用的中文码表,是在GB2312标准基础上的扩展规范,使用了双字节编码方案,共收录了21003个汉字,完全兼容GB2312标准,同时支持繁体汉字以及日韩汉字等

GB18030:最新的中文码表,收录汉字70244个,采用多字节编码,每个字可以由1个、2个或4个字节组成。支持中国少数民族的文字,同时支持繁体汉字以及日韩汉字等

Unicode字符集:

为了表达任意语言的任意字符而设计,是业界的一个标准,也称为统一码、标准万国码;它最多使用4个字节的数字来表达每个字母、符号,或者文字。有三种编码方案:UTF-8、UTF-16、UTF32,最常用的是UTF-8

UTF-8:可以用来表示Unicode标准中的任意字符,它是电子邮件、网页及其他存储或传送文件的应用中,优先采用的编码。互联网工作小组要求所有的互联网协议都必须支持UTF-8编码格式。它使用一至四个字节为每个字符编码

UTF-8编码规则:

128个US-ASCII字符,只需要一个字节编码

拉丁文等字符,需要两个字节编码

大部分常用字(含中文),使用三个字节编码

其他极少使用的UniCode辅助字符,使用四个字节编码

总结:编码时使用那种规则,解码就需要采用对应的规则,否则会乱码

三、字符串中的编码解码问题

编码方法(IDEA):

byte[] getBytes():使用平台默认的字符集将该String编码为一系列字节,将结果存储到新的字节数组中

byte[] getBytes(String charsetName):使用指定的字符集将该String编码为一系列字节,将结果存储到新的字节数组中

解码方法(IDEA):

String(byte[]bytes):通过使用平台的默认字符集解码指定的字节数组来构造新的String

String(byte[]bytes,String charsetName):通过指定的字符集解码指定的字节数组来构造新的String

IDEA中默认的编码格式是UTF-8

四、字符流的编码解码问题

字符流抽象基类:

Reader:字符输入流的抽象类

Writer:字符输出流的抽象类

字符流中和编码解码问题相关的两个类:

InputStreamReader:是从字节流到字符流的桥梁:它读取字节,并使用指定的字符集将其解码为字符。它使用的字符集可以由名称指定,也可以被明确指定,或者可以接受平台的默认字符集

构造方法:

InputStreamReader(InputStream in)    创建一个使用默认字符集的InputStreamReader。
InputStreamReader(InputStream in, String charsetName)创建一个使用命名字符集的InputStreamReader。

OutputStreamWruter:是从字符流到字节流的桥梁:使用自订的字符集将写入的字符编码为字节,它使用的字符集可以由名称指定,也可以被明确指定,或者可以接受平台的默认字符集

构造方法:

OutputStreamWriter(OutputStream out)    创建一个使用默认字符编码的OutputStreamWriter。
OutputStreamWriter(OutputStream out, String charsetName)创建一个使用命名字符集的OutputStreamWriter。
public class ConversionStreamDemo {
    public static void main(String[] args) throws IOException {
        //创建一个默认编码格式的InputStreamReader\OutputStreamWriter
        InputStreamReader ipsr = new InputStreamReader(new FileInputStream("E:\\abc.txt"));
        OutputStreamWriter opsw = new OutputStreamWriter(new FileOutputStream("E:\\abc.txt"));
        //写入数据
        opsw.write("你好啊");
        opsw.close();
        //读数据,方式一:一次读取一个字节数据
        int ch;
        while ((ch = ipsr.read()) != -1) {
            System.out.print((char) ch);
        }
        ipsr.close();
​
    }
}

四、字符流写数据的五种方法

方法名说明
void write(int c)    写一个字符
void write(char[] cbuf)写入一个字符数组
void write(char[] cbuf,int off,int len)写入字符数组的一部分
void write(String str)写入一个字符串
void write(String str,int off,int len)写入一个字符串的一部分

字符流写数据需要注意缓冲区的问题,如果想要将缓冲区的数据加载出来需要在写入方法后加上刷新方法flush();

前三个方法与字节流写入方法使用相同,这里重点介绍下面两种方式

public class OutputStreamWriterDemo {
    public static void main(String[] args) throws IOException {
        //创建一个默认编码格式的OutputStreamWriter对象
        OutputStreamWriter opsw=new OutputStreamWriter(new FileOutputStream("E:\\abc.txt"));
        //方式一:写入一个字节
        opsw.write(97);
        opsw.flush();//如果需要在文件中立即显示输入的数据,就需要加入刷新方法
        //方式二:写入一个字符数组
        char[]ch={'a','b','c','二'};
        opsw.write(ch);
        opsw.flush();//如果需要在文件中立即显示输入的数据,就需要加入刷新方法
        //方式三:写入一个字符数组的一部分
        opsw.write(ch,0,2);
        opsw.flush();//如果需要在文件中立即显示输入的数据,就需要加入刷新方法
        //方式四:写入一个字符串
        opsw.write("一二三");
        opsw.flush();//如果需要在文件中立即显示输入的数据,就需要加入刷新方法
        //方式五:写入一个字符串的一部分
        opsw.write("三四五",1,2);
        opsw.flush();//如果需要在文件中立即显示输入的数据,就需要加入刷新方法
    }
}

五、字符流读数据的两种方法

方法名说明
int read()    一次读取一个字符数据
int read(char[] cbuf)一次读取一个字符数组数据
public class InputStreamReadDemo {
    public static void main(String[] args) throws IOException {
        //创建一个默认编码格式的InputStreamReader
        InputStreamReader ipsr=new InputStreamReader(new FileInputStream("E:\\abc.txt"));
        //读取数据,方式一一次读取一个字符数据
        int ch;
        while ((ch=ipsr.read())!=-1){
            System.out.print((char) ch);
        }
        ipsr.close();
        //方式二:一次读取一个字符数组数据
        char []ch=new char[1024];
        int len;
        while ((len=ipsr.read(ch))!=-1){
            System.out.print(new String(ch,0,len));
        }
        ipsr.close();
    }
}

小结:如果使用默认编码格式的话,那么字符输入流InputStreamReader可以使用子类FileReader来替代,字符输出流OutputStreamWriter可以使用其子类FileWriter来替代,两者在使用默认编码格式的情况下作用一致。

到此这篇关于Java 超详细讲解字符流的文章就介绍到这了,更多相关Java 字符流内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Java使用continue语句的实例详解

    Java使用continue语句的实例详解

    这篇文章主要介绍了Java使用continue语句的实例详解的相关资料,希望通过本文能帮助到大家,让大家掌握使用方法,需要的朋友可以参考下
    2017-10-10
  • Java枚举类使用场景及实例解析

    Java枚举类使用场景及实例解析

    这篇文章主要介绍了Java枚举类使用场景及实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-04-04
  • java如何实现获取客户端ip地址的示例代码

    java如何实现获取客户端ip地址的示例代码

    本文主要介绍了java如何实现获取客户端ip地址,主要包括java获取客户端ip地址工具类使用实例、应用技巧,文中通过示例代码介绍的非常详细,感兴趣的小伙伴们可以参考一下
    2022-04-04
  • Java与Mysql锁相关知识总结

    Java与Mysql锁相关知识总结

    这篇文章主要介绍了Java与Mysql锁相关知识总结的相关资料,需要的朋友可以参考下
    2023-04-04
  • redis与ssm整合方法(mybatis二级缓存)

    redis与ssm整合方法(mybatis二级缓存)

    本文给大家介绍redis与ssm整合方法(mybatis二级缓存)。主要是利用redis去做mybatis的二级缓存,mybaits映射文件中所有的select都会刷新已有缓存,如果不存在就会新建缓存,所有的insert,update操作都会更新缓存
    2017-12-12
  • 一次"java:程序包org.aspectj.lang不存在"问题解决实战记录

    一次"java:程序包org.aspectj.lang不存在"问题解决实战记录

    这篇文章主要给大家介绍了一次"java:程序包org.aspectj.lang不存在"问题解决的实战过程,这个错误提示意味着你的Java程序中引用了org.aspectj.lang这个包,但是该包并不存在,文章通过图文介绍的非常详细,需要的朋友可以参考下
    2023-06-06
  • springboot整合mybatis实现数据库的更新批处理方式

    springboot整合mybatis实现数据库的更新批处理方式

    这篇文章主要介绍了springboot整合mybatis实现数据库的更新批处理方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-03-03
  • 详解怎么用Java的super关键字

    详解怎么用Java的super关键字

    今天带大家学习Java中super关键字是怎么用的,文中有非常详细的介绍,对正在学习的小伙伴们很有帮助,需要的朋友可以参考下
    2021-06-06
  • mybatis返回list<Integer>时resultType写Integer问题

    mybatis返回list<Integer>时resultType写Integer问题

    这篇文章主要介绍了mybatis返回list<Integer>时resultType写Integer问题,具有很好的参考价值,希望对大家有所帮助,
    2023-12-12
  • Spring BeanFactory 与 FactoryBean 的区别详情

    Spring BeanFactory 与 FactoryBean 的区别详情

    这篇文章主要介绍了Spring BeanFactory 与 FactoryBean 的区别详情,BeanFactory 和 FactoryBean 的区别却是一个很重要的知识点,在本文中将结合源码进行分析讲解,需要的小伙伴可以参考一下
    2022-05-05

最新评论