java字节字符转换流操作详解

 更新时间:2019年09月10日 10:19:39   作者:cakincqm  
这篇文章主要介绍了java字节字符转换流操作,结合实例形式详细分析了Java字符流转换相关原理、实现方法及操作注意事项,需要的朋友可以参考下

本文实例讲述了java字节字符转换流操作。分享给大家供大家参考,具体如下:

一 基本概念

1、认识文本和文本文件

java的文本(char)是16位无符号,是字符的unicode编码(双字节编码)
文件是byte byte byte 的数据序列
文本文件是文本(char)序列按照某种编码方案(utf-8,utf-16be,gbk)序列化为byte的存储结果。

2、字符流(Reader Writer)---操作的都是文本文件

字符的处理:一次处理一个字符
字符的底层任然是基本的字节序列

3、字符流的基本实现

InputStreamReader完成byte流解析未char流,按照编码解析
OutputStreamWriter 提供完成char流到byte流,按照编码处理

4、UE编码查看方法

UltraEdit-32的状态栏可以显示文件的编码类型,详细情况如下:

5、Myeclipse编码查看方法

Project->Property->Resource

二 实例

package com.imooc.io;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
public class IsrAndOswDemo {
    public static void main(String[] args)throws IOException {
        FileInputStream in = new FileInputStream("e:\\javaio\\test2.txt");
        InputStreamReader isr = new InputStreamReader(in,"utf-8");//默认项目的编码,操作的时候,要写文件本身的编码格式
        FileOutputStream out = new FileOutputStream("e:\\javaio\\test1.txt");
        OutputStreamWriter osw = new OutputStreamWriter(out,"utf-8");
        /*int c ;
        while((c = isr.read())!=-1){
            System.out.print((char)c);
        }*/
        char[] buffer = new char[8*1024];
        int c;
        /*批量读取,放入buffer这个字符数组,从第0个位置开始放置,最多放buffer.length个
         返回的是读到的字符的个数
        */
        while(( c = isr.read(buffer,0,buffer.length))!=-1){
            String s = new String(buffer,0,c);
            System.out.print(s);
            osw.write(buffer,0,c);
            osw.flush();
        }
        isr.close();
        osw.close();
    }
}

三 运行结果

中国1jd

四 说明

用UE创建的utf-8和用myeclipse创建的utf-8,文件大小不一样,该程序是用myeclipse创建的utf-8进行测试的。

五 utf-8无bom和utf-8什么区别

utf-8+bom比utf-8多了三个字节前缀:0xEF0xBB0xBF,有这三个字节前缀的文本或字符串,程序可以自动判断它为utf-8格式,并按照utf-8格式来解析文本或字符串,否则,一个文本或者字符串在未知编码的情况下,需要按照字符编码规范去一个个验证

六 utf-8编码说明

https://baike.baidu.com/item/UTF-8/481798?fr=aladdin

七 编码实例

打开”记事本“程序Notepad.exe,新建一个文本文件,内容就是一个”严“字,依次采用ANSI,Unicode,Unicode big endian 和 UTF-8编码方式保存。

然后,用文本编辑软件UltraEdit中的”编辑-十六进制函数“,观察该文件的内部编码方式。

1)ANSI:文件的编码就是两个字节“D1 CF”,这正是“严”的GB2312编码,这也暗示GB2312是采用大头方式存储的。
2)Unicode:编码是四个字节“FF FE 25 4E”,其中“FF FE”表明是小头方式存储,真正的编码是4E25。
3)Unicode big endian:编码是四个字节“FE FF 4E 25”,其中“FE FF”表明是大头方式存储。
4)UTF-8:编码是六个字节“EF BB BF E4 B8 A5”,前三个字节“EF BB BF”表示这是UTF-8编码,后三个“E4B8A5”就是“严”的具体编码,它的存储顺序与编码顺序是一致的。

更多关于java相关内容感兴趣的读者可查看本站专题:《Java字符与字符串操作技巧总结》、《Java数组操作技巧总结》、《Java数学运算技巧总结》、《Java数据结构与算法教程》及《Java操作DOM节点技巧总结

希望本文所述对大家java程序设计有所帮助。

相关文章

  • Sublime Text 打开Java文档中文乱码的解决方案

    Sublime Text 打开Java文档中文乱码的解决方案

    这篇文章主要介绍了Sublime Text 中文乱码的解决方案,帮助大家更好的理解和使用Java,感兴趣的朋友可以了解下
    2020-12-12
  • Spring源码解析后置处理器梳理总结

    Spring源码解析后置处理器梳理总结

    这篇文章主要介绍了Spring源码解析后置处理器梳理总结,在前面几篇文章中梳理了Spring中bean的创建过程,在这个过程中各式各样的后置处理器发挥了不同的作用,可以说后置处理器贯穿了bean的实例化以及初始化过程
    2022-07-07
  • Java别名Alias是如何工作的

    Java别名Alias是如何工作的

    这篇文章主要介绍了Java别名Alias是如何工作的,别名的问题是,当用户写入特定对象时,其他几个引用的所有者不希望该对象发生更改,下文相关介绍需要的小伙伴可以参考一下
    2022-04-04
  • java实现动态代理方法浅析

    java实现动态代理方法浅析

    这篇文章主要介绍了java实现动态代理方法浅析,很实用的功能,需要的朋友可以参考下
    2014-08-08
  • SpringBoot中使用Quartz设置定时任务的实例详解

    SpringBoot中使用Quartz设置定时任务的实例详解

    Quartz是OpenSymphony开源组织在任务调度领域的一个开源项目,完全基于 Java 实现,本文小编给大家介绍了SpringBoot中如何使用Quartz设置定时任务,文中通过代码示例给大家讲解的非常详细,需要的朋友可以参考下
    2023-12-12
  • java自带排序使用

    java自带排序使用

    这篇文章主要给大家分享了java自带排序使用,该方法是升序排序,方法的内部采用了快排实现,但该方法是 稳定的。下面一起来看看文章的详细介绍吧
    2021-12-12
  • java类成员中的访问级别浅析

    java类成员中的访问级别浅析

    在本篇文章里小编给大家整理的是一篇关于java类成员中的访问级别浅析内容,有兴趣的朋友们跟着学习下。
    2021-01-01
  • Java+mysql实现学籍管理系统

    Java+mysql实现学籍管理系统

    这篇文章主要为大家详细介绍了Java+mysql实现学籍管理系统,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-07-07
  • Java实现跨服务器上传文件功能

    Java实现跨服务器上传文件功能

    这篇文章主要为大家详细介绍了Java实现跨服务器上传文件功能,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-01-01
  • java实现九宫格游戏

    java实现九宫格游戏

    这篇文章主要为大家详细介绍了java实现九宫格游戏,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2020-11-11

最新评论