Java避免UTF-8的csv文件打开中文出现乱码的方法

 更新时间:2019年07月19日 11:23:58   作者:zhaozhi406  
这篇文章主要介绍了Java避免UTF-8的csv文件打开中文出现乱码的方法,结合实例形式分析了java操作csv文件时使用utf-16le编码与utf8编码相关操作技巧,需要的朋友可以参考下

本文实例讲述了Java避免UTF-8的csv文件打开中文出现乱码的方法。分享给大家供大家参考,具体如下:

最近又遇到了需要提供csv下载功能的需求,不同的时需要用java来实现,心想简单,就把以前php的版本重写了一遍,然后生成一份csv,用excel2007打开一看,里面的中文都是乱码,一下就懵了,以前好好的功能怎么突然不行了??以前也一直用2007的啊!于是开始了漫长的google之旅。

看来看去,说的都是输出utf-8格式的csv需要在文件头先输出BOM(BOM不懂的可以google了),即0xEF 0xBB 0xBF三个字节,这样更摸不着头脑了,明明是对的,偏偏不成功,直到发现一个帖子:http://stackoverflow.com/a/9337150/1794493 ,里面提到2007需要装sp3才能识别BOM,shit!原来是这回事!里面同时又提到,用utf-16le编码输出貌似更通用,经测试确实如此,但是utf-16le的BOM是0xFF 0xFE,帖子里面说错了!下面是一个简单的测试结果:

excel版本 附加包 编码  测试结果
2007 sp3 utf-8 yes
2007 utf-8 no
2007 sp3 utf-16le yes
2007 utf-16le yes
2011 utf-8 no
2011 utf-16le yes

因为条件有限,只测试了这几个版本,可见utf-16le是更通用的编码格式。下面附上java代码,main方法中采用utf-16le编码,最后调用了utf8编码的方法,最后会输出两种编码格式的csv文件:

import java.io.*;
/**
 * Created by zhaozhi on 15-5-29.
 */
public class TestCSV {
  public static String join(String[] strArr, String delim) {
    StringBuilder sb = new StringBuilder();
    for(String s : strArr) {
      sb.append(s);
      sb.append(delim);
    }
    String ret;
    if (strArr.length > 1) {
      ret = sb.substring(0, sb.length()-1);
    }
    else {
      ret = sb.toString();
    }
    return ret;
  }
  public static void main (String[] args) throws Exception {
    String[] heads = {"日期", "产品", "订单数"};
    String[][] rows = {
        {"20150228", "安卓", "23"},
        {"20150301", "web", "34"}
    };
    byte[] bom = {(byte)0xFF, (byte)0xFE};
    String fname = "d:\\utf-16le.csv";
    BufferedOutputStream bo = new BufferedOutputStream(new FileOutputStream(fname));
    bo.write(bom);
    bo.write(join(heads, "\t").getBytes("utf-16le"));
    bo.write("\n".getBytes("utf-16le"));
    for (String[] row : rows) {
      bo.write(join(row, "\t").getBytes("utf-16le"));
      bo.write("\n".getBytes("utf-16le"));
    }
    bo.close();
    UTF8();
  }
  public static void UTF8() throws IOException {
    String line = "中文,标题,23";
    OutputStream os = new FileOutputStream("d:/utf-8.csv");
    os.write(239);  // 0xEF
    os.write(187);  // 0xBB
    os.write(191);  // 0xBF
    PrintWriter w = new PrintWriter(new OutputStreamWriter(os, "UTF-8"));
    w.print(line);
    w.flush();
    w.close();
  }
}

更多关于java相关内容感兴趣的读者可查看本站专题:《Java编码操作技巧总结》、《Java数学运算技巧总结》、《Java数据结构与算法教程》、《Java字符与字符串操作技巧总结》、《Java操作DOM节点技巧总结》和《Java缓存操作技巧汇总

希望本文所述对大家java程序设计有所帮助。

相关文章

  • Java的字符串中对子字符串的查找方法总结

    Java的字符串中对子字符串的查找方法总结

    这篇文章主要介绍了Java的字符串中对子字符串的查找方法总结,是Java入门学习中的基础知识,需要的朋友可以参考下
    2015-11-11
  • 一篇文章让你学会Java的输入与输出

    一篇文章让你学会Java的输入与输出

    这篇文章主要介绍了Java输入与输出的相关资料,包括使用System.out.println()、System.out.printf()和System.out.print()进行输出,以及使用Scanner类和System.in.read()方法进行输入,需要的朋友可以参考下
    2025-03-03
  • 如何给HttpServletRequest增加消息头

    如何给HttpServletRequest增加消息头

    这篇文章主要介绍了如何给HttpServletRequest增加消息头的实现方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-06-06
  • 在ChatGPT的API中支持多轮对话的实现方法

    在ChatGPT的API中支持多轮对话的实现方法

    ChatGPT是由OpenAI研发的一种预训练语言模型,只能在OpenAI平台上进行训练,目前并不对外开放训练接口,这篇文章主要介绍了在ChatGPT的API中支持多轮对话的实现方法,需要的朋友可以参考下
    2023-02-02
  • Java网络编程UDP协议发送接收数据

    Java网络编程UDP协议发送接收数据

    这篇文章主要为大家详细介绍了Java网络编程UDP协议发送接收数据,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-08-08
  • java设计模式之桥接模式(Bridge)

    java设计模式之桥接模式(Bridge)

    这篇文章主要为大家详细介绍了java设计模式之桥接模式Bridge,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-01-01
  • Java常用的数据脱敏方法(手机、邮箱、身份证号)

    Java常用的数据脱敏方法(手机、邮箱、身份证号)

    这篇文章主要给大家介绍了关于Java常用的数据脱敏(手机、邮箱、身份证号)的相关资料,信息脱敏对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护,需要的朋友可以参考下
    2023-07-07
  • Java8新特性之Optional使用详解

    Java8新特性之Optional使用详解

    这篇文章主要介绍了Java8新特性之Optional使用详解,为了解决空指针异常更加优雅,Java8 提供了 Optional 类库,Optional 实际上是个容器,它可以保存类型T的值,或者仅仅保存null,,需要的朋友可以参考下
    2023-08-08
  • Java FileInputStream读中文乱码问题解决方案

    Java FileInputStream读中文乱码问题解决方案

    这篇文章主要介绍了Java FileInputStream读中文乱码问题解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-10-10
  • Java swing实现应用程序对数据库的访问问题

    Java swing实现应用程序对数据库的访问问题

    这篇文章主要介绍了Java swing实现应用程序对数据库的访问,本次实验需要做一个GUI界面和一个连接查询功能,在论坛上借鉴了其他大佬获取网站内容的部分代码,然后自己做了一个及其简陋的swing界面,算是把这个实验完成了,需要的朋友可以参考下
    2022-09-09

最新评论