Java使用Apache POI库读取Excel表格文档的示例

 更新时间:2016年06月14日 08:53:00   作者:it_wangxiangpan  
POI库是Apache提供的用于在Windows下读写各类微软Office文档的Java库,这里我们就来看一下Java使用Apache POI库读取Excel表格文档的示例:

Apache POI 是用Java编写的免费开源的跨平台的 Java API,Apache POI提供API给Java程式对Microsoft Office格式档案读和写的功能。
项目下载页:http://poi.apache.org/download.html

Apache POI 是创建和维护操作各种符合Office Open XML(OOXML)标准和微软的OLE 2复合文档格式(OLE2)的Java API。用它可以使用Java读取和创建,修改MS Excel文件.而且,还可以使用Java读取和创建MS Word和MSPowerPoint文件。Apache POI 提供Java操作Excel解决方案。

  • HSSF - 提供读写Microsoft Excel XLS格式档案的功能。
  • XSSF - 提供读写Microsoft Excel OOXML XLSX格式档案的功能。
  • HWPF - 提供读写Microsoft Word DOC格式档案的功能。
  • HSLF - 提供读写Microsoft PowerPoint格式档案的功能。
  • HDGF - 提供读Microsoft Visio格式档案的功能。
  • HPBF - 提供读Microsoft Publisher格式档案的功能。
  • HSMF - 提供读Microsoft Outlook格式档案的功能。

读取Excel文档示例
我们使用POI中的HSSFWorkbook来读取Excel数据。

public void test(File file) throws IOException { 
    InputStream inp = new FileInputStream(file); 
    HSSFWorkbook workbook = new HSSFWorkbook(inp); 
     
    // workbook...遍历操作 
  } 

上边代码,读取Excel2003(xls)的文件没问题,但是一旦读取的是Excel2007(xlsx)的文件,就会报异常:“The supplied data appears to be in the Office 2007+ XML. You are calling the part of POI that deals with OLE2 Office Documents. You need to call a different part of POI to process this data (eg XSSF instead of HSSF)”
查阅了资料,Excel2007版本的Excel文件需要使用XSSFWorkbook来读取,如下:

public void test(File file) throws IOException { 
    InputStream inp = new FileInputStream(file); 
    XSSFWorkbook workbook = new XSSFWorkbook(inp); 
     
    // workbook...遍历操作 
  } 

注意:XSSFWorkbook需要额外导入poi-ooxml-3.9-sources.jar和poi-ooxml-schemas-3.9.jar。
这样,Excel2007的导入没问题了,但是导入Excel2003又报异常。

所以,在导入Excel的时候,尽量能判断导入Excel的版本,调用不同的方法。
我想到过使用文件后缀名来判断类型,但是如果有人将xlsx的后缀改为xls时,如果使用xlsx的函数来读取,结果是报错;虽然后缀名对了,但是文件内容编码等都不对。
最后,推荐使用poi-ooxml中的WorkbookFactory.create(inputStream)来创建Workbook,因为HSSFWorkbook和XSSFWorkbook都实现了Workbook接口。代码如下:

Workbook wb = WorkbookFactory.create(is); 

可想而知,在WorkbookFactory.create()函数中,肯定有做过对文件类型的判断,一起来看一下源码是如何判断的:

/** 
   * Creates the appropriate HSSFWorkbook / XSSFWorkbook from 
   * the given InputStream. 
   * Your input stream MUST either support mark/reset, or 
   * be wrapped as a {@link PushbackInputStream}! 
   */ 
  public static Workbook create(InputStream inp) throws IOException, InvalidFormatException { 
    // If clearly doesn't do mark/reset, wrap up 
    if(! inp.markSupported()) { 
      inp = new PushbackInputStream(inp, 8); 
    } 
     
    if(POIFSFileSystem.hasPOIFSHeader(inp)) { 
      return new HSSFWorkbook(inp); 
    } 
    if(POIXMLDocument.hasOOXMLHeader(inp)) { 
      return new XSSFWorkbook(OPCPackage.open(inp)); 
    } 
    throw new IllegalArgumentException("Your InputStream was neither an OLE2 stream, nor an OOXML stream"); 
  } 

可以看到,有根据文件类型来分别创建合适的Workbook对象。是根据文件的头部信息去比对进行判断的,此时,就算改了后缀名,还是一样通不过。

相关文章

  • idea中引入了gb2312编码的文件的解决方法

    idea中引入了gb2312编码的文件的解决方法

    这篇文章主要介绍了idea中引入了gb2312编码的文件的解决方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-08-08
  • Java实现图形界面计算器

    Java实现图形界面计算器

    这篇文章主要为大家详细介绍了Java实现图形界面计算器,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-11-11
  • Java整型数与网络字节序byte[]数组转换关系详解

    Java整型数与网络字节序byte[]数组转换关系详解

    这篇文章主要介绍了Java整型数与网络字节序byte[]数组转换关系,结合实例形式归纳整理了java整型数和网络字节序的byte[]之间转换的各种情况,需要的朋友可以参考下
    2017-08-08
  • SpringBoot 整合 ElasticSearch操作各种高级查询搜索

    SpringBoot 整合 ElasticSearch操作各种高级查询搜索

    这篇文章主要介绍了SpringBoot 整合 ES 进行各种高级查询搜索的实践记录,本文主要围绕 SpringBoot 整合 ElasticSearch 进行各种高级查询的介绍,需要的朋友可以参考下
    2022-06-06
  • Java自定义注解实现Redis自动缓存的方法

    Java自定义注解实现Redis自动缓存的方法

    本篇文章主要介绍了Java自定义注解实现Redis自动缓存的方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下。
    2017-04-04
  • Java实现聊天机器人

    Java实现聊天机器人

    这篇文章主要为大家详细介绍了Java简单实现聊天机器人,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-07-07
  • Java使用RandomAccessFile类对文件进行读写

    Java使用RandomAccessFile类对文件进行读写

    本篇文章主要介绍了Java使用RandomAccessFile类对文件进行读写,详细的介绍了RandomAccessFile类的使用技巧和实例应用,有兴趣的可以了解一下
    2017-04-04
  • Java 多线程实例详解(二)

    Java 多线程实例详解(二)

    本文主要介绍Java 多线程的资料整理,这里整理了详细资料及相关示例代码,有兴趣的小伙伴可以参考下
    2016-09-09
  • Java遍历Map对象集合的六种方式代码示例

    Java遍历Map对象集合的六种方式代码示例

    Java中的Map是一种键值对映射的数据结构,它提供了一些常用的方法用于获取、添加、删除和修改元素,下面这篇文章主要给大家介绍了关于Java遍历Map对象集合的六种方式,需要的朋友可以参考下
    2024-02-02
  • java 简单的计算器程序实例代码

    java 简单的计算器程序实例代码

    这篇文章主要介绍了java 简单的计算器程序实例代码的相关资料,需要的朋友可以参考下
    2017-06-06

最新评论