使用Java读取Word文件的简单例子分享

 更新时间:2015年10月15日 08:56:43   作者:ISH_ICODE  
这篇文章主要介绍了使用Java读取Word文件的简单例子分享,包括读取word文件的表格数据的示例,需要的朋友可以参考下

java读取word文档时,虽然网上介绍了很多插件poi、java2Word、jacob、itext等等,poi无法读取格式(新的API估计行好像还在处于研发阶段,不太稳定,做项目不太敢用);java2Word、jacob容易报错找不到注册,比较诡异,我曾经在不同的机器上试过,操作方法完全一致,有的机器不报错,有的报错,去他们论坛找高人解决也说不出原因,项目部署用它有点玄;itxt好像写很方便但是我查了好久资料没有见到过关于读的好办法。经过一番选择还是折中点采用rtf最好,毕竟rtf是开源格式,不需要借助任何插件,只需基本IO操作外加编码转换即可。rtf格式文件表面看来和doc没啥区别,都可以用word打开,各种格式都可以设定。
 
----- 实现的功能:读取rtf模板内容(格式和文本内容),替换变化部分,形成新的rtf文档。
 
----- 实现思路:模板中固定部分手动输入,变化的部分用$info$表示,只需替换$info$即可。
 
       1、采用字节的形式读取rtf模板内容
       2、将可变的内容字符串转为rtf编码
       3、替换原文中的可变部分,形成新的rtf文档
 
主要程序如下:
 

public String bin2hex(String bin) {
    char[] digital = "0123456789ABCDEF".toCharArray();
    StringBuffer sb = new StringBuffer("");
    byte[] bs = bin.getBytes();
    int bit;
    for (int i = 0; i < bs.length;i++) {
      bit = (bs[i] & 0x0f0) >> 4;
 
      sb.append("\\'");
      sb.append(digital[bit]);
      bit = bs[i] & 0x0f;
      sb.append(digital[bit]);
    }
    return sb.toString();
  }
 
 
public String readByteRtf(InputStream ins, String path){
  String sourcecontent = "";
 try{
  ins = new FileInputStream(path);
  byte[] b = new byte[1024];
     if (ins == null) {
        System.out.println("源模板文件不存在");
     }
     int bytesRead = 0;
     while (true) {
       bytesRead = ins.read(b, 0, 1024); // return final read bytes counts
       if(bytesRead == -1) {// end of InputStream
        System.out.println("读取模板文件结束");
        break;
       }
       sourcecontent += new String(b, 0, bytesRead); // convert to string using bytes
      }
 }catch(Exception e){
  e.printStackTrace();
 }
 return sourcecontent ;
}

   
      以上为核心代码,剩余部分就是替换,从新组装java中的String.replace(oldstr,newstr);方法可以实现,在这就不贴了。源代码部分详见附件。
运行源代码前提:
c盘创建YQ目录,将附件中"模板.rtf"复制到YQ目录之下,运行OpreatorRTF.java文件即可,就会在YQ目录下生成文件名如:21时15分19秒_cheney_记录.rtf 的文件。 
 

package com;
 
import java.io.File;
import java.io.FileInputStream;
import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStream;
import java.io.PrintWriter;
import java.text.SimpleDateFormat;
import java.util.Date;
 
 
public class OperatorRTF {
 
    public String strToRtf(String content){
 
       char[] digital = "0123456789ABCDEF".toCharArray();
 
    StringBuffer sb = new StringBuffer("");
 
    byte[] bs = content.getBytes();
 
    int bit;
 
    for (int i = 0; i < bs.length; i++) {
 
      bit = (bs[i] & 0x0f0) >> 4;
 
        sb.append("\\'");
 
      sb.append(digital[bit]);
 
      bit = bs[i] & 0x0f;
 
      sb.append(digital[bit]);
 
    }
 
    return sb.toString();
 
    }
 
    public String replaceRTF(String content,String replacecontent,int flag){
 
       String rc = strToRtf(replacecontent);
 
       String target = "";
 
       
 
       if(flag==0){
 
           target = content.replace("$timetop$",rc);
 
       }
 
       if(flag==1){
 
           target = content.replace("$info$",rc);
 
       }
 
       if(flag==2){
 
           target = content.replace("$idea$",rc);
 
       }
 
       if(flag==3){
 
           target = content.replace("$advice$",rc);
 
       }
 
       if(flag==4){
 
           target = content.replace("$infosend$",rc);
 
       }
 
       return target;
 
    }
 
    public String getSavePath() {
 
       
 
       String path = "C:\\YQ";
 
       
 
       File fDirecotry = new File(path);
 
       if (!fDirecotry.exists()) {
 
           fDirecotry.mkdirs();
 
       }
 
       return path;
 
    }
 
    public String ToSBC(String input){
 
      char[] c = input.toCharArray();
 
      for (int i = 0; i < c.length; i++){
 
        if (c[i] == 32){
 
          c[i] = (char) 12288;
 
          continue;
 
        }
 
        if (c[i] < 127){
 
           c[i] = (char) (c[i] + 65248);
 
        }
 
      }
 
      return new String(c);
 
    }  
 
    public void rgModel(String username, String content) {
 
       // TODO Auto-generated method stub
       
       Date current=new Date();
 
    SimpleDateFormat sdf=new java.text.SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
 
       String targetname = sdf.format(current).substring(11,13) + "时";
 
       targetname += sdf.format(current).substring(14,16) + "分";
 
       targetname += sdf.format(current).substring(17,19) + "秒";
 
       targetname += "_" + username +"_记录.rtf";
 
            
       String strpath = getSavePath();
 
       String sourname = strpath+"\\"+"模板.rtf";
 
       String sourcecontent = "";
 
       InputStream ins = null;
 
       try{
 
           ins = new FileInputStream(sourname);
 
           byte[] b = new byte[1024];
 
        if (ins == null) {
 
           System.out.println("源模板文件不存在");
 
        }
 
        int bytesRead = 0;
 
        while (true) {
 
          bytesRead = ins.read(b, 0, 1024); // return final read bytes counts
 
          if(bytesRead == -1) {// end of InputStream
 
              System.out.println("读取模板文件结束");
 
              break;
 
          }
 
          sourcecontent += new String(b, 0, bytesRead); // convert to string using bytes
 
         }
 
       }catch(Exception e){
 
           e.printStackTrace();
 
       }      
 
       String targetcontent = "";
       
 
       String array[] = content.split("~");
             
 
       for(int i=0;i<array.length;i++){
 
          
 
           if(i==0){
 
              targetcontent = replaceRTF(sourcecontent, array[i], i);
 
           }else{
 
              targetcontent = replaceRTF(targetcontent, array[i], i);
 
           }          
 
       }  
 
       
       try {
 
           FileWriter fw = new FileWriter(getSavePath()+"\\" + targetname,true);
 
      PrintWriter out = new PrintWriter(fw);
 
      if(targetcontent.equals("")||targetcontent==""){
 
          out.println(sourcecontent);
 
      }else{
 
          out.println(targetcontent);
 
      }
 
      out.close();
 
      fw.close();
 
      System.out.println(getSavePath()+" 该目录下生成文件" + targetname + " 成功");
 
       } catch (IOException e) {
 
           // TODO Auto-generated catch block
 
           e.printStackTrace();
 
       }
 
    }
 
    public static void main(String[] args) {
 
       // TODO Auto-generated method stub
 
       OperatorRTF oRTF = new OperatorRTF();
       
       String content = "2008年10月12日9时-2008年10月12日6时~我们参照检验药品的方法~我们参照检验药品的方法~我们参照检验药品的方法~我们参照检验药品的方法";
 
       oRTF.rgModel("cheney",content);
 
    }

}


使用POI读取word文件的表格数据的示例:

<span style="font-size:14px;">package com.poi.world; 
 
import java.io.FileInputStream; 
 
import org.apache.poi.hwpf.HWPFDocument; 
import org.apache.poi.hwpf.usermodel.Paragraph; 
import org.apache.poi.hwpf.usermodel.Range; 
import org.apache.poi.hwpf.usermodel.Table; 
import org.apache.poi.hwpf.usermodel.TableCell; 
import org.apache.poi.hwpf.usermodel.TableIterator; 
import org.apache.poi.hwpf.usermodel.TableRow; 
import org.apache.poi.poifs.filesystem.POIFSFileSystem; 
 
public class POI_Word{ 
  public static void main(String[] args){ 
    try { 
      String[] s=new String[20]; 
      FileInputStream in=new FileInputStream("D:\\mayi.doc"); 
      POIFSFileSystem pfs=new POIFSFileSystem(in); 
      HWPFDocument hwpf=new HWPFDocument(pfs); 
      Range range =hwpf.getRange(); 
      TableIterator it=new TableIterator(range); 
      int index=0; 
      while(it.hasNext()){ 
        Table tb=(Table)it.next(); 
        for(int i=0;i<tb.numRows();i++){ 
          //System.out.println("Numrows :"+tb.numRows()); 
          TableRow tr=tb.getRow(i); 
          for(int j=0;j<tr.numCells();j++){ 
            //System.out.println("numCells :"+tr.numCells()); 
//           System.out.println("j  :"+j); 
            TableCell td=tr.getCell(j); 
            for(int k=0;k<td.numParagraphs();k++){ 
              //System.out.println("numParagraphs :"+td.numParagraphs()); 
              Paragraph para=td.getParagraph(k); 
               s[index]=para.text().trim(); 
               index++; 
            } 
          } 
        } 
      } 
//     System.out.println(s.toString()); 
      for(int i=0;i<s.length;i++){ 
        System.out.println(s[i]); 
      } 
    } catch (Exception e) { 
      e.printStackTrace(); 
    } 
  } 
}</span> 

相关文章

  • Java中Mybatis分页查询的四种传参方式

    Java中Mybatis分页查询的四种传参方式

    这篇文章主要介绍了Java中Mybatis分页查询的四种传参方式:顺序传参,@param传参,自定义POJO类传参,Map传参,想详细了解传参方式的小伙伴可以详细阅读本文,有一定的而参考价值
    2023-03-03
  • 简单易懂讲解happens-before原则

    简单易懂讲解happens-before原则

    Java内存模型中的happens-before是什么?为什么会有这东西的存在?一个新东西肯定是上手先,但是等我们空下来回过头来,我们还是需要去理解这些知识,只有这样我才能深刻的记住,并且运用熟练。下来和小编来一起学习下
    2019-05-05
  • Java异步编程工具Twitter Future详解

    Java异步编程工具Twitter Future详解

    这篇文章主要介绍了Java异步编程工具Twitter Future详解,包括基本用法示例代码,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-05-05
  • java equals函数用法详解

    java equals函数用法详解

    java 中equals函数的使用方法是广大java爱好者所关心的一个话题,本文将详细介绍其使用方法,需要了解的朋友可以参考下
    2012-11-11
  • Java NIO实现聊天功能

    Java NIO实现聊天功能

    这篇文章主要为大家详细介绍了Java NIO实现聊天功能,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-11-11
  • springboot中的springSession的存储和获取实现

    springboot中的springSession的存储和获取实现

    这篇文章主要介绍了springboot中的springSession的存储和获取实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-09-09
  • 详解Java对象转换神器MapStruct库的使用

    详解Java对象转换神器MapStruct库的使用

    在我们日常开发的程序中,为了各层之间解耦,一般会定义不同的对象用来在不同层之间传递数据。当在不同层之间传输数据时,不可避免地经常需要将这些对象进行相互转换。今天给大家介绍一个对象转换工具MapStruct,代码简洁安全、性能高,强烈推荐
    2022-09-09
  • Java毕业设计实战之共享租车信息管理系统的实现

    Java毕业设计实战之共享租车信息管理系统的实现

    这是一个使用了java+Jsp+Servlet+Jdbc+Mysql开发的共享租车信息管理系统,是一个毕业设计的实战练习,具有租车管理该有的所有功能,感兴趣的朋友快来看看吧
    2022-02-02
  • Java程序部署到服务器上,接口请求下载文件失败/文件为空/文件名不对的问题

    Java程序部署到服务器上,接口请求下载文件失败/文件为空/文件名不对的问题

    这篇文章主要介绍了Java程序部署到服务器上,接口请求下载文件失败/文件为空/文件名不对,本文给大家分享错误原因及解决方法,需要的朋友可以参考下
    2020-07-07
  • hibernate-validator后端表单数据校验的使用示例详解

    hibernate-validator后端表单数据校验的使用示例详解

    这篇文章主要介绍了hibernate-validator后端表单数据校验的使用,hibernate-validator提供的校验方式为在类的属性上加入相应的注解来达到校验的目的,本文结合示例代码给大家介绍的非常详细,需要的朋友可以参考下
    2022-08-08

最新评论