java如何将pdf转换成image

 更新时间:2018年05月02日 11:34:26   作者:yiluoak_47  
这篇文章主要为大家详细介绍了java如何将pdf转换成image,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

本文实例为大家分享了java将pdf转换image的具体代码,供大家参考,具体内容如下

首先使用了使用了apache的PDFBox组件1.8.4版本

package pdf; 
 
import java.awt.image.BufferedImage; 
import java.io.File; 
import java.io.IOException; 
import java.util.Date; 
import java.util.List; 
 
import javax.imageio.ImageIO; 
 
import org.apache.pdfbox.pdmodel.PDDocument; 
import org.apache.pdfbox.pdmodel.PDPage; 
 
public class PDFBox { 
   
  @SuppressWarnings("rawtypes") 
  public static void main(String[] args) throws IOException { 
    String p=System.getProperty("user.dir") + "/"+"zk.pdf";   
     
    PDDocument doc = PDDocument.load(p); 
    int pageCount = doc.getNumberOfPages(); 
    System.out.println(pageCount); 
    Date start = new Date(); 
    try { 
      List pages = doc.getDocumentCatalog().getAllPages(); 
      for(int i=0;i<pages.size();i++){ 
        PDPage page = (PDPage) pages.get(i); 
        @SuppressWarnings("unused") 
        int width = new Float(page.getTrimBox().getWidth()).intValue(); 
        @SuppressWarnings("unused") 
        int height = new Float(page.getTrimBox().getHeight()).intValue(); 
        BufferedImage image = page.convertToImage(); 
        ImageIO.write(image, "jpg", new File("img" + File.separator + (i + 1) + ".jpg")); 
        System.out.println("image in the page -->"+(i+1)); 
      } 
    } catch (Exception e) { 
      e.printStackTrace(); 
    }finally{ 
      if(doc != null){ 
        doc.close(); 
      } 
    } 
    Date end = new Date(); 
    System.out.println(end.getTime()-start.getTime()); 
    System.out.println("over"); 
  } 
   
} 

但是其问题在于问题:

当PDF文档为180M大小时直接报解析异常

当PDF页数为500多页时处理非常慢 

其后尝试使用了pdf-renderer 1.0.5 版本

package pdf; 
 
import java.awt.Image; 
import java.awt.Rectangle; 
import java.awt.image.BufferedImage; 
import java.io.File; 
import java.io.FileOutputStream; 
import java.io.IOException; 
import java.io.RandomAccessFile; 
import java.nio.MappedByteBuffer; 
import java.nio.channels.FileChannel; 
 
import com.sun.image.codec.jpeg.JPEGCodec; 
import com.sun.image.codec.jpeg.JPEGEncodeParam; 
import com.sun.image.codec.jpeg.JPEGImageEncoder; 
import com.sun.pdfview.PDFFile; 
import com.sun.pdfview.PDFPage; 
 
public class PDFRenderer { 
   
  public static void main(String[] args) throws IOException{ 
    String pdfRealePath=System.getProperty("user.dir") + "/"+"zk.pdf"; 
    File file = new File(pdfRealePath); 
    RandomAccessFile raf = new RandomAccessFile(file, "r"); 
    FileChannel channel = raf.getChannel(); 
    MappedByteBuffer buf = channel.map(FileChannel.MapMode.READ_ONLY, 
        0, channel.size()); 
    PDFFile pdffile = new PDFFile(buf); 
     
    for (int i = 1; i <= pdffile.getNumPages(); i++) { 
      PDFPage page = pdffile.getPage(i); 
      Rectangle rect = new Rectangle(0, 0, ((int) page.getBBox() 
          .getWidth()), ((int) page.getBBox().getHeight())); 
      Image img = page.getImage(rect.width, rect.height, rect, null,true,true); 
      BufferedImage tag = new BufferedImage(rect.width, rect.height, 
          BufferedImage.TYPE_INT_RGB); 
      tag.getGraphics().drawImage(img, 0, 0, rect.width, rect.height,null); 
       
      FileOutputStream out = new FileOutputStream("img" + File.separator + (i + 1) + ".jpg"); // 输出到文件流 
      JPEGImageEncoder encoder = JPEGCodec.createJPEGEncoder(out); 
      JPEGEncodeParam param2 = encoder.getDefaultJPEGEncodeParam(tag); 
      param2.setQuality(1f, false);// 1f是提高生成的图片质量 
      encoder.setJPEGEncodeParam(param2); 
      encoder.encode(tag); // JPEG编码 
      out.close(); 
      System.out.println("image in the page -->"+(i+1)); 
    } 
  } 
} 

但是其问题在于问题: 当pdf的版本不为1.4时,直接报错:Expected 'xref' at start of table

pdfbox与pdfrenderer相比较来说,转换的效率要低得多。200页左右的pdf花费的时间是后者的6倍左右。同时,对于中文字体的支持存在些问题。

但是对于却不存在pdf版本不同无法转换的问题。

pdfrenderer 不能转换1.4以上版本,查找了解决办法但是没有找到。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • javaweb实现文件上传小功能

    javaweb实现文件上传小功能

    这篇文章主要为大家详细介绍了javaweb实现文件上传功能,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-06-06
  • Java设计通用的返回数据格式过程讲解

    Java设计通用的返回数据格式过程讲解

    现在很多的项目server端返回client端的数据多数以JSON格式返回,同时结合其它需要,通常加一下状态码和信息之类,给前端处理带来很大的方便,这篇文章就用Java设计了通用的返回数据格式,感兴趣的同学可以参考下文
    2023-05-05
  • Java实现爬虫

    Java实现爬虫

    这篇文章介绍了Java实现爬虫的方法,文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-01-01
  • Java实战之兼职平台系统的实现

    Java实战之兼职平台系统的实现

    这篇文章主要介绍了如何利用Java编写一个兼职平台系统,采用到的技术有Springboot、SpringMVC、MyBatis、ThymeLeaf等,感兴趣的小伙伴可以了解一下
    2022-03-03
  • eclipse里没有“Dynamic Web Project“这个选项的问题解决

    eclipse里没有“Dynamic Web Project“这个选项的问题解决

    本文主要介绍了eclipse里没有“Dynamic Web Project“这个选项的问题解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-08-08
  • java面试应用上线后Cpu使用率飙升如何排查

    java面试应用上线后Cpu使用率飙升如何排查

    这篇文章主要为大家介绍了java面试中应用上线后Cpu使用率飙升如何排查的方法示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-07-07
  • Java开发中最让人头疼的十个bug

    Java开发中最让人头疼的十个bug

    这篇文章主要给大家总结介绍了关于Java开发中最让人头疼的十个bug,同样的bug信息,可能背后有千万种原因,而我,永远都不知道到底是哪一个,努力通过代码积累尽可能多的bug,并将它们进行分类,可以帮你debug节省了时间,需要的朋友可以参考下
    2021-10-10
  • MongoDB整合Spring实例详细讲解(含代码)

    MongoDB整合Spring实例详细讲解(含代码)

    这篇文章主要介绍了MongoDB整合Spring实例详细讲解(含代码),小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-01-01
  • Java基础题新手练习(二)

    Java基础题新手练习(二)

    下面小编就为大家带来一篇Java基础的几道练习题(分享)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧,希望可以帮到你
    2021-07-07
  • JAVA使用DBUtils操作数据库

    JAVA使用DBUtils操作数据库

    这篇文章主要介绍了JAVA使用DBUtils操作数据库的相关资料,文中示例代码非常详细,帮助大家学习JAVA,感兴趣的朋友可以了解下
    2020-07-07

最新评论