java使用pdfbox操作pdf文件示例

 更新时间:2014年03月13日 16:45:59   作者:  
有时候PDF中的文字无法复制,这可能是因为PDF文件加密了,不过使用PDFBox开源软件就可以把它读出来,下面是使用示例

还有一个用于创建PDF文件的项目----iText。

PDFBox下面有两个子项目:FontBox是一个处理PDF字体的java类库;JempBox是一个处理XMP元数据的java类库。

一个简单示例:

要引入pdfbox-app-1.6.0.jar这个包。

复制代码 代码如下:

package pdf;

import java.io.File;
import java.net.MalformedURLException;

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.util.PDFTextStripper;

public class StripPDFContent {

    public static String getText(File file)throws Exception{
        boolean sort=false;
        int startPage=1;
        int endPage=10;
        PDDocument document=null;
        try{
            try{
                document=PDDocument.load(file);
            }catch(MalformedURLException e){

            }
            PDFTextStripper stripper=new PDFTextStripper();
            stripper.setSortByPosition(sort);
            stripper.setStartPage(startPage);
            stripper.setEndPage(endPage);
            return stripper.getText(document);
        }catch(Exception e){
            e.printStackTrace();
            return "";
        }finally{
            if(document!=null){
                document.close();
            }
        }
    }

    public static void main(String[] args){
        File file=new File("/home/orisun/123.pdf");
        try{
            String cont=getText(file);
            System.out.println(cont);
        }catch(Exception e){
            System.out.println("Strip failed.");
            e.printStackTrace();
        }
    }
}

相关文章

  • java中的BlockingQueue(阻塞队列)解析

    java中的BlockingQueue(阻塞队列)解析

    这篇文章主要介绍了java中的BlockingQueue阻塞队列解析,阻塞队列是一个支持两个附加操作的队列,这两个附加的操作是,在队列为空时,获取元素的线程会等待队列变为非空,需要的朋友可以参考下
    2023-12-12
  • springboot注入servlet的方法

    springboot注入servlet的方法

    本篇文章主要介绍了springboot注入servlet的方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-05-05
  • MyBatis-Plus 乐观锁的具体实现

    MyBatis-Plus 乐观锁的具体实现

    MyBatis-Plus 的乐观锁通过简单的配置和注解,可以轻松实现高并发场景下的数据并发控制,具有一定的参考价值,感兴趣的可以了解一下
    2024-09-09
  • Spring事件监听器@EventListener与publishEvent的使用

    Spring事件监听器@EventListener与publishEvent的使用

    Spring可以通过事件监听器机制来处理应用程序中的事件,本文主要介绍了Spring事件监听器@EventListener与publishEvent的使用,具有一定的参考价值,感兴趣的可以了解一下
    2024-06-06
  • Spring中的注解@Value("#{}")与@Value("${}")的区别介绍

    Spring中的注解@Value("#{}")与@Value("${}")的区别

    这篇文章主要介绍了Spring中的注解@Value(“#{}“)与@Value(“${}“)的区别到底是什么,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-06-06
  • Java如何使用ReentrantLock实现长轮询

    Java如何使用ReentrantLock实现长轮询

    这篇文章主要介绍了如何使用ReentrantLock实现长轮询,对ReentrantLock感兴趣的同学,可以参考下
    2021-04-04
  • java读取证书公钥的实现

    java读取证书公钥的实现

    这篇文章主要介绍了java读取证书公钥的实现,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-01-01
  • SpringCloud Edgware.SR3版本中Ribbon的timeout设置方法

    SpringCloud Edgware.SR3版本中Ribbon的timeout设置方法

    今天小编就为大家分享一篇关于SpringCloud Edgware.SR3版本中Ribbon的timeout设置方法,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2018-12-12
  • Spring IOC 常用注解与使用实例详解

    Spring IOC 常用注解与使用实例详解

    这篇文章主要介绍了Spring IOC 常用注解与使用,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-06-06
  • SpringBoot中使用Thymeleaf模板详情

    SpringBoot中使用Thymeleaf模板详情

    这篇文章主要介绍了SpringBoot中使用Thymeleaf模板详情,hymeleaf是适用于Web和独立环境的现代服务器端Java模板引擎,能够处理HTML,XML,JavaScript,CSS甚至纯文本,下文更多相关资料介绍需要的小伙伴可以参考一下
    2022-04-04

最新评论