详解如何通过Java实现压缩PDF文档

 更新时间:2022年12月13日 17:19:50   作者:E-iceblue  
PDF文档是我们日常办公中使用最频繁的文档格式。但因为大多数PDF文档都包含很多页面图像或大量图片,这就导致PDF文档过大,处理起来较为麻烦。本文将介绍如何通过Java应用程序压缩PDF文档,需要的可以了解一下

PDF文档是我们日常办公中使用最频繁的文档格式。但因为大多数PDF文档都包含很多页面图像或大量图片,这就导致PDF文档过大,处理起来较为麻烦。PDF文件过大,就会导致传输或者下载的速度变慢,也会增加传输失败的风险,影响办公效率。因此我们需要对PDF文档进行压缩。本文将从以下两方面介绍如何通过Java应用程序压缩PDF文档。

在使用PDF文件过程中,经常会出现由于体积过大导致文件传输失败的情况。遇到这种情况,我们可以先将PDF文件压缩一下再进行传输。而除了压缩文档内容以外,压缩图片是缩小PDF文档的主要方法之一。本文将分为2部分分别介绍如何通过Java代码压缩PDF文档。希望这篇文章能对大家有所帮助。

  • 压缩PDF文档中的内容及图片
  • 压缩PDF文档中的高分辨率图片

引入jar包

导入方法1:

手动引入。将Free Spire.PDF for Java下载到本地,解压,找到lib文件夹下的Spire.PDF.jar文件。在IDEA中打开如下界面,将本地路径中的jar文件引入Java程序:

导入方法2:如果您想通过Maven安装,则可以在 pom.xml 文件中添加以下代码导入 JAR 文件。

<repositories>
        <repository>
            <id>com.e-iceblue</id>
            <url>https://repo.e-iceblue.cn/repository/maven-public/</url>
        </repository>
    </repositories>
<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.pdf.free</artifactId>
        <version>5.1.0</version>
    </dependency>
</dependencies>

压缩PDF文档中的内容及图片

压缩PDF文档中的内容及图片的详细步骤如下:

  • 创建 PdfDocument 类的对象。
  • 使用 PdfDocument.loadFromFile() 方法加载 PDF 文档。
  • 使用 PdfDocument.getFileInfo().setIncrementalUpdate() 方法将增量更新设置为false。
  • 使用 PdfDocument.setCompressionLevel() 方法将压缩级别设置为最佳,以压缩文档中的内容。 您可以从 PdfCompressionLevel 枚举中选择其他一些级别。
  • 循环遍历文档中的页面,使用 PdfPageBase.getImagesInfo() 方法获取每个页面的图像信息集合。
  • 遍历集合中的所有项目,并使用 PdfBitmap.setQuality() 方法压缩特定图像的质量。
  • 使用 PdfPageBase.replaceImage() 方法将原始图像替换为压缩图像。使用 PdfDocument.saveToFile() 方法将文档保存到另一个 PDF 文件。

完整代码

import com.spire.pdf.PdfCompressionLevel;
import com.spire.pdf.PdfDocument;
import com.spire.pdf.PdfPageBase;
import com.spire.pdf.exporting.PdfImageInfo;
import com.spire.pdf.graphics.PdfBitmap;

public class CompressPDFImage {

    public static void main(String[] args) {

        //创建 PdfDocument 类的对象。
        PdfDocument doc = new PdfDocument();

        //加载 PDF 文档
        doc.loadFromFile("测试文档.pdf");

        //将增量更新设置为false
        doc.getFileInfo().setIncrementalUpdate(false);

        //将压缩级别设置为最佳
        doc.setCompressionLevel(PdfCompressionLevel.Best);

        //循环遍历文档中的页面
        for (int i = 0; i < doc.getPages().getCount(); i++) {

            //获取特定页面
            PdfPageBase page = doc.getPages().get(i);

            //获取每个页面的图像信息集合
            PdfImageInfo[] images = page.getImagesInfo();

            //遍历集合中的项目
            if (images != null && images.length > 0)
                for (int j = 0; j < images.length; j++) {

                    //获取指定图像
                    PdfImageInfo image = images[j];
                    PdfBitmap bp = new PdfBitmap(image.getImage());

                    //设置压缩质量
                    bp.setQuality(20);

                    //用压缩后的图片替换原始图片
                    page.replaceImage(j, bp);
                }

            //保存文件
            doc.saveToFile("压缩PDF文档.pdf");
            doc.close();
        }
    }
}

效果对比图

压缩 PDF 文档中的高分辨率图像

本方法仅对文档中的高分辨率图像进行无损压缩,而低分辨率的图像将不再被压缩。

  • 创建 PdfDocument 类的对象。
  • 使用 PdfDocument.loadFromFile() 方法加载 PDF 文档。
  • 使用 PdfDocument.getFileInfo().setIncrementalUpdate() 方法将 IncrementalUpdate 设置为 false。
  •  声明一个 PdfPageBase 变量。
  • 循环遍历页面并使用 PdfDocument.getPages().get() 方法获取特定页面。
  • 循环遍历页面中的图像。并使用 page.tryCompressImage(info.Index) 方法压缩高分辨率图像。
  • 使用 PdfDocument.saveToFile() 方法将文档保存到另一个 PDF 文件。

完整代码

import com.spire.pdf.PdfDocument;
import com.spire.pdf.PdfPageBase;
import com.spire.pdf.exporting.PdfImageInfo;
 
public class CompressPDFImage {
    public static void main(String[] args) {
 
        //创建 PdfDocument 类的对象
        PdfDocument doc = new PdfDocument
 
        //加载 PDF 文档
        doc.loadFromFile("示例文档.pdf");
 
        //将IncrementalUpdate设置为false
        doc.getFileInfo().setIncrementalUpdate(false);
 
        //声明一个 PdfPageBase 变量
        PdfPageBase page;
 
        //循环遍历页面
        for (int i = 0; i < doc.getPages().getCount(); i++) {
 
            //获取指定页面
            page = doc.getPages().get(i);
            if (page != null) {
 
                if(page.getImagesInfo() != null){
 
                    //循环遍历页面中的图像
                    for (PdfImageInfo info: page.getImagesInfo()) {
 
                        //使用tryCompressImage方法压缩高分辨率图像
                        page.tryCompressImage(info.getIndex());
                    }
                }
            }
        }
 
        //保存文件
        doc.saveToFile("输出结果.pdf");
    }
}

效果对比图

到此这篇关于详解如何通过Java实现压缩PDF文档的文章就介绍到这了,更多相关Java压缩PDF内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Idea如何集成Git&添加项目到git仓库

    Idea如何集成Git&添加项目到git仓库

    这篇文章主要介绍了Idea如何集成Git&添加项目到git仓库,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-12-12
  • Spring Security OAuth2 授权码模式的实现

    Spring Security OAuth2 授权码模式的实现

    这篇文章主要介绍了Spring Security OAuth2 授权码模式的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-08-08
  • Java中类的定义与实例化详解

    Java中类的定义与实例化详解

    这篇文章主要给大家介绍了关于Java中类的定义与实例化的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用Java具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-11-11
  • JAVA实现的CrazyArcade泡泡堂游戏

    JAVA实现的CrazyArcade泡泡堂游戏

    CrazyArcade泡泡堂游戏,一款用Java编写的JavaSwing游戏程序。 使用了MVC模式,分离了模型、视图和控制器,使得项目结构清晰易于扩展,使用配置文件来设置游戏基本配置,扩展地图人物道具等。同时,该程序编写期间用了单例模式、工厂模式、模板模式等设计模式。
    2021-04-04
  • ehcache开源缓存框架_动力节点Java学院整理

    ehcache开源缓存框架_动力节点Java学院整理

    Ehcache是现在最流行的纯Java开源缓存框架,这篇文章主要介绍了ehcache框架的相关资料,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-07-07
  • Java中自定义异常详解及实例代码

    Java中自定义异常详解及实例代码

    这篇文章主要介绍了Java中自定义异常详解及实例代码的相关资料,需要的朋友可以参考下
    2017-03-03
  • 解决mybatisPlus 中的field-strategy配置失效问题

    解决mybatisPlus 中的field-strategy配置失效问题

    这篇文章主要介绍了解决mybatisPlus 中的field-strategy配置失效问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-02-02
  • JVM,JRE和JDK的区别小结

    JVM,JRE和JDK的区别小结

    在Java环境配置和项目启动中,JVM,JRE和JDK这三者的配置是项目启动的基础保证,本文就详细的介绍一下这三者的区别,具有一定的参考价值,感兴趣的可以了解一下
    2023-09-09
  • Java使用easypoi快速导入导出的实现

    Java使用easypoi快速导入导出的实现

    这篇文章主要介绍了实现Java使用easypoi快速导入导出的实现,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-03-03
  • Java中堆和栈的区别详解

    Java中堆和栈的区别详解

    这篇文章主要介绍了Java中堆和栈的区别详解,所有的Java程序都运行在JVM虚拟机内部,我们这里介绍的自然是JVM(虚拟)内存中的堆和栈,需要的朋友可以参考下
    2015-01-01

最新评论