详解C#如何提取PDF文档中的图片

 更新时间:2025年04月03日 15:54:28   作者:Eiceblue  
提取图片可以将这些图像资源进行单独保存,方便后续在不同的项目中使用,下面我们就来看看如何使用C#通过代码从PDF文档中提取图片吧

当 PDF 文件中包含有价值的图片,如艺术画作、设计素材、报告图表等,提取图片可以将这些图像资源进行单独保存,方便后续在不同的项目中使用,避免每次都要从 PDF 中查找。本文将介绍如何使用C#通过代码从PDF文档中提取图片,包含以下两个示例:

提取PDF图片需要用到 Spire.PDF for .NET 库。可以通过此链接下载产品包后手动添加引用,或者直接通过NuGet安装。

C# 提取指定 PDF 页面中的图片

PdfImageHelper 类可用于帮助用户管理 PDF 文档中的图像,要从某个指定的PDF页面中提取图片,参考以下步骤:

使用 PdfDocument 类的 LoadFromFile() 方法加载 PDF 文件。

通过 PdfDocument 类的 Pages[index] 属性获取指定页面。

创建 PdfImageHelper 对象,然后使用其 GetImagesInfo() 方法获取页面中图像信息集合。

遍历图像信息集合,并使用 PdfImageInfo.Image.Save() 方法将每一张图片以PNG格式储存到指定文件路径。

C# 代码:

using Spire.Pdf;
using Spire.Pdf.Utilities;
using System.Drawing;

namespace ExtractImagesFromSpecificPage
{
    class Program
    {
        static void Main(string[] args)
        {
            // 加载PDF文档
            PdfDocument pdf = new PdfDocument();
            pdf.LoadFromFile("E:\\PythonPDF\\AI.pdf");

            // 获取第一页
            PdfPageBase page = pdf.Pages[0];

            // 创建PdfImageHelper对象
            PdfImageHelper imageHelper = new PdfImageHelper();

            // 获取页面上的图片信息 
            PdfImageInfo[] imageInfos = imageHelper.GetImagesInfo(page);

            // 遍历图片信息
            for (int i = 0; i < imageInfos.Length; i++)
            {
                // 获取某个指定图片信息
                PdfImageInfo imageInfo = imageInfos[i];

                // 获取指定图片
                Image image = imageInfo.Image;

                // 将图片保存为png格式
                image.Save("图片\\图-" + i + ".png");
            }

            pdf.Dispose();
        }
    }
}

C# 提取PDF 文档中所有图片

要获取整个PDF文档中的图片,就需要遍历每一页然后再提取,具体参考以下步骤:

  • 使用 PdfDocument 类的 LoadFromFile() 方法加载 PDF 文件。
  • 创建 PdfImageHelper 对象。
  • 遍历文档中的每一个页面。
  • 通过 PdfDocument 类的 Pages[index] 属性获取指定页面。
  • 使用 PdfImageHelper.GetImagesInfo() 方法获取页面中图像信息集合。
  • 遍历图像信息集合,并使用 **PdfImageInfo.Image.Save()**方法将每一张图片以PNG格式储存到指定文件路径。

C# 代码:

using Spire.Pdf;
using Spire.Pdf.Utilities;
using System.Drawing;

namespace ExtractAllImages
    {
        class Program
        {
            static void Main(string[] args)
            {
                // 加载PDF文档
                PdfDocument pdf = new PdfDocument();
                pdf.LoadFromFile("E:\\PythonPDF\\AI.pdf");

                // 创建PdfImageHelper对象
                PdfImageHelper imageHelper = new PdfImageHelper();

                int m = 0;
                // 遍历PDF页面
                for (int i = 0; i < pdf.Pages.Count; i++)
                {
                    // 获取指定页面
                    PdfPageBase page = pdf.Pages[i];

                    // 获取页面上的图片信息 
                    PdfImageInfo[] imageInfos = imageHelper.GetImagesInfo(page);

                    // 遍历图片信息
                    for (int j = 0; j < imageInfos.Length; j++)
                    {
                        // 获取某个指定图片信息
                        PdfImageInfo imageInfo = imageInfos[j];

                        // 获取指定图片
                        Image image = imageInfo.Image;

                        // 将图片保存为png格式
                        image.Save("PDF图片\\图-" + m + ".png");
                        m++;
                    }

                }

                pdf.Dispose();
            }
        }
    }

到此这篇关于详解C#如何提取PDF文档中的图片的文章就介绍到这了,更多相关C#提取PDF图片内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • C#获取文件、文件夹和驱动器的信息示例详解

    C#获取文件、文件夹和驱动器的信息示例详解

    在C#中,文件、文件夹和驱动器是文件系统操作的基本元素,了解如何获取这些元素的信息对于开发文件处理和管理工具至关重要,本文将详细介绍如何在C#中获取有关文件、文件夹和驱动器的信息,并提供相应的示例,需要的朋友可以参考下
    2024-08-08
  • C#调用HTTP POST请求上传图片的示例代码

    C#调用HTTP POST请求上传图片的示例代码

    现在很多B/S系统的开发都是通过API方式来进行的,一般服务端会开放一个API接口,客户端调用API接口来实现图片或文件上传的功能,感兴趣的可以了解一下
    2021-05-05
  • 一文看懂C#中List的扩容机制

    一文看懂C#中List的扩容机制

    这篇文章主要介绍了C#中的扩容机制,文中以实例代码辅助,帮助大家更好的工作和学习,感兴趣的小伙伴不妨了解下
    2020-05-05
  • 轻松学习C#的读写操作

    轻松学习C#的读写操作

    轻松学习C#的读写操作,小编也是第一次接触C#的读写操作,感兴趣的小伙伴们可以参考一下,大家一起学习
    2015-11-11
  • C#中数组初始化与数组元素复制的方法

    C#中数组初始化与数组元素复制的方法

    这篇文章主要介绍了C#中数组初始化与数组元素复制的方法,涉及C#中数组的创建、初始化及使用Array.Copy方法复制数组元素的技巧,需要的朋友可以参考下
    2015-04-04
  • C# 通过 oledb 操作Excel实例代码

    C# 通过 oledb 操作Excel实例代码

    本篇文章主要介绍了C# 通过 oledb 操作Excel实例代码,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-06-06
  • C#实现移除字符串末尾指定字符的方法

    C#实现移除字符串末尾指定字符的方法

    这篇文章主要介绍了C#实现移除字符串末尾指定字符的方法,十分常见且重要的一个应用技巧,需要的朋友可以参考下
    2014-08-08
  • C# 键盘Enter键取代Tab键实现代码

    C# 键盘Enter键取代Tab键实现代码

    这篇文章主要介绍了C# 键盘Enter键取代Tab键实现代码,有需要的朋友可以参考一下
    2013-11-11
  • C#和Java有什么区别和联系

    C#和Java有什么区别和联系

    这篇文章主要介绍了C#和Java有什么区别和联系的相关资料,本文介绍的非常详细,涉及到rsa语法,c#和java互转方面的知识点,非常不错,具有参考借鉴价值,需要的朋友可以参考下
    2016-07-07
  • C#如何获取枚举的描述属性详解

    C#如何获取枚举的描述属性详解

    这篇文章主要给大家介绍了关于C#如何获取枚举的描述属性的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-02-02

最新评论