C#使用Spire.PDF for .NET提取PDF文本的具体教程

 更新时间:2025年09月01日 10:14:46   作者:用户835629078051  
在日常开发中,经常会遇到从 PDF 文件中提取文本的需求,Spire.PDF for .NET 提供了简单高效的 API,可以在 C# 项目中直接读取 PDF 文本,无需安装 Adobe Acrobat,所以本文给大家介绍了C#使用Spire.PDF for .NET提取PDF文本的具体教程,需要的朋友可以参考下

在日常开发中,经常会遇到从 PDF 文件中提取文本的需求,例如:

  • 从合同或发票中获取关键信息;
  • 将报告或数据表内容导入数据库;
  • 实现全文检索功能。

Spire.PDF for .NET 提供了简单高效的 API,可以在 C# 项目中直接读取 PDF 文本,无需安装 Adobe Acrobat。

步骤 1:引入 Spire.PDF for .NET

如果使用 NuGet,可以在项目中安装:

Install-Package Spire.PDF

或者在 Visual Studio 中通过 NuGet 管理器搜索 Spire.PDF 并安装。

步骤 2:加载 PDF 并提取文本

以下示例展示了如何读取 PDF 文件的全部文本:

using Spire.Pdf;
using System;

class Program
{
    static void Main()
    {
        // 创建 PdfDocument 对象
        PdfDocument pdf = new PdfDocument();

        // 加载 PDF 文件
        pdf.LoadFromFile("Sample.pdf");

        // 遍历所有页面提取文本
        for (int i = 0; i < pdf.Pages.Count; i++)
        {
            string text = pdf.Pages[i].ExtractText();
            Console.WriteLine($"--- 第 {i + 1} 页内容 ---");
            Console.WriteLine(text);
        }
    }
}

运行后,控制台会输出 PDF 中每一页的文本内容。

步骤 3:提取指定页或区域文本(可选)

如果只想提取某一页或某个区域的文本,可以使用如下方法:

using Spire.Pdf;
using Spire.Pdf.General.Find;

class Program
{
    static void Main()
    {
        PdfDocument pdf = new PdfDocument();
        pdf.LoadFromFile("Sample.pdf");

        // 提取第一页文本
        string firstPageText = pdf.Pages[0].ExtractText();
        Console.WriteLine("第一页内容:");
        Console.WriteLine(firstPageText);

        // 按矩形区域提取文本
        var rect = new System.Drawing.RectangleF(0, 0, 300, 500);
        string areaText = pdf.Pages[0].ExtractText(rect);
        Console.WriteLine("指定区域文本:");
        Console.WriteLine(areaText);
    }
}

这样可以更精准地获取页面上特定位置的文本内容,例如表格或标题。

总结

本文介绍了如何在 C# 项目中使用 Spire.PDF for .NET 提取 PDF 文本,包括:

  1. 加载 PDF 文件 并访问页面;
  2. 遍历页面提取文本
  3. 按页或区域提取文本,满足定制化需求。

通过这些方法,开发者可以快速实现 PDF 文本解析和数据提取功能,用于报表处理、数据分析或全文检索场景。

到此这篇关于C#使用Spire.PDF for .NET提取PDF文本的具体教程的文章就介绍到这了,更多相关C#提取PDF文本内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • C#泛型实例详解

    C#泛型实例详解

    这篇文章主要介绍了C#泛型,对于C#初学者来说是有必要牢固掌握的内容,需要的朋友可以参考下
    2014-08-08
  • 使用C#编写一个Web服务器

    使用C#编写一个Web服务器

    在.NET世界中,C#是一种功能强大的编程语言,常被用于构建各种类型的应用程序,本文主要为大家介绍了如何使用C#编写一个简单的Web服务器,需要的可以参考下
    2024-03-03
  • C#实现俄罗斯方块

    C#实现俄罗斯方块

    这篇文章主要为大家详细介绍了C#实现俄罗斯方块小游戏,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2020-11-11
  • WPF中窗体最大化问题的解决方法

    WPF中窗体最大化问题的解决方法

    这篇文章主要给大家介绍了关于WPF中窗体最大化问题的解决方法,文中通过示例代码介绍的非常详细,对大家学习或者使用wpf具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2018-10-10
  • 如何使用C#获取windows系统资源使用情况

    如何使用C#获取windows系统资源使用情况

    这篇文章主要为大家详细介绍了如何使用C#语言获取windows系统资源使用情况,文中的示例代码讲解详细, 感兴趣的小伙伴可以跟随小编一起学习一下
    2025-07-07
  • C#实现简单文本编辑器

    C#实现简单文本编辑器

    这篇文章主要为大家详细介绍了C#实现简单文本编辑器,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-04-04
  • 算法练习之从String.indexOf的模拟实现开始

    算法练习之从String.indexOf的模拟实现开始

    这篇文章主要介绍了算法练习从String.indexOf的模拟实现开始,需要的朋友可以参考下
    2014-12-12
  • C#实现字体旋转的方法

    C#实现字体旋转的方法

    这篇文章主要介绍了C#实现字体旋转的方法,涉及C#通过Matrix实现字体旋转效果的方法,需要的朋友可以参考下
    2015-06-06
  • C#实现winform中RichTextBox在指定光标位置插入图片的方法

    C#实现winform中RichTextBox在指定光标位置插入图片的方法

    这篇文章主要介绍了C#实现winform中RichTextBox在指定光标位置插入图片的方法,涉及RichTextBox控件及剪切板的相关操作技巧,非常简单实用,需要的朋友可以参考下
    2016-06-06
  • C#实现UI控件输出日志的方法详解

    C#实现UI控件输出日志的方法详解

    一般情况下,我们的日志文件是用来记录一些关键操作或者异常,并且是后台存储,并不对外开放的,但是也有些时候,需要将一些操作步骤、记录等直接显示在窗体上。本文就将利用UI控件输出日志效果,需要的可以参考一下
    2022-10-10

最新评论