C#代码实现读取并导出PDF书签

 更新时间:2026年04月16日 11:47:27   作者:LAYONTHEGROUND  
PDF 书签(大纲)是文档导航的核心要素,本文将介绍如何使用 Free Spire.PDF for .NET 库,通过 C# 代码完整读取 PDF 文件中的所有书签,感兴趣的小伙伴可以了解下

PDF 书签(大纲)是文档导航的核心要素,尤其对于长文档或技术手册,提取书签信息可用于生成目录、索引或进行文档结构分析。本文将介绍如何使用 Free Spire.PDF for .NET 库,通过 C# 代码完整读取 PDF 文件中的所有书签(包括多级嵌套书签),并将标题、显示样式等信息导出到文本文件。

1. 环境准备

1.1 安装免费库

在 Visual Studio 中通过 NuGet 包管理器安装 Free Spire.PDF

Install-Package FreeSpire.PDF

该免费版本支持读取 PDF 书签等基础操作,无需额外授权文件,但有单文件10页的页数限制。

1.2 引用命名空间

代码中需要引入以下命名空间:

using System;
using System.IO;
using System.Text;
using Spire.Pdf;
using Spire.Pdf.Bookmarks;

2. 核心实现逻辑

整体流程分为四步:

  1. 加载目标 PDF 文档。
  2. 获取文档的 PdfBookmarkCollection 书签集合。
  3. 递归遍历每个书签及其子书签,提取标题和显示样式。
  4. 将提取的内容写入文本文件。

2.1 加载文档并获取书签集合

PdfDocument pdf = new PdfDocument();
pdf.LoadFromFile(@"D:\test.pdf");
PdfBookmarkCollection bookmarks = pdf.Bookmarks;

Bookmarks 属性返回一个集合,包含顶层书签。如果文档没有书签,Count 为 0。

2.2 递归遍历书签树

书签结构是典型的树形结构:每个书签节点可能拥有子书签集合(通过 Count 属性和索引器访问)。我们设计两个方法:

  • GetBookmarks:处理顶层书签,创建 StringBuilder 并启动递归。
  • GetChildBookmark:递归处理子书签。
public static void GetBookmarks(PdfBookmarkCollection bookmarks, string result)
{
    StringBuilder content = new StringBuilder();
    if (bookmarks.Count > 0)
    {
        content.AppendLine("Pdf bookmarks:");
        foreach (PdfBookmark parentBookmark in bookmarks)
        {
            // 获取标题
            content.AppendLine(parentBookmark.Title);
            // 获取显示样式(如普通、粗体、斜体等)
            content.AppendLine(parentBookmark.DisplayStyle.ToString());
            // 递归处理子书签
            GetChildBookmark(parentBookmark, content);
        }
    }
    File.WriteAllText(result, content.ToString());
}

递归方法:

public static void GetChildBookmark(PdfBookmark parentBookmark, StringBuilder content)
{
    if (parentBookmark.Count > 0)
    {
        foreach (PdfBookmark childBookmark in parentBookmark)
        {
            content.AppendLine(childBookmark.Title);
            content.AppendLine(childBookmark.DisplayStyle.ToString());
            GetChildBookmark(childBookmark, content);
        }
    }
}

2.3 完整代码示例

以下是一个控制台应用程序的完整实现,将书签信息输出到 GetPdfBookmarks.txt 文件。

using System;
using System.IO;
using System.Text;
using Spire.Pdf;
using Spire.Pdf.Bookmarks;

namespace GetBookmark
{
    internal class Program
    {
        static void Main(string[] args)
        {
            PdfDocument pdf = new PdfDocument();
            pdf.LoadFromFile(@"D:\testp\test.pdf");

            PdfBookmarkCollection bookmarks = pdf.Bookmarks;
            string result = "GetPdfBookmarks.txt";
            GetBookmarks(bookmarks, result);

            Console.WriteLine("书签提取完成,结果已保存至:" + result);
        }

        public static void GetBookmarks(PdfBookmarkCollection bookmarks, string result)
        {
            StringBuilder content = new StringBuilder();
            if (bookmarks.Count > 0)
            {
                content.AppendLine("Pdf bookmarks:");
                foreach (PdfBookmark parentBookmark in bookmarks)
                {
                    content.AppendLine(parentBookmark.Title);
                    content.AppendLine(parentBookmark.DisplayStyle.ToString());
                    GetChildBookmark(parentBookmark, content);
                }
            }
            else
            {
                content.AppendLine("该 PDF 文档不包含任何书签。");
            }
            File.WriteAllText(result, content.ToString());
        }

        public static void GetChildBookmark(PdfBookmark parentBookmark, StringBuilder content)
        {
            if (parentBookmark.Count > 0)
            {
                foreach (PdfBookmark childBookmark in parentBookmark)
                {
                    content.AppendLine(childBookmark.Title);
                    content.AppendLine(childBookmark.DisplayStyle.ToString());
                    GetChildBookmark(childBookmark, content);
                }
            }
        }
    }
}

3. 输出格式说明

生成的文本文件每两行代表一个书签:第一行是标题,第二行是显示样式。例如:

Pdf bookmarks:
第1章 简介
Regular
1.1 背景
Bold
1.2 目标
Italic
第2章 实现
Regular
2.1 环境搭建
Regular

DisplayStyle 是一个枚举,可能的值包括:

  • Regular:普通文本
  • Bold:粗体
  • Italic:斜体

根据 PDF 文件的实际书签样式,输出结果会相应变化。

4. 注意事项与扩展

4.1 书签可能为空

若 PDF 没有书签,bookmarks.Count 为 0,代码会写入提示信息,避免空文件。

4.2 目标页码与动作的获取

上述示例仅获取了标题和样式。如果需要获取书签跳转的目标页码,可以使用 PdfBookmark.Action 属性(需判断动作类型)。例如:

if (parentBookmark.Action is PdfGoToAction goToAction)
{
    int pageIndex = pdf.Pages.IndexOf(goToAction.Destination.Page);
    content.AppendLine($"跳转至第 {pageIndex + 1} 页");
}

由于 Free Spire.PDF 对 Action 的支持较为完整,可根据实际需求扩展。

4.3 性能考虑

对于包含数千个书签的 PDF,递归遍历不会有明显性能问题。但若需频繁提取,可考虑将 StringBuilder 替换为 StreamWriter 流式写入,降低内存占用。

4.4 编码处理

File.WriteAllText 默认使用 UTF-8 编码,如需指定编码(如 GB2312),可改用 StreamWriter

5. 总结

本文演示了如何利用免费 .NET 库完整提取 PDF 文档的多级书签信息。关键技术点包括:

  • 通过 PdfDocument.Bookmarks 获取根书签集合。
  • 递归遍历 PdfBookmark 节点的 Count 和索引器。
  • 读取 TitleDisplayStyle 属性。
  • 将结构化数据写入文本文件。

这种方法不依赖 Adobe Acrobat 或其他 GUI 工具,非常适合集成到后台服务或文档处理管道中。开发者可以根据上述模式进一步扩展,获取书签的页码、缩放方式甚至修改书签结构。

到此这篇关于C#代码实现读取并导出PDF书签 的文章就介绍到这了,更多相关C#读取并导出PDF书签 内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • C#简单聊天室雏形

    C#简单聊天室雏形

    这篇文章主要为大家详细介绍了C#简单聊天室雏形,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-02-02
  • C# IFF图形结构解析代码

    C# IFF图形结构解析代码

    这个结构有点像RIFF文件。。是分段的。但要注意ANNO这个描述字段 必须是使用2个字节 否则ACDSEE无法识别。
    2010-03-03
  • C#之set与get方法的用法案例

    C#之set与get方法的用法案例

    这篇文章主要介绍了C#之set与get方法的用法案例,本篇文章通过简要的案例,讲解了该项技术的了解与使用,以下就是详细内容,需要的朋友可以参考下
    2021-08-08
  • C#使用ffmpeg实现将图片保存为mp4视频

    C#使用ffmpeg实现将图片保存为mp4视频

    FFmpeg是一个开源的跨平台多媒体处理工具,它提供了强大的功能,包括频和视频编码、解码、转码等,本文我们将使用FFmpeg实现将图片保存为mp4视频,感兴趣的可以了解下
    2024-11-11
  • C#如何对多线程、多任务管理(demo)

    C#如何对多线程、多任务管理(demo)

    这篇文章主要通过一个小demo介绍了C#如何对多线程、多任务管理,需要的朋友可以参考下
    2015-07-07
  • C# Redis学习系列(一)Redis下载安装使用

    C# Redis学习系列(一)Redis下载安装使用

    这篇文章主要为大家分享了C# Redis学习系列教程第一篇, Redis下载、安装、使用,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-05-05
  • unity 文件流读取图片与www读取图片的区别介绍

    unity 文件流读取图片与www读取图片的区别介绍

    这篇文章主要介绍了unity 文件流读取图片与www读取图片的对比分析,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-04-04
  • C# 使用PictureBox实现图片按钮控件的示例步骤

    C# 使用PictureBox实现图片按钮控件的示例步骤

    这篇文章主要介绍了C# 使用PictureBox实现图片按钮控件的示例步骤,帮助大家更好的理解和使用c#,感兴趣的朋友可以了解下
    2021-02-02
  • 详解C#枚举中使用Flags特性

    详解C#枚举中使用Flags特性

    这篇文章主要介绍了C#枚举中使用Flags特性的方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-03-03
  • c# 关闭窗体时提示的小例子

    c# 关闭窗体时提示的小例子

    这篇文章介绍了c#中关闭窗体时提示的小例子代码,有需要的朋友可以参考一下
    2013-07-07

最新评论