使用C#实现读取PDF中所有文本内容

 更新时间:2024年02月02日 11:08:37   作者:搬砖的诗人Z  
这篇文章主要为大家详细介绍了如何使用C#实现读取PDF中所有文本内容,文中的示例代码简洁易懂,具有一定的学习价值,有需要的小伙伴可以了解下

先安装如下包

实现代码

using iTextSharp.text.pdf;
using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Text;

namespace ReadPdfText
{
    class Program
    {
        static void Main(string[] args)
        {
            string path = "0017_审判流程管理信息表2.pdf";
            var text = ReadPFD2(path);
            Console.WriteLine(text);
            Console.ReadKey();
        }

        public static string OnCreated(string filepath)
        {
            try
            {
                string pdffilename = filepath;
                PdfReader pdfReader = new PdfReader(pdffilename);
                int numberOfPages = pdfReader.NumberOfPages;
                string text = string.Empty;

                for (int i = 1; i <= numberOfPages; ++i)
                {
                    iTextSharp.text.pdf.parser.ITextExtractionStrategy strategy = new iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy();
                    text += iTextSharp.text.pdf.parser.PdfTextExtractor.GetTextFromPage(pdfReader, i, strategy);
                }
                pdfReader.Close();

                return text;
            }
            catch (Exception ex)
            {
                throw ex;
                //StreamWriter wlog = File.AppendText(System.AppDomain.CurrentDomain.SetupInformation.ApplicationBase + "\\mylog.log");
                //wlog.WriteLine("出错文件:" + ex.FullPath + "原因:" + ex.ToString());
                //wlog.Flush();
                //wlog.Close(); return null;
            }
        }

        public static string ReadPFD2(string path)
        {
            // string path = path;// @"D:\ydfile\d4bab8ff-26ff-4ddf-a602-872f6988db86_.pdf";
            string text = string.Empty;
            try
            {
                string pdffilename = path;
                StringBuilder buffer = new StringBuilder();
                //Create a pdf document.
                using (Spire.Pdf.PdfDocument doc = new Spire.Pdf.PdfDocument())
                {
                    // Load the PDF Document
                    doc.LoadFromFile(pdffilename);
                    // String for hold the extracted text

                    foreach (Spire.Pdf.PdfPageBase page in doc.Pages)
                    {
                        buffer.Append(page.ExtractText());
                    }
                    doc.Close();
                }
                //save text
                text = buffer.ToString();
                return text;
            }
            catch (Exception ex)
            {
                //DHC.EAS.Common.LogInfo.Debug("读取PDF文件返回=" + text);
                //DHC.EAS.Common.LogInfo.Debug("读取PDF文件错误", ex);
                return null;
            }
        }
    }
}

到此这篇关于使用C#实现读取PDF中所有文本内容的文章就介绍到这了,更多相关C#读取PDF内容内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • C#身份证号码验证是否正确

    C#身份证号码验证是否正确

    这一篇关于C#语言验证18位身份证号码的验证方法和实例代码,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2015-09-09
  • C#实现格式化SQL语句的示例代码

    C#实现格式化SQL语句的示例代码

    这篇文章主要为大家详细介绍了C#如何实现格式化SQL语句的功能,文中的示例代码简洁易懂,具有一定的借鉴价值,感兴趣的小伙伴可以跟随小编一起学习一下
    2023-08-08
  • Unity幸运转盘实战项目

    Unity幸运转盘实战项目

    这篇文章主要为大家详细介绍了Unity幸运转盘实战项目,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-04-04
  • 解析XPath语法之在C#中使用XPath的示例详解

    解析XPath语法之在C#中使用XPath的示例详解

    本篇文章是对在C#中使用XPath的示例进行了详细的分析介绍,需要的朋友参考下
    2013-05-05
  • C#生成word记录实例解析

    C#生成word记录实例解析

    这篇文章主要介绍了C#生成word记录实例解析,很实用的功能,需要的朋友可以参考下
    2014-08-08
  • C#中is,as,using关键字的使用说明

    C#中is,as,using关键字的使用说明

    这篇文章主要介绍了C#中is,as,using关键字的使用说明,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-12-12
  • C#中DataGridView操作技巧

    C#中DataGridView操作技巧

    这篇文章主要介绍了C#中DataGridView操作技巧,包括了DataGridView的初始化、添加行、添加列、排序等操作技巧,非常具有实用价值,需要的朋友可以参考下
    2014-12-12
  • 深入c# 类和结构的区别总结详解

    深入c# 类和结构的区别总结详解

    本篇文章是对c#中类和结构的区别进行了详细的分析介绍,需要的朋友参考下
    2013-05-05
  • C#中SQL Command的基本用法

    C#中SQL Command的基本用法

    今天小编就为大家分享一篇关于C#中SQL Command的基本用法,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2018-10-10
  • C#实现Redis的分布式锁

    C#实现Redis的分布式锁

    我们在开发很多业务场景会使用到锁,例如库存控制,抽奖等。分布式与单机情况下最大的不同在于其不是多线程而是多进程。本文就来介绍一下,感兴趣的可以了解一下
    2021-08-08

最新评论