C#提取PPT文本和图片的实现方法

 更新时间:2017年11月02日 14:45:23   作者:E-iceblue  
这篇文章主要为大家详细介绍了C#提取PPT文本和图片的实现方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

在图文混排的文档中,我们可以根据需要将文档中的文字信息或者图片提取出来,通过C#代码可以提取Word和PDF文件中的文本和图片,那么同样的,我们也可以提取PPT幻灯片当中的文本和图片。本篇文档将讲述如何使用C#来实现提取PPT文本和图片的操作。首先也是需要安装组件Spire.Presentation,然后添加引用dll文件到项目中。下面是主要的代码步骤。

原文档:

1. 提取文本

步骤一:创建一个Presentation实例并加载文档

Presentation presentation = new Presentation(@"C:\Users\Administrator\Desktop\sample.pptx", FileFormat.Pptx2010);

步骤二:创建一个StringBuilder对象

StringBuilder sb = new StringBuilder(); 

步骤三:遍历幻灯片及幻灯片中的图形,提取文本内容

 foreach (ISlide slide in presentation.Slides)
  {
  foreach (IShape shape in slide.Shapes)
  {
   if (shape is IAutoShape)
   {
   foreach (TextParagraph tp in (shape as IAutoShape).TextFrame.Paragraphs)
   {
    sb.Append(tp.Text + Environment.NewLine);
   }
   }
  }
  }

步骤四:写入Txt文档

 File.WriteAllText("target.txt", sb.ToString());
 Process.Start("target.txt");

2. 提取图片

 这里提取图片有两种情况,一种是提取整个文档中的所有图片,另外一种是只提取文档中某一特定幻灯片中的图片。

2.1提取所有图片

步骤一:初始化一个Presentation类实例,并加载文档

Presentation ppt = new Presentation();
 ppt.LoadFromFile(@"C:\Users\Administrator\Desktop\sample.pptx");

步骤二:遍历文档中图片,提取图片并保存

 for (int i = 0; i < ppt.Images.Count; i++)
 {
 Image image = ppt.Images[i].Image;
 image.Save(string.Format(@"..\..\Images{0}.png", i));
 }

提取的图片已保存到项目文件夹下

2.2.提取特定幻灯片中的图片

步骤一:创建一个Presentation类实例,并加载文档

Presentation PPT = new Presentation();
PPT.LoadFromFile(@"C:\Users\Administrator\Desktop\sample.pptx");

步骤二:获取第三张幻灯片,提取并保存图片

int i = 0;
foreach (IShape s in PPT.Slides[2].Shapes)
{
 if (s is SlidePicture)
 {
 SlidePicture ps = s as SlidePicture;
 ps.PictureFill.Picture.EmbedImage.Image.Save(string.Format("{0}.png", i));
 i++;
 }
 if (s is PictureShape)
 {
 PictureShape ps = s as PictureShape;
 ps.EmbedImage.Image.Save(string.Format("{0}.png", i));
 i++;
 }
}

提取的第三张幻灯片中的图片已保存至指定位置

上文演示了如何提取文本和图片,步骤比较简单实用,希望对你有所帮助,感谢阅读!

相关文章

  • Unity实现鼠标点2D转3D进行旋转

    Unity实现鼠标点2D转3D进行旋转

    这篇文章主要为大家详细介绍了Unity实现鼠标点2D转3D进行旋转,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2020-04-04
  • C# 基础入门--关键字

    C# 基础入门--关键字

    本文主要介绍了C# 基础知识--关键字的相关知识,具有很好的参考价值,下面跟着小编一起来看下吧
    2017-03-03
  • 基于C#实现屏幕取色器的示例详解

    基于C#实现屏幕取色器的示例详解

    这篇文章主要为大家详细介绍了如何利用C#实现屏幕取色器,文中的示例代码讲解详细,对我们学习C#有一定的帮助,感兴趣的小伙伴可以了解一下
    2022-12-12
  • C#保存listbox中数据到文本文件的方法

    C#保存listbox中数据到文本文件的方法

    这篇文章主要介绍了C#保存listbox中数据到文本文件的方法,涉及C#操作listbox数据的相关技巧,需要的朋友可以参考下
    2015-04-04
  • C# String Replace高效的实例方法

    C# String Replace高效的实例方法

    C# String Replace高效的实例方法,需要的朋友可以参考一下
    2013-05-05
  • C#中命名参数和可选参数

    C#中命名参数和可选参数

    这篇文章介绍了C#中的命名参数和可选参数,文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-04-04
  • C#调用WinRar执行rar、zip压缩的方法

    C#调用WinRar执行rar、zip压缩的方法

    这篇文章主要介绍了C#调用WinRar执行rar、zip压缩的方法,涉及C#针对winrar的判断与调用技巧,需要的朋友可以参考下
    2015-05-05
  • C#使用远程服务调用框架Apache Thrift

    C#使用远程服务调用框架Apache Thrift

    这篇文章介绍了C#使用远程服务调用框架Apache Thrift的方法,文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-06-06
  • 重写、隐藏基类(new, override)的方法

    重写、隐藏基类(new, override)的方法

    重写、隐藏基类(new, override)的方法,需要的朋友可以参考一下
    2013-03-03
  • C#获取HTML文本的第一张图片与截取内容摘要示例代码

    C#获取HTML文本的第一张图片与截取内容摘要示例代码

    在日常web开发的时候,经常会遇到需要获取保存的HTML文本中的第一张图片,并且截取内容摘要的效果,例如织梦的后台添加完详细内容后就是自动读取内容摘要,并保存第一张图片为缩略图,那么这篇文章跟大家分享下利用C#如何实现,感兴趣的朋友们下面来一起看看吧。
    2016-10-10

最新评论