.NET使用C#实现将Word文档转换为HTML格式

 更新时间:2025年01月19日 09:12:29   作者:Eiceblue  
这篇文章主要为大家详细介绍了如何在.NET平台使用C#将Word文档转换为HTML文件,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下

将Word文档转换为HTML格式尤其具有显著的优势,它不仅能够确保文档内容在多种设备和平台上保持一致灵活的显示,还便于通过网络进行传播和集成到各种Web应用中。随着越来越多的企业和开发者寻求更灵活、更具兼容性的文件处理方式,.NET框架下的C#语言凭借其强大的互操作性支持成为了实现这一转换的理想选择。本文将介绍如何在.NET平台使用C#将Word文档转换为HTML文件。

本文所使用的方法需要用到免费的Free Spire.Doc for .NET,NuGet:PM> Install-Package FreeSpire.Doc

用C#将Word文档转换为一般HTML格式

我们可以使用Document.LoadFromFile方法载入Word文档,然后直接使用SaveToFile(string:fileName, FileFormat.HTML)方法将其转换为HTML格式并保存。这样转换出的结果会包含HTML文件、CSS文件以及图片文件夹(如果Word文档中有图片)。以下是操作步骤示例:

导入所需模块。

创建Document实例。

使用Document.LoadFromFile()方法载入Word文档。

使用Document.SaveToFile(string:fileName, FileFormat.HTML)方法将其转换为HTML格式并保存。

代码示例

using Spire.Doc;

namespace WordToHTML
{
    class Program
    {
        static void Main(string[] args)
        {
            // 创建Document实例
            using (Document doc = new Document())
            {

                // 载入Word文档
                doc.LoadFromFile("Sample.docx");

                // 将其转换为HTML并保存
                doc.SaveToFile("output/WordToHTML.html", FileFormat.Html);
            }
        }
    }
}

结果

用C#将Word文档转换为单个HTML文件

通过配置Document.HtmlExportOptions.CssStyleSheetType属性和Document.HtmlExportOptions.ImageEmbedded属性,我们可以设置将CSS和图像嵌入到单个HTML文件中。以下是操作步骤示例:

  • 导入所需模块。
  • 创建Document实例。
  • 使用Document.LoadFromFile()方法载入Word文档。
  • 将Document.HtmlExportOptions.CssStyleSheetType属性设置为CssStyleSheetType.Internal,嵌入CSS样式到生成的HTML文件中。
  • 将Document.HtmlExportOptions.ImageEmbedded属性设置为true,嵌入图像到生成的HTML文件中。
  • 使用Document.SaveToFile(string:fileName, FileFormat.HTML)方法将其转换为HTML格式并保存。

代码示例

using Spire.Doc;

namespace WordToHTML
{
    class Program
    {
        static void Main(string[] args)
        {
            // 创建Document实例
            using (Document doc = new Document())
            {

                // 载入Word文档
                doc.LoadFromFile("Sample.docx");

                // 设置嵌入CSS
                doc.HtmlExportOptions.CssStyleSheetType = CssStyleSheetType.Internal;

                // 设置嵌入图像
                doc.HtmlExportOptions.ImageEmbedded = true;

                // 将其转换为HTML并保存
                doc.SaveToFile("output/WordToHTMLEmbedded.html", FileFormat.Html);
            }
        }
    }
}

结果

转换时自定义转换选项

我们还可以通过Document.HtmlExportOptions属性自定义其他转换选项,以下是支持的选项信息:

属性描述
CssStyleSheetType指定 HTML CSS 样式表的类型(外部或内部)
CssStyleSheetFileName指定 HTML CSS 样式表文件的名称
ImageEmbedded指定是否使用数据 URI 方案将图像嵌入到 HTML 代码中
ImagesPath指定导出 HTML 中图像的文件夹路径
UseSaveFileRelativePath指定图像文件路径是否相对于 HTML 文件路径
HasHeadersFooters指定是否应在导出的 HTML 中包含页眉和页脚
IsTextInputFormFieldAsText指定是否将文本输入表单字段以文本形式导出到 HTML 中
IsExportDocumentStyles指定是否将文档样式导出到 HTML 的 <head> 部分

以下是操作步骤示例:

  • 导入所需模块。
  • 创建Document实例。
  • 使用Document.LoadFromFile()方法载入Word文档。
  • 使用Document..HtmlExportOptions中的属性自定义转换选项。
  • 使用Document.SaveToFile(string:fileName, FileFormat.HTML)方法将其转换为HTML格式并保存。

代码示例

using Spire.Doc;

namespace WordToHTML
{
    class Program
    {
        static void Main(string[] args)
        {
            // 创建Document实例
            using (Document doc = new Document())
            {

                // 载入Word文档
                doc.LoadFromFile("Sample.docx");

                // 设置CSS文件名
                doc.HtmlExportOptions.CssStyleSheetType = CssStyleSheetType.External;
                doc.HtmlExportOptions.CssStyleSheetFileName = "CustomCSSFileName.css";

                // 设置不嵌入图像,并设置图像文件夹
                doc.HtmlExportOptions.ImageEmbedded = false;
                doc.HtmlExportOptions.UseSaveFileRelativePath = true;
                doc.HtmlExportOptions.ImagesPath = "Images/";

                // 设置导出文档样式到head部分
                doc.HtmlExportOptions.IsExportDocumentStyles = true;

                // 将其转换为HTML并保存
                doc.SaveToFile("output/WordToHTMLEmbedded.html", FileFormat.Html);
            }
        }
    }
}

结果

文中用到的示例Word文档:

本文演示了如何在.NET中用C#转换Word文档为HTML格式,并设置转换选项。

以上就是.NET使用C#实现将Word文档转换为HTML格式的详细内容,更多关于C# Word转HTML的资料请关注脚本之家其它相关文章!

相关文章

  • 使用winapi安装Windows服务示例程序

    使用winapi安装Windows服务示例程序

    这篇文章主要介绍了使用winapi安装Windows服务示例,大家参考使用吧
    2014-01-01
  • C#实现汽车租赁系统项目

    C#实现汽车租赁系统项目

    这篇文章主要为大家详细介绍了C#实现汽车租赁系统项目,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-01-01
  • C#如何添加PPT背景

    C#如何添加PPT背景

    这篇文章主要为大家详细介绍了C#如何添加PPT背景,添加纯色背景、渐变色背景、图片背景等,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-07-07
  • C#使用dir命令实现文件搜索功能示例

    C#使用dir命令实现文件搜索功能示例

    这篇文章主要介绍了C#使用dir命令实现文件搜索功能,结合具体实例形式分析了C#调用与使用cmd命令相关操作技巧,需要的朋友可以参考下
    2017-07-07
  • C#防止序列化文件丢失和损坏的解决方案

    C#防止序列化文件丢失和损坏的解决方案

    本文介绍了如何在C#中防止序列化文件丢失和损坏,核心思路包括自动备份、多位置存储、原子写入、哈希校验、版本兼容、异常容错和加密压缩,作者提供了完整的解决方案和代码示例,并详细解释了如何在工业场景中应用这些策略,以及避免常见问题的方法,需要的朋友可以参考下
    2026-02-02
  • c#递归遍历文件夹示例

    c#递归遍历文件夹示例

    这篇文章主要介绍了c#递归遍历文件夹示例,需要的朋友可以参考下
    2014-03-03
  • C#实现货币金额数字转大写汉字

    C#实现货币金额数字转大写汉字

    这篇文章主要为大家详细介绍了如何使用C#实现货币金额数字转大写汉字功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
    2024-01-01
  • .NET实现定时发送邮件代码(两种方式)

    .NET实现定时发送邮件代码(两种方式)

    经常发邮件的朋友都知道,邮箱有个特殊功能,可以设定邮件发送时间,定时发送,这个功能是怎么实现的呢?接下来,小编给大家分享.NET实现定时发送邮件的代码,有需要的朋友可以参考下
    2015-08-08
  • 基于WPF实现蒙板控件的示例代码

    基于WPF实现蒙板控件的示例代码

    这篇文章主要为大家详细介绍了WPF实现蒙板控件,文中的示例代码讲解详细,对我们学习或工作有一定帮助,感兴趣的小伙伴可以了解一下
    2023-03-03
  • 为何Linq的Distinct实在是不给力

    为何Linq的Distinct实在是不给力

    本篇文章对Linq的Distinct进行了详细的分析介绍,需要的朋友参考下
    2013-05-05

最新评论